先前我們分析過為什麼要研究球隊的歷史數據,而現在我們要更進一步,把那些數據整理成一個虛擬模型,讓我們可以透過這個模型去預測球隊的表現。

這篇文章中,我們將要介紹「運動路徑模型」,這個模型讓我們得以透過傳球方向和速度來拆解比賽。因為以往我們要形容比賽、形容球隊風格或是球員是如何在球場上進攻防守都只能靠一個模糊的概述,有了運動路徑模型,我們可以從一個全新的角度去看待比賽。

什麼是運動路徑?

移動路徑藉由顯示所涉及球員的第一次觸球的位置來描述連續四名球員參與連續比賽的模式,其中一名球員可以在路徑中多次參與,而參與移動路徑的每個球員的第一次接觸稱為節點。

我們就以利茲聯隊(Leeds United)對陣富勒姆(Fulham)的比賽中,前鋒赫爾德科斯塔(Hélder Costa)的第二個進球當作例子,一起來看看這到底要怎麼做。

伊蘭梅斯利爾 (Illan Meslier) 向杰克哈里森 (Jack Harrison) 傳出一個高位球,後者將球傳給了班福德 (Bamford);班福德然後帶球,然後將球傳給科斯塔得分。可以看到圖片中,每個節點表示四個球員參與的第一次接觸的位置。

移動路徑藉由顯示所涉及球員的第一次觸球的位置來描述連續四名球員參與連續比賽的模式

一段比賽中的每個節點都還能有更多個運動路徑,我們還有一個路徑,從羅賓科赫傳給伊蘭梅斯利爾開始,在帕特里克班福德四次參與後結束。這裡的三個節點在獨特的運動路徑之間重疊。

運動路徑的重點在於我們要替這些「節點」代表的球員增加一些背景資訊,然後以球隊風格去推測各種可能性:Pierre-Emerick Aubameyang 是否卡在球場左邊或更集中的危險路徑?

我們目前有兩種類型的路徑:

非交叉/傳球路徑(Non-Cross/Passing chain):這些路徑是最常見的運動路徑,球員在節點之間傳球,這是所有人都會關心的。

交叉路徑(Cross chain):這些路徑包含序列中四名球員中第三名完成的傳球,其中第三名球員與路徑中的第四名球員交叉。在這些情況下,我們會記錄第三名球員的第一次觸球和傳中位置。

分類運動路徑

為了從這些單獨的運動路徑中提取最大價值,我們需要根據這些路徑的空間相似性將它們分類。首先,我們根據路徑的起點和終點位置拆分路徑,這樣做可以將這些路徑以數字的方式進行系統性的歸類在球場路徑上。

到這邊應該會有人發現某些區塊會明顯較少路徑經過,也因此,會建議將球場分割成多個區域,確保我們這個模型可以更準確的反映球場上的情況。

接著就是要開始對於這些路徑進行分類

分類完之後,我們就大概可以從中得知這些路徑的基本訊息,但這些路徑的運動模式各自可能有所不同,這就是接下來需要去釐清的。

為此,我們向這些區域組中的每條路徑添加了一個模式標籤,以將空間上最相似的路徑組合在一起。這些聚類標籤描述了特定開始/結束區域之間的運動形狀,並使用 K 均值聚類算法(k-means clustering),並根據我們的分析預先選擇了組數。

下圖顯示了本賽季英超聯賽中與利茲聯隊示例在同一區域開始和結束的所有連鎖路徑,這些連鎖路徑也屬於同一集群標籤。我們可以使用這些由每個節點的全局直觀表示的集群來評估團隊採用的最頻繁和最有效的比賽模式。

我們可以利用蒐集到的數據分析一場比賽

雖然每個參與的位置及其軌跡是基本的,但我們也可以藉由選定特定主題來抓取不同球員參賽的訊息。圖案為路徑條的每個點分配字母,指示球員參與的順序,並結合起來為整個運動路徑創建一個“詞”。

主題的一個例子可以是「ABCA」。這意味著路徑中的前三個參與者都是唯一的球員(球員 A、球員 B 和球員 C),但路徑中的第一個球員(球員 A)也是最後一個參與的球員。在我們的利茲聯隊範例中,涉及四名獨特的球員,因此這將被標記為主題「ABCD」。

這種背景使我們能夠看到這些路徑中的組合類型以及這些風格特徵在球員和俱樂部之間有何不同,例如:哪些球隊在該地區及其周邊地區進行一對二比賽?凱恩是否參與了他也即將結束的投籃終結路徑的建立?等等不同的情境。

限制

與任何模型一樣,了解運動路徑可以測量的內容很重要,但了解它們的限制也很關鍵:

路徑並不會告訴我們在球員接球和傳球之間會發生什麼。一名球員可能會在傳球給下一名球員之前帶球(例如我們範例中的帕特里克班福德),或者他們可能會進行第一次傳球。

路徑不包括未發生在路徑中的遊戲內訊息,像是沒有經過三次傳球的射門不會被算進這些路徑當中。而這樣的限制也是為了降低數據的複雜性,以便我們進行更準確的分析。

邊緣分析中的運動路徑

除了此處顯示的運動路徑的特徵(例如分組和限制)之外,我們還可以將其他影響(例如控球值、預期傳球和壓力)應用於每個節點,以增強我們對這些比賽模式的理解。

運動路徑的各種應用意味著我們可以單獨使用它們或在更廣泛的模型中使用它們來創建對球員和團隊風格的更複雜的理解,並將它們應用於各種領域。