歡迎光臨
每天分享高質量文章

中美體育的差距,可能就是一個數字化的NBA

導讀:雖然足球是全球第一大體育運動,但籃球,尤其是NBA,在中國和北美的成功讓人感到驚訝。所以,本文作者Young和Harry就一起研究了NBA的數字化技術,走訪了球隊的資料分析師及相關技術領域專家,為大家探究這個成功籃球賽事里的數字基因。

作者:Harry Wu,Young Lin

來源:DT資料俠(ID:DTdatahero)

美國四大職業體育聯盟之一的NBA(美職籃)是世界籃球最高殿堂。NBA總冠軍球隊的每一位球員和教練都會收到一枚總冠軍戒指,上面除了雕刻著冠軍球隊和個人的名字,還在顯眼的地方印上“World Champion”(世界冠軍),可見NBA在籃球世界的地位。

2002年隨著姚明以NBA選秀狀元的身份加入火箭隊,並打出全明星級別表現之後,NBA的熱潮順勢席卷中國乃至全亞洲,截至當下,NBA已經成為中國體育迷們最喜愛的賽事,沒有之一。

01 NBA的數字基因

美國有著全球最好的數字化技術與應用場景,這使得NBA自2009年之後通過註入資料DNA,成為了全球最智慧、科技感最強的運動體育賽事,併在商業領域獲得巨大的成功。

在開啟探究NBA數字化成功之道前,我們先來瞭解一下NBA的數字基因。

馬克·庫班和達里爾·莫雷可謂是NBA“數字基因編輯”的代表人物。


被譽為“NBA最瘋狂的球隊老闆”的庫班,年輕時候曾在達拉斯最早的軟體零售商擔任銷售員。推銷軟體前,他自然要瞭解軟體,並執念於新技術能創造更大價值。

日後,通過創立與出售MicroSolutions計算機咨詢公司、BROADCAST體育視頻網站等,庫班賺取了自己的人生財富。2000年,他買下達拉斯小牛隊(現改名獨行俠),雖從一名科技企業家變身體育產業大老闆,但庫班的信條始終是“相信科技”。

小牛隊可能是聯盟最早讓球員穿戴智慧設備與使用AI、資料分析協助球隊經營與提高球場成績的隊伍,庫班(註:其與邁克爾·喬丹一起投資了瑞士運動資料公司Sportradar)十分相信人工智慧,他說:“我們做生意的方式,我們的生活方式,所有的一切都被網絡改變,但與人工智慧相比,這些都相形見絀。”

NBA的數字化除了有相信科技的人,還要有懂大資料的。休斯頓火箭隊總經理達里爾·莫雷就是這樣一位“資料門徒”。

莫雷(註:目前還擔任體育資料公司Stats的顧問)曾經是一位計算機科學家,在獲得MIT的MBA學位之後,他在芝加哥創辦了一家專門為各種職業球隊提供運營資料分析的體育信息咨詢公司。


加盟火箭之初,他基於資料分析的魔球理論(Money Ball)重建球隊,通過資料收集與分析進行合同風險管理與薪資控制,在選賢方面,一些二輪新秀被他點石成金。莫雷曾如此定義贏得一場比賽:第一要量化每一回合得多少分,第二要瞭解如何去爭取到更多的回合數,這就要靠資料分析。

早在NBA三分狂潮掀起之前,莫雷團隊就通過分析球場上個點位投籃的得分效率資料,得到一個答案——三分球的有效性比長兩分更好。

▲計算機視覺技術識別球場上球員移動位置、軌跡和籃球運動軌跡,並推算進球的可能性,來源:The Economist

相比於90年代NBA盛行的長兩分球,三分球的得分效率與威懾力都更強。2012年平均每場比賽投出18.4次三分,相較2017年的27次提高了50%,一個三分球射手有65%的概率改變比賽走勢。所以,NBA教練們在近年來開始大量使用三分射手。

▲十年間NBA的三分球投射比率從22.3%上升至33.7%

以休斯頓火箭(最早使用智慧攝像頭、可穿戴硬體和使用資料分析的球隊之一)為首的一批頂尖強隊掀起了三分狂潮,直至今天,利用三分球作為主要進攻武器的球隊,都在這幾年的NBA賽場上勝多負少。

資料分析的核心在於海量資料。在美國五大聯賽中,NBA的資料點排名第三(註:NHL場上選手和比賽時間都長於NBA,MLB賽程和比賽方式更有利於產生更大資料量)。2009年起,NBA在每個球場(包括訓練場)部署6個每秒25幀拍攝速度的攝像頭以收集資料,單賽季就能產生超過1.77億張圖像,超過23億個資料點。

▲NBA的資料點;總計最小資料點=一個賽季總計比賽場次×一場比賽參與球員數量

NBA大資料的背後是什麼技術加持?資料下游是什麼樣的應用在解決具體問題?

2012年,時任NBA總裁的大衛-斯特恩在介紹NBA的數字化運營時說:


統計學與數字化革命將改變NBA商業樣式,“SportVU”智慧攝像頭系統跟蹤每一個球員和球的運動,收集海量球場資料,教練可以在自己的平板電腦上獲得各類資料統計及分析結果。這些資料勢必影響比賽與執教。

▲SportVU系統對於場上球員移動軌跡的監測

早在2009年,SportVU系統就被部署到部分NBA球隊。這是一套球員追蹤與分析的監控系統,也是NBA數字化革命的起點。這套價格不貴、效果奇佳(據傳一套大約10萬多美金)的設備在球場上部署六個運動捕捉攝像頭,它們會以每秒25幀的速度捕捉球員的空間坐標。

與此同時,為每個坐標點加上時間戳和球員ID,將這些資料捕捉到服務器端之後,資料收集的工作就已經基本完成了。

02 當“數字化革命”發生

2005年,以色列導彈追蹤以及光學領域的頂尖科學家米基·塔米爾發明瞭SportVU系統,最初用於軍事領域,但在金融危機期間,運動資料公司STATS收購了SportVU,於是這套系統很快被應用到了籃球場上。

如今每隻NBA球隊都配備幾名資料分析師,他們將諸如SportVU這類的智慧設備收集來的資料結合傳統統計資料,進行交叉分析,一方面監測球員疲勞度及積極性等狀態,以幫助分配最合適的球員上場競技,另一方面,根據場上的進攻與防守資料協助教練員制定戰術,以及選擇簽約合適的球員。

2013年,來自哈佛大學兩位博士瑟沃尼和艾利克斯建立了一個測量NBA球員表現價值的指標——預球權分(Expected Possession Value,預期球權得分機制)

該模型源自於競爭風險模型(註:處理多種終點事件和競爭風險事件存在的生存資料的分析方法),簡單地說就是研究“一名球員是否被低估了其在球場上價值”的一套指標(不同於得分、籃板、助攻及命中率等傳統衡量球員的資料)

▲倫納德在三分線外持球,如果投籃EPV為0.68分,如果傳給鄧肯,EPV為0.8分,傳給帕克為0.94分,傳給博納為0.94分,傳給格林為1.08分

有了模型,只差資料。SportVU向瑟沃尼和艾利克斯提供了“大資料”,這些用於跑模型的資料就包括了2012-2013賽季中14個球館的8億個球員位置坐標,光這個專案的資料集就達到93GB。

為了處理“大資料”,瑟沃尼和艾利克斯啟用了哈佛大學的超級計算機(計算機集群)——奧德賽,通過500臺電腦並行處理器和2TB記憶體的算力完成了分析。而這套指標正在輔助教練員更好地評估每一位球員的真實價值。

做好了資料收集與融合,擁有一套智慧分析系統就顯得更加重要了。NBA一度又引入了德國軟體巨頭SAP的SAP HANA系統。

智慧設備收集來的戰術、空間位置、球員健康等資料實時傳送到SAP HANA系統上,並將資料保持在最細的顆粒度,不進行任何預先的聚合,通過自動分析,每秒併發處理250個複雜查詢,在不同資料顆粒度層次都能滿足資料分析的訴求,最大限度的方便了球隊分析師、第三方機構,乃至於球迷的資料分析以及可視化需求。

03 數字化驅動的新商業


NBA的數字化戰略不止於此。互聯網科技公司常常利用駭客松(Hackathon)的方式(註:針對黑客設計的馬拉松,主辦單位會將一批計算機極客聚集起來,在極短的時間內讓極客們針對特定的議題進行頭腦風暴並提供解決方案),來刺激用戶間的合作與公司外部的創新,體育界的領頭羊NBA從2016年開始,也決定要利用群眾的力量與智慧,來找尋運營和商業中的隱藏機會。

▲NBA官網通知,2018年9月22日NBA新澤西辦公室舉行駭客松

NBA從2016年開始對外舉辦NBA駭客松,目前僅限於北美地區。經過海選的50只隊伍,被分配到兩種題目的分析組——籃球分析組與商業分析組。

籃球分析組隊的問題主要是和球隊教練和球隊經理相關的,例如“如何利用NBA採集到的多樣空間資料,來改變比賽規則,增加比賽的精彩程度”;又或是“預測未來十年的投籃趨勢,分析現在這種從後衛到中鋒都學習勇士庫里飄射三分的狂潮,到底能持續多久。”

而商業分析則更靠近球隊的商業考量,例如如何量化球隊的“娛樂價值”,或是如何利用現有的CRM(客戶關係管理)資料來挖掘更多的商業價值。

2017年籃球分析組的冠軍根據資料分析的結果,針對未來投籃趨勢提出的建議:一旦比賽中中距離投籃的進球數量超過16個,就可以將中距離的得分從兩分提高到三分,以增加比賽的精采程度。而商業分析組的冠軍,則創建了一個時間序列為主的互動工具,能夠預測未來NBA任意一場比賽的娛樂價值。

如此經營駭客松,無論對於球迷或是NBA而言,都是個雙贏的局面。

對參賽者而言,因為賽題圍繞資料與分析應用展開,參賽者的資料分析能力必不可少,而這些資料是NBA最真實的運營資料,作為球迷的分析師,除了在比賽中可以和球員面對面討論題目,晚上熬夜時吃著球星送來的外賣以外,在探索資料的價值中,還能更瞭解所關心的主隊和球員,甚至是左右未來聯盟的規則發展。這簡直是球迷的天堂(註:第一名的獎勵是和NBA總裁共進午餐、球賽門票和一大堆的周邊產品)

而對於聯盟或球隊而言,這些活動既可以創造更強的粉絲粘性,又可以收集好的分析與應用思維和解決方案,進而改進聯盟與球隊的經營效果,何樂而不為?

▲NBA駭客松上,NBA球星肖恩·巴蒂爾與極客們的交流互動,來源:網絡

除了NBA聯盟希望利用大資料挖掘更多價值外,30只球隊也積累了很大的資料能量。以華盛頓奇才隊為例,先從公開資料來看看他們的表現:這隻位於美國首府華盛頓特區的球隊,價值1.3億美金,主要來自於體育事業的貢獻(占比約40%),前年(2017)的球隊收入成長了43%,一口氣來到了兩億多美金。

有趣的是,球隊門票銷售在過去五年持續成長的原因,主要是成功的營銷,一部分上升來自於2013-2014年開始增加的AdWords廣告花費(註:該季AdWords花費上升將近300%,並從Adwords獲取的新客上升了72%),另一部分則來自於過去五年不斷上升的票價(註:2019年票價的增長率大約是10%,依照44種不同的座位分割槽有不同的調整)

▲奇才隊的歷史戰績與攻防評分資料,來源:Tableau public

而從球隊表現來看,ORtg (Offensitve Rating, 進攻評分)與DRtg (Defensive Rating,防守評分)顯示,奇才隊從2003由Eddie Jordan執教後,利用出色的進攻打出一波1970年代後期之後未曾看見的佳績。雖然之後陷入低谷,但新教練的到來促使球隊風格逐漸由進攻轉為防守,併在最近的賽季表現都不錯,過去五個賽季中有三次進入分割槽半決賽。

以上成績都與奇才隊的精益資料分析不無關係。

04 AI驅動的NBA

無論是大資料還是其他黑科技,整個NBA擁抱技術的態度都非常積極。各只球隊為了提高球隊表現與商業化,大量引進與使用人工智慧。

目前NBA的官方資料技術合作方除了STATS公司外,還包括運動科技公司Second Spectrum。Second Spectrum公司創立於加州的洛杉磯,創始人是來自南加州大學(USC)的兩位教授,他們希望利用機器學習演算法真正地讓機器看懂籃球,然後產出有建設性意見的洞察結果。

Second Spectrum通過一種叫作“時空樣式識別”的演算法,識別球員在球場上執行教練的戰術特征,該系統能認知出擋拆、雙檔掩護等籃球場上的技戰術。起初,Second Spectrum的系統學習了20種左右籃球戰術,現在已經能學會並記住500種戰術,這讓預測球場上“因為實施某種技戰術而產生固定的結果”變成了可能。

▲Second Spectrum對場上球員與球的軌跡監測,來源:TED

另外,通過計算機視覺技術,結合持球球員及其他資料(進攻動作、防守者位置、球員歷史定點命中率等資料),建模預判一個球員在特定區域的投籃命中率,一旦球不能被投進,還可預判籃板球的落點,以及誰將搶到籃板球。

▲Second Spectrum監測持球球員與無球球員移動,以計算不同點位的命中率

除了硅谷,來自澳大利亞的Catapult科技公司正在通過自己的智慧硬體設備改變球場上的戰術實施,Catapult的可穿戴設備記錄球員的移動、速度、身體狀況等資料,幫助教練員更好地分配場上球員,部署戰術。

類似Cataplut的公司還有不少,並且都在為NBA球隊帶來科技紅利。目前冠軍之師金州勇士隊除了利用SportVu的智慧攝像頭監測球員場上狀況,球隊還讓球員穿戴一款高科技“智慧服裝”,監測球員實時運動狀態、呼吸和肌肉活動等信息,避免過度訓練造成疲勞並幫助減少運動損傷。

NBA醫務總監John DiFiori博士說,從智慧可穿戴設備上獲取的資料不但可以協助維持球員健康,還能通過更多細節資料,結合球隊擁有的醫療設備,幫助球員更好的預防傷病,並從傷病中更好、更快地恢復。

NBA的教練們也在受到大資料等新興信息技術的影響。人工智慧能夠在接觸、識別、反饋資料模型的過程中完成自我學習。


香港理工大學OpenCog AI實驗室首席研究員Ben Goertzel認為,如果AI系統學習大量的NBA比賽視頻,它就會聰明到能夠理解比賽中發生的各種事件,如此,人工智慧就能夠做出更好的籃球戰術安排,比如選擇最合適的首發陣容。Goertzel預言,NBA球隊主教練的大部分工作,未來都可以由AI來完成。

自2016年,來自瑞士的Sportradar公司就開始為美國市場之外的國家提供NBA的實時資料和高標準的視聽服務。


NBA還將Sportradar納入其資料綜合業務中,從2018年開始, Sportradar就開始為NBA、WNBA和NBA發展聯盟提供統計信息,並將資料完整地輸送美國的球迷、球隊、媒體和其他80個國際和地區的球迷及用戶,而這些資料中包含了Second Spectrum檢測的球場上球員的運營軌跡資料(包括速度、運動距離、禁區停留市場和防守反擊等資料)

基於這些大資料,薩克拉門托國王隊開發了一款類似iPhone Siri的APP——國王的人工智慧(KAI),它能與球隊粉絲互動,根據不同的提問,將資料與信息通過文字與語音回覆給粉絲。

國王隊基於大資料開發的機器人KAI

在一次體育產業峰會上,美國體育媒體EPSN分析總監Benjamin Alamar總結了十年間NBA的數字化變遷,他表示,十年前,一個賽季每場比賽詳細報道(Play by Play)的資料可以打包成6兆的資料包,現在,一場比賽詳細報道資料就達到16兆,現在一場比賽的資料是十年前連續三個賽季的資料之和。

大資料與AI技術在NBA的使用案例遠遠不止機器學習、亦或是基於捲積神經網絡的計算機視覺技術,包括貝葉斯網絡、知識圖譜等廣義AI技術也在被採用。

關於未來,新科技在NBA的想象空間非常大。STATS公司CEO Gary Walrath說:“未來全新的NBA術語將包括速度檔案、進攻戰術型別、防守對位和球場改寫地圖等信息。”

在NBA的身後,包括中國CBA在內的多個籃球聯賽都在探索一條屬於自己的數字化戰略。緊隨成功部署數字化戰略的NBA,中國籃球正在籃協主席姚明的帶領下走出低谷,作為NBA數字化先驅球隊休斯頓火箭隊的前明星球員,姚明也許明白NBA的數字化革命將為中國籃球帶來什麼樣的啟示。


05 作者話癆小故事:我和老友Ben

2018年,我(Young)回到華盛頓,抽空和讀研時的老友Ben(奇才隊資料分析師)見面。

馬裡蘭大學的同學們,左一是Ben,右一是Young

Ben是猶太人,律師家庭出生的他是一位典型美國人,非常熱衷參與職業體育,除了會在比賽期間觀看球賽,他還在大學期間成為了馬裡蘭大學的籃球校隊經理,半工半讀,和球隊南征北戰。

馬大籃球隊從2014年開始加入Big 10 Conference,聯盟的14所大學集中在美國東北部,並以籃球這個運動專案著稱。

Ben在研究生(營銷分析專業)畢業後加入了華盛頓奇才隊,從事球隊資料分析、球員薪資戰略規劃等工作。

目前奇才內部的組織架構,負責分析的團隊有兩大部門,分別是球探(負責在美國各州學校發現有價值的球星)和科技/資料分析團隊。Ben剛加入球隊時,主要負責比賽影片的剪輯,提供給教練和球員,作為動作和戰術上的改進參考。有趣的是,奇才是NBA第一個開始採用VR訓練球員技術的球隊(2015年開始採用STRIVR Lab的技術),Ben的工作也就包含了剪輯與使用VR影片。

Ben在接受華盛頓郵報專訪時,讓記者使用VR來練習投籃

Ben向我進一步解釋Oculus的VR眼鏡時說到:“奇才2017年末成立的G-League(NBA發展聯盟)隊伍Capital City Go Go(很有趣的名字),將可以使用這樣的技術來訓練年輕球員。奇才隊的當家球員們比較沒有時間和機會使用這樣的技術。”(我自己感覺這VR挺雞肋的….)

Ben位於Capital One Arena的辦公室,坐落在體育館場的二樓。整個體育館從Locker Room到健身房、SPA房、練習場,都是他的游樂場。穿梭在球場與球員間的他,日常的工作,除了球員薪資戰略規劃外,還包含了球隊賽前的對手分析,和球隊每賽季的合同戰略。


他指著桌上一本厚厚的報告說:“這是2017年針對奇才在季後賽對戰凱爾特人所做的專題研究,完整分析了每個球員的表現和對戰狀況。”想想有多少從事資料分析的人,可以這樣玩資料?

球隊的經營標的之一,就是要創造更多的價值。通過各種技術:無論是Google Adwords、VR、還是大資料分析球員表現或是球員合同,都可以協助球隊在球場表現或是門票銷售上,得到顯著的提升。但運動有趣的地方就是運動充滿不確定性:預算最高的球隊也可能會輸球,沒有球星的球隊也可能逆轉比賽。

關於作者:Harry Wu,籃球球迷,自詡“非典型宇宙免檢知識混子”,喜歡在數字化峰會、券商投資策略會和高校公開課上YY人工智慧和大資料。之前寫了不少財經類文章,在各大財經網站頭條短暫飄過,怒砍百萬流量,個人觀點和內容還登上過南華早報、路透社等海外媒體。

Young Lin,籃球球迷,在某大型資料分析與咨詢公司擔任資深資料分析師,協助娛樂、高科技等客戶透過資料挖掘的方式發現並創造價值。熱愛資料和統計、營銷、科技,曾自主創業,擔任過跨國銷售、上市專案經理等職位。

閱讀更多內容請關註微信號DT資料俠(ID:DTdatahero),轉載請添加微信dtcaijing005

赞(0)

分享創造快樂