你對統計有興趣嗎?您是否經常尋找球隊的預期進球數或前鋒的射門位置指標?如果你這樣做,這裡有一個問題;你相信它們是準確的嗎?如果是這樣,為什麼?
經常聽到一位前職業專家對最新的統計測量概念大笑,就好像它與藜麥、玫瑰酒和Twitter 這個詞一樣,都是自由主義個人電腦陰謀的一部分,目的是削弱他們,但這是一個龐大的行業。
雖然很少有人提及,但我們中的許多人都喜歡統計數據,這不僅適用於足球,也適用於其他各行各業。我喜歡知道奧薩蘇納本賽季贏得的空中球數(28.2)比歐洲前五名聯賽中的任何其他球隊都多,但傳球成功率最低(68.7),或者那不勒斯場均射門次數最多( 17.6),埃爾切則最多最少(6.3),儘管我很喜歡知道 Ten Years After 在 Billboard 200 上排名最高的專輯是他們 1970 年發行的《Cricklewood Green》,最高排名為第 14 位。它本身並沒有讓我更喜歡足球或音樂,但這並不重要。這些知識本身就夠有趣。
統計數據給我一種溫暖而模糊的感覺,我並不羞於這麼說。當然,我完全不知道這些數字(來自 WhoScored.com,註明「資料來源 - Opta Sports、eNetPulse 和 Getty Images」)是否正確,而且我無法檢查。當我發現它們時我就接受它們,但我並沒有在它們的準確性上投入任何東西。但很多人都這樣做。
該行業將統計數據作為深刻的內部情報出售,其重要性往往似乎被誇大了。足球不只是數據,數據也不比足球更重要,但你會認為它們擁有解開宇宙最偉大奧秘的鑰匙。
他們所有人都興奮地承諾了無與倫比的見解。
統計執行網站表示:“我們屢獲殊榮的人工智慧團隊將 40 多年來的全球體育報道與機器學習技術相結合,為球迷提供有意義的體驗,從而最大限度地發揮其價值。”
「機器學習技術」聽起來就像他們建造了一個巨大的希思羅賓遜裝置,你在一端插入一個足球,另一端就會輸出科爾切斯特聯隊對陣曼斯菲爾德隊的預測,而且它實際上不僅僅是一台計算機和軟體。
好吧,這一切都是帕特里奇式的企業廢話,但這反映出他們對自己所做的事情有多麼認真,以及統計數據對於足球界(從賭博到電視,再到球員招募)的嚴肅性。
人們和專家經常試圖挖掘他們自己的海量光之山足球統計數據,將其置於他們的專家皇冠上,以證明他們對這項運動的洞察力。如今看來這是必須的。在這個時代,對於一些粉絲來說,不僅要保持正確,而且要在社群媒體上被認為是正確的,這一點也很重要,這並不奇怪。對於某些統計數據=智力。但正如我們的總理每天向我們展示的那樣,教育並不等於智力或理解力。
值得注意的是,考慮到該行業的價值和規模,沒有獨立的組織來評估和判斷出售給我們的統計數據的準確性。 Opta 的網站(其母公司是 Stats Perform)稱其涵蓋了 1,000 多個聯賽和比賽以及超過 200,000 場比賽。不管怎麼想,這一定是個巨大的行動。 20 萬場比賽的每項統計數據肯定不可能 100% 準確,而且沒有任何跡象表明存在任何誤差幅度。對於任何可能的不準確之處,我們都不會做出讓步。我們接受所有統計數據作為真理。我從來沒有質疑過任何統計數據,你呢?也許我們應該。
我們無法質疑他們的真實性,所以我們必須繼續信任。正如您可以想像的那樣,信任是該領域大多數公司經常使用的詞。犯錯並不符合任何人的利益,但無論監管多麼嚴格,任何系統都很容易犯錯並且有缺陷。有些組織會比其他組織更好。
數據公司都表示,他們有自己的內部檢查程序,以確保他們銷售的數據是正確的。當其他資訊可用時,他們會在比賽結束後返回並調整它們。但我們知道內部監理方法有一個先天的弱點;他們是內部的。因此,他們可能會受到各種關係、就業和商業壓力。
因此,沒有一個獨立的統計局機構來監督準確性、標準和程序,也許也就不足為奇了。應該對持續的不準確行為和所有人都簽署的行業標準進行處罰。
在社會的其他地方,人們普遍認為,任何主要行業都應該有一個機構,其目的是定義、監督和維護標準,以幫助保護客戶和工人的利益。這個生意不只是一點樂趣。對於那些使用這些數字的人來說,很多錢都依賴這樣的分析。從媒體到俱樂部再到經紀人,每個人都希望獲得更多數據來追求成功,因此數據的準確性和完整性至關重要。僅僅因為該公司說它是準確的,並不意味著我們應該相信他們的話,我們當然需要第三方確認。
瀏覽各種網站,我注意到數據公司不會相互競爭誰擁有最準確的數據,我認為這樣做會損害整個行業藝術形式的可信度,這是不可以的-一個人的優勢,即使他們基本上都賣同樣的土豆,所以為你的公司創造一個獨特的賣點一定很困難。你必須發明機器學習。
與任何貨幣一樣,足球統計行業的生存依賴於我們所有人的信任。一旦我們認為金錢是一張毫無價值的紙,它就毫無價值了。當我們認為足球統計數據不準確的時候,就是這個行業崩潰的時候。
出於某種原因,統計文化確實被拉入了反個人電腦、反知識分子、反覺醒心態的軌道,作為當今足球的另一個錯誤,儘管我懷疑這與科學本身關係不大,更多的是對那些過於嚴格地接受它作為解釋一切的方式的人的敵意。肯定存在著相互的傲慢。
對我來說,統計數據只是樂趣的一部分,無論它們是對還是錯,都沒有什麼真正的區別。但這個行業需要一個可靠的保證來證明它們是正確的,除非有一個獨立機構的任務是確定它們是正確的,否則我們如何才能真正信任它們,或者也許更相關的是,為什麼我們這麼長時間以來毫無疑問地信任它們?
約翰尼科爾森
強尼的新書我們還能恢復足球嗎? Covid-19 告訴我們關於英超聯賽的哪些事情,是他 2019/20 年度暢銷書的更新。 “這是足球界獨一無二的一年的灼熱歲月。”