FotMatch 深度 · 数据解读预期进球如何变成拐杖——以及足球理解它的四种典型错误xG的发明初衷是从射门质量评估中去除偏见。十年后,它被评论员引用、被转播画面展示、被球迷在争论中武器化。某个时刻起,这项指标不再描述比赛,而是开始替代它。
预期进球的设计初衷是回答一个狭窄的问题:基于历史数据,这脚射门有多好?它从来不是用来回答谁配赢、哪个球员更强、或者一个主教练是否该下课的。
xG 到底测量什么——以及不测量什么预期进球为比赛中每一脚射门赋予一个0到1之间的概率,这个概率来自一个已经用数十万次历史射门训练过的模型。输入变量因模型而异——Opta版本使用射门位置、身体部位、助攻类型和防守压力;StatsBomb额外加入门将站位、射门高度以及球与门之间的防守球员数量——但输出是一致的:一个代表历史上类似射门进球概率的小数。关键且经常被忽视的局限在于,xG是一个回顾性汇总指标。它告诉你过去一大群相似射门"应该"发生什么。它不告诉你这一脚具体发生了什么,更不告诉你为什么。一脚xG为0.75的射门意味着历史上四分之三的类似射门都进了。如果前锋射丢了,xG不解释是因为滑倒、折射、门将的超凡扑救,还是前锋技术不佳。它只是记录这脚射门是在通常能进球的条件下射出的。这个区分很重要,因为xG increasingly 被当作诊断工具——用来识别哪支球队"配"赢、或者哪个前锋在"表现不佳"。这不是它被设计来做的事。这项指标是为了改善 raw 射门数对射门质量的评估——后者在一个世纪以来一直是标准——而不是为了成为能终结运气、技术和执教能力争论的单一数字。
误用一:把 xG 当作正义记分牌最常见的扭曲发生在一场比赛之后:一支xG更低的球队赢了。一支创造0.8 xG但1-0击败创造2.4 xG对手的球队,几乎自动被描述为"幸运"或"不配赢"。言下之意是xG揭示了实际比分之下"真实"的结果,xG更高的球队某种程度上被抢劫了。这种解读忽略了足球是什么。创造了2.4 xG但没能进球的球队,按定义,没能转化机会。创造了0.8 xG但进了一球的球队,按定义,转化了机会。比赛不是应该产生不同结果的模拟;它是一项竞技,其中终结能力、压力下的决策、以及防守组织与机会创造同等,都是这项运动的一部分。xG测量的是机会质量,而非把握机会的球员质量。"配赢"框架还误读了高xG可能意味着什么。一支在深度防守 block 面前控球占优的球队,常常通过大量低质量射门——远射、拥挤的头球、压力下仓促的尝试——积累高xG。一支深度防守、通过一次精心设计的反击进球的球队,可能总xG更低,但平均每脚xG更高。汇总数字掩盖了这一点。两支总xG为1.5的球队,可能通过完全不同的战术过程到达这个数字——一个可持续,一个不可持续。
误用二:把 xG 超常发挥当作终结能力的证据当一名前锋单季15 xG却打进20球时,条件反射式的结论是他是一名精英终结者——一名能以高于历史平均水平持续转化机会的球员。有时这是真的。更多时候,这是一种会随时间自我修正的统计幻觉。问题在于样本量。一个英超赛季,首发前锋大约只有30到40脚射门。在如此小的样本中,随机波动可以产生与期望均值显著偏离的结果。一名单季比xG多进5球的前锋,基于历史英超数据,在下个赛季回归均值或低于xG的概率大约为40%。超常发挥不一定是技能;它可能只是方差。确实存在精英终结者——凯恩、哈兰德、萨拉赫——他们在多个赛季、数百脚射门中展示了持续超越xG的能力。但即使这些球员也显示出赛季间波动。凯恩在2015-16至2021-22赛季期间英超xG超越幅度约为25%,样本量足够大以暗示真正的终结技能。然而在那个时期内,单个赛季有差异:2016-17赛季超越35%,2019-20赛季仅超越8%。多赛季趋势有意义;单季偏离没有意义。把一年的超常发挥当作永久"冷静"终结能力的证据,是对统计的误用,已经导致俱乐部为随后回归均值的前锋支付了过高身价。
误用三:防守 xG 与隐形门将xG在防守表现上的应用问题更大。一些分析师用"xG被进"——一支球队的总预期失球——作为防守质量的衡量。低xG被进的球队被描述为防守稳固;高xG被进的球队被描述为防守漏洞百出。这个指标看起来客观。它不是。xG被进深受门将表现影响,而xG模型故意排除了门将。一名门将连续扑出高xG射门,会降低球队的xG被进总数——不是因为防守改善了,而是因为门将阻止了模型预测应该进的球。如果这名门将随后被出售或受伤,球队下赛季的xG被进可能飙升,而防守会被描述为"退步"了,实际上变化的变量只是门将。同样的问题反向也存在。一支xG被进低的球队,如果它的门将表现出色,不一定是好防守;它是一支被好门将保护的防守。区分两者需要"射后xG"模型——在射门发生后,基于落点和力量计算的进球概率——这允许分析师比较被给机会的质量与扑救的质量。即便如此,防守压力与射门落点之间的互动很复杂,大多数xG模型未能完全捕捉。结果是一项看起来在测量防守,实际上却测量着防守、门将和模型无法分离的随机变异的组合。
误用四:用 xG 孤立地评估主教练也许xG最具破坏性的误用是它在主教练评估中的应用。球队持续低于xG的主教练被描述为无法"教终结"或制造了"错误类型的机会"。球队持续高于xG的主教练被赞扬为战术天才,往往没有证据表明超常发挥是由战术而非个人终结技能或随机变异导致的。这里的错误是因果混淆。主教练的战术体系影响射门质量——射门的站位、射手面临的防守压力、助攻类型——这些是xG模型的合法输入。但主教练无法控制前锋是否滑倒、门将是否猜对方向、或者球是否击中门框。这些是产生xG与实际进球之间差距的变量,它们很大程度上在主教练影响范围之外。一位创造了高xG机会但看着前锋反复射丢的主教练,在xG术语中表现不佳。但表现不佳的原因可能是前锋质量、运气,或两者兼而有之——没有一个是主教练战术能力的直接反映。xG在主教练评估中的负责任使用是相对比较,而非绝对判断。应该评估的是球队xG趋势是否随时间改善,创造机会的质量是否相对于联赛平均水平在上升,以及球队xG侧写是否与其战术身份匹配。一支比上赛季更少给对手高xG机会的防守型球队,无论门将是否在扑救,防守都在进步。一支每场比赛创造更多高xG机会的进攻型球队,无论前锋是否在转化,进攻都在进步。这项指标是描述过程的工具,而非判决结果的工具。当它被当作后者使用时,它不仅是误导性的,而且对该运动对自身的理解是actively harmful的。