通过机器学习预测足球运动员的市场价值

通过机器学习预测足球运动员的市场价值

Neymar Jr

每年夏天,足球界都会广泛流传关于转会的猜测,但这些事情往往会拖延。为什么?通常的原因是双方无法就球员的转会费达成一致,看看多特蒙德前锋桑乔就知道了。他是两个夏天的主题 他们会不会 由于无法与多特蒙德达成合适的费用,因此与曼联进行了叙述。最后,桑乔最终以超过 85,000,000 欧元(73,000,000 英镑)的价格来到曼彻斯特。这笔钱意味着双方在对玩家的估价中都有很小的误差幅度,否则他们可能会面临大量损失。

像 Ousmane Dembele 这样的失败者实际上让足球界需要一种能够准确评估球员未来市场价值的工具。他以 120,000,000 欧元的前景进入,现在作为巴塞罗那的伤疤存在,以及 80,000,000 欧元的伤疤。如果巴塞罗那有一个工具来准确评估登贝莱,他们本可以估计这名球员的价值,而不会被高估。这导致我开发了一个工具来做这件事——FTBL 预测器。

它是如何工作的?

FTBL 预测器的工作原理是获取对玩家价值有积极影响的属性(意味着它们对其价值有影响),将这些值放入线性回归算法中,根据价值绘制统计数据并查看它们的位置 应该 与价值有关。

我进行了一些探索性数据分析,以确定哪些属性对确定球员的市场价值贡献最大。经过一些测试,我想出了以下列表:

  • 总体——从 1 到 99 的球员被认为有多好
  • 潜力——玩家可以达到的最大整体
  • 年龄 - 年龄
  • League_level — 球员所在联赛的声誉,从 1 到 3
  • International_reputation — 玩家的国际声誉,从 1 到 5
  • Club_contract_until — 球员合同到期的日期
  • Release_clause_euro — 解除球员合同所需支付的金额
  • 进攻——球员的进攻能力如何
  • 防守——一名球员的防守有多好
  • 身体素质——球员身体状况如何
  • 速度——玩家的速度/敏捷程度
  • 盘带——一名球员的盘带能力如何
  • 投篮——一名球员的投篮/终结能力有多好

我清理了我的数据库并将数据输入线性回归算法。

Data cleansing

Linear regression example

预言

我首先用 Youri Tielemans 进行了测试,它返回了这个:

Youri Tielemans 的实际价值是这样的:

(57629136/57000000) x 100=市值的101.1%或1.1%的误差。这对于第一次预测来说是相当准确的,所以我也对其他玩家进行了测试,发现我得到了类似的结果,这令人放心。

然而,当我对防守球员,尤其是中后卫进行测试时,我发现他们几乎总是低于他们的实际价值,所以我建立了一个单独的模型,只适用于防守球员。这要准确得多——需要不同的模型,因为防守者往往拥有被低估的高防守数据,而低运球、投篮和速度数据来弥补高防守数据。

附加的功能

对模型感到满意后,我决定添加一些对现实生活中的球探或足球总监有用的额外功能——能够找到与搜索的球员风格相似的球员,以及在搜索球员时添加功能的能力——例如,仅返回总得分超过 80 且身体素质超过 85 的左脚球员。这在搜索球员的特定资料时很有用,就像俱乐部通常那样。相似球员功能检查球员是否有相似的属性,如果有,就会显示球员——相似度的强度可以调整,这意味着如果你只想要非常相似的球员或松散相似的球员,你可以找到所有这些。我实现了余弦相似度来帮助找到相似的玩家 打法, 但不同的是 能力 这对于球探资源有限的小型俱乐部尤其有用。

结论

总之,我对程序的结果很满意,但觉得它受到可用数据质量的轻微限制。 FIFA 数据库因不准确而臭名昭著,每年都会引发争论,所以我想用原始统计数据来试试这个。这将消除抽象层,从而消除错误,有望提高预测器的准确性。

版权声明:本文为博主原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明

本文链接:https://www.qanswer.top/40064/44303017

posted @ 2022-09-30 17:46  哈哈哈来了啊啊啊  阅读(108)  评论(0编辑  收藏  举报