使用时间序列数据预测《Apex英雄》的玩家活跃数据

在处理单变量时间序列数据时,我们预测的一个最主要的方面是所有之前的数据都对未来的值有一定的影响。这使得常规的机器学习方法(如训练/分割数据和交叉验证)变得棘手。

在本文中我们使用《Apex英雄》中数据分析的玩家活动时间模式,并预测其增长或下降。我们的数据来自https://steamdb.info,这是一个CSV文件。

为了评估模型的性能,我们将使用均方根误差(RMSE)和平均绝对误差(MAE)作为指标来评估我们的回归模型。RMSE将给我们一个数据差值的标准偏差,也就是数据点离最佳拟合线的距离。而MAE度量是指观测值与真实值之间的差值,这将有助于确定模型的准确性。

EDA

拿到数据后,肯定第一个操作就是进行EDA。在处理时间序列数据时,数据探索性分析的主要目的是发现以下这些特征:

  • 季节性 Seasonality
  • 趋势 Trend
  • 平稳性 Stationary

除此之外,我们还可以计算出各种平均值:

  • 简单的移动平均线
  • 指数移动平均值

自2019年2月《Apex英雄》首次发布以来的统计汇总,玩家的数量表明,Apex英雄平均约为179,000个玩家

这图为简单移动平均趋势线

这图为指数移动平均线。

简单的移动平均线表明6月份玩家活动有轻微的下降趋势。趋势线的斜率为11,考虑到玩家在100k到300k之间波动,在统计上并不显著。因此可以说玩家在6月份的活动相当稳定。

 完整文章:
posted @   deephub  阅读(77)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 全程不用写代码,我用AI程序员写了一个飞机大战
· DeepSeek 开源周回顾「GitHub 热点速览」
· 记一次.NET内存居高不下排查解决与启示
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· .NET10 - 预览版1新功能体验(一)
点击右上角即可分享
微信分享提示