掌握时间序列特征工程:常用特征总结与 Feature-engine 的应用

时间序列数据的特征工程是一种技术,用于从时间序列数据中提取信息或构造特征,这些特征可用于提高机器学习模型的性能。以下是一些常见的时间序列特征工程技术:

  1. 滚动统计量:计算时间窗口内的统计量,如平均值、中位数、标准偏差、最小值和最大值。这些统计量可以捕捉到时间序列在不同时间段的行为变化。
  2. 滞后特征:创建时间序列的过去值作为新的特征,以揭示序列的自相关性质。例如,可以使用前一天(滞后1)或前一周(滞后7)的数据作为预测当前值的特征。
  3. 差分和季节差分:计算时间序列的一阶差分(即当前值与前一个值的差)或季节性差分(如当前值与前一年同一天的值的差)来帮助去除趋势和季节性影响。
  4. 变换:应用变换如对数变换、平方根变换等,可以帮助稳定时间序列的方差,使其更适合某些统计模型。
  5. 时间戳信息:提取时间戳的特定部分,如小时、周天、月份等,用于捕捉周期性模式。
  6. 傅里叶变换:通过傅里叶变换将时间序列转换为频域表示,提取周期性特征。
  7. 波动性度量:对于金融时间序列,可以计算历史波动性或返回序列的标准偏差等度量。
  8. 窗口函数:使用滑动窗口操作,如滑动平均或指数平滑,以平滑时间序列并减少噪声。

本文将通过使用feature-engine来简化这些特征的提取,首先我们看看数据。

https://avoid.overfit.cn/post/db4091bc5c8d489aa6f4df807ff7894f

posted @ 2024-04-20 10:46  deephub  阅读(83)  评论(0编辑  收藏  举报