1. 说明

 Prophet是FaceBook开源的时序框架。非常简单实用,你不需要理解复杂的公式,看图,调参,调用十几行代码即可完成从数据输入到分析的全部工作,可谓懒人之利器。

 在效果方面,我在同一项目中尝试了ARIMA,将星期和节假日作为特征代入GBDT,Prophet,相对来说,Prophet效果最好,当然这与数据有关,也不能一概而论。总之,Prophet效果挺好的,训练速度也挺快。

 Prophet的原理是分析各种时间序列特征:周期性、趋势性、节假日效应,以及部分异常值。在趋势方面,它支持加入变化点,实现分段线性拟合。在周期方面,它使用傅里叶级数(Fourier series)来建立周期模型(sin+cos),在节假和突发事件方面,用户可以通过表的方式指定节假日,及其前后相关的N天。可将Prophet视为一种针对时序的集成解决方案。

 使用Prophet具体使用步骤就是:根据格式要求填入训练数据,节假日数据,指定要预测的时段,然后训练即可。除了预测具体数值,Prophet还将预测结果拆分成trend, year, season, week等成份,并提供了各成份预测区间的上下边界。不仅是预测工具,也是一个很好的统计分析工具。

 当然Prophet也有它的弱项,比如可调节的参数不多,不支持与其时序特征结合等等,不过这些也可以通过预测处理和模型融合来解决。

2. 安装

 在Ubuntu系统中可通过以下命令安装prophet:

$ sudo apt-get install fbprophet

 通过以下命令下载源码(下面例程中用到了源码中的数据,请先下载源码)

$ git clone https://github.com/facebookincubator/prophet.git

3. 例程

 具体使用可参考源码的notebook目录中的例程,很多中文例程都使用了其中的quick_start.ipynb,代码在下面列出。

import pandas as pd
import numpy as np
from fbprophet import Prophet
import matplotlib.pyplot as plt

# 读取时间数据文件,文件也在源码目录中
file_path= 'examples/example_wp_peyton_manning.csv'  
df = pd.read_csv(file_path)  

# 输入节假日数据,注意lower_window, upper_window是前后影响天数
playoffs = pd.DataFrame({  
  'holiday': 'playoff',  
  'ds': pd.to_datetime(['2008-01-13', '2009-01-03', '2010-01-16',  
                        '2010-01-24', '2010-02-07', '2011-01-08',  
                        '2013-01-12', '2014-01-12', '2014-01-19',  
                        '2014-02-02', '2015-01-11', '2016-01-17',  
                        '2016-01-24', '2016-02-07']),  
  'lower_window': 0,  
  'upper_window': 1,  
})  
superbowls = pd.DataFrame({  
  'holiday': 'superbowl',  
  'ds': pd.to_datetime(['2010-02-07', '2014-02-02', '2016-02-07']),  
  'lower_window': 0,  
  'upper_window': 1,  
})  
holidays = pd.concat((playoffs, superbowls)) 

# 训练和预测
prophet = Prophet() 
df['y'] = np.log(df['y'])  
prophet.fit(df)  
future = prophet.make_future_dataframe(freq='D',periods=10)  # 测试之后十天
forecasts = prophet.predict(future)  

# 训练结果作图
prophet.plot(forecasts).show()  
prophet.plot_components(forecasts).show()  
plt.show()

趋势,周期分析图


posted on 2018-05-20 14:06  xieyan0811  阅读(110)  评论(0编辑  收藏  举报