1. 时序练习(广告渠道vs销量预测)
用散点图来看下sales销量与哪一维度更相关。
和目标销量的关系的话,那么这就是多元线性回归问题了。
上面把所有的200个数据集都用来训练了,现在把数据集拆分一下,分成训练集合测试集,再进行训练。
可参考带代码中的点:
"""参考网友代码:""" # coding: utf-8 import os, sys from datetime import datetime import matplotlib.pyplot as plt import pandas as pd # 512070,易方达沪深300非银ETF基金 df = pd.read_csv('512070.csv', index_col='date') df1 = df[['jz']] print(df1.head()) # 600030,中信证券,为了与基金净值比较,收盘价/10 df = pd.read_csv('600030.csv', index_col='date')#参考点0 df2 = df[['close']].apply(lambda x:x/10)#参考点1 print(df2.head()) # pandas DataFrame 连接表 df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='inner')#参考点2 #df3 = df1.join(df2, how='inner') print(df3.head()) df3.index = pd.to_datetime(df3.index) # 每一年数据的相关性分析 print("2017Y:\n", df3[ df3.index.year==2017 ].corr()['jz'])#参考点3 print("2018Y:\n", df3[ df3.index.year==2018 ].corr()['jz']) print("2019Y:\n", df3[ df3.index.year==2019 ].corr()['jz']) print("all:\n", df3.corr()['jz'])#参考点4