1. 时序练习(广告渠道vs销量预测)

 

 

用散点图来看下sales销量与哪一维度更相关。

 

 

 

 

 

 

和目标销量的关系的话,那么这就是多元线性回归问题了。

 

 上面把所有的200个数据集都用来训练了,现在把数据集拆分一下,分成训练集合测试集,再进行训练。

 

 

 

可参考带代码中的点:

"""参考网友代码:"""
# coding: utf-8
import os, sys
from datetime import datetime
import matplotlib.pyplot as plt
import pandas as pd
 
# 512070,易方达沪深300非银ETF基金
df = pd.read_csv('512070.csv', index_col='date')
df1 = df[['jz']]
print(df1.head())
 
# 600030,中信证券,为了与基金净值比较,收盘价/10
df = pd.read_csv('600030.csv', index_col='date')#参考点0
df2 = df[['close']].apply(lambda x:x/10)#参考点1
print(df2.head())
 
# pandas DataFrame 连接表
df3 = pd.merge(df1, df2, left_index=True, right_index=True, how='inner')#参考点2
#df3 = df1.join(df2, how='inner')
print(df3.head())
 
df3.index = pd.to_datetime(df3.index)
# 每一年数据的相关性分析
print("2017Y:\n", df3[ df3.index.year==2017 ].corr()['jz'])#参考点3
print("2018Y:\n", df3[ df3.index.year==2018 ].corr()['jz'])
print("2019Y:\n", df3[ df3.index.year==2019 ].corr()['jz'])
print("all:\n", df3.corr()['jz'])#参考点4

  

posted on 2022-06-01 18:12  lmqljt  阅读(52)  评论(0编辑  收藏  举报

导航