LR-demo

from __future__ import print_function

# 导入相关python库

import os

import numpy as np

import pandas as pd

#设定随机数种子

np.random.seed(36)

#使用matplotlib库画图

import matplotlib

import seaborn

import matplotlib.pyplot as plot

from sklearn import datasets

#读取数据

housing = pd.read_csv('kc_train.csv')

target=pd.read_csv('kc_train2.csv') #销售价格

t=pd.read_csv('kc_test.csv') #测试数据

#数据预处理

housing.info() #查看是否有缺失值

#特征缩放

from sklearn.preprocessing import MinMaxScaler

minmax_scaler=MinMaxScaler()

minmax_scaler.fit(housing) #进行内部拟合，内部参数会发生变化

scaler_housing=minmax_scaler.transform(housing)

scaler_housing=pd.DataFrame(scaler_housing,columns=housing.columns)

mm=MinMaxScaler()

mm.fit(t)

scaler_t=mm.transform(t)

scaler_t=pd.DataFrame(scaler_t,columns=t.columns)

#选择基于梯度下降的线性回归模型

from sklearn.linear_model import LinearRegression

LR_reg=LinearRegression()

#进行拟合

LR_reg.fit(scaler_housing,target)

#使用均方误差用于评价模型好坏

from sklearn.metrics import mean_squared_error

preds=LR_reg.predict(scaler_housing) #输入数据进行预测得到结果

mse=mean_squared_error(preds,target) #使用均方误差来评价模型好坏，可以输出mse进行查看评价值

#绘图进行比较

plot.figure(figsize=(10,7)) #画布大小

num=100

x=np.arange(1,num+1) #取100个点进行比较

plot.plot(x,target[:num],label='target') #目标取值

plot.plot(x,preds[:num],label='preds') #预测取值

plot.legend(loc='upper right') #线条显示位置

plot.show()

#输出测试数据

result=LR_reg.predict(scaler_t)

df_result=pd.DataFrame(result)

df_result.to_csv("result.csv")

# 兼容 pythone2,3

posted on 2020-07-30 15:51 滚雪球效应阅读(162) 评论(0) 编辑收藏举报