5.线性回归算法
1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性
回归算法的定义:我们可以根据现有提供的数据进行运算,构建函数模型,对数据进行训练,
从而可以用构建好的模型进行预测,得出的结果可以有离散型和连续型。
回归算法的应用:房价的预测和销售额的预测
矩阵:矩阵一个按照长方阵列排列的复数或实数集合,我们可以应用矩阵进行乘法应算、
减法应算和乘法应算等等。
损失函数:通过函数模型运算得到的结果于实际结果的误差大小值,其值是非负数的。
2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)
(1)预测国家GDP;
(2)预测农产品的年产量;
(3)物理实验的结果预测。
3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
data=pd.read_excel("E:/课程文件/大三/二/机器学习算法基础/线性回归/二手房信息.xlsx") #加载文件
y3 = data['总价/万']
x3 = data['单价 元/㎡']
x1 = np.array(data.iloc[:,2:3].fillna(value=0).astype(int))
y1 = np.array(data.iloc[:,1:2].fillna(value=0).astype(int))
Xsum=0.0
X2sum=0.0
Ysum=0.0
XY=0.0
n=len(x1)
for i in range(n):
Xsum+=x1[i]
Ysum+=y1[i]
XY+=x1[i]*y1[i]
X2sum+=x1[i]**2
k=(Xsum*Ysum/n-XY)/(Xsum**2/n-X2sum)
b=(Ysum-k*Xsum)/n
print('线性回归式为:y=%f*x+%f' % (k,b) )
for x2,y2 in zip(x3,y3):
plt.scatter(x2,y2)
plt.pause(0.1)
plt.show()