代码改变世界

5.线性回归算法

2020-04-22 21:14  广商吴彦祖  阅读(270)  评论(0编辑  收藏  举报

1.本节重点知识点用自己的话总结出来,可以配上图片,以及说明该知识点的重要性

机器学习可以理解成是生产算法的算法。需要人来先做特征提取,然后在把特征向量化后交给机器去训练。
传统机器学习分为 监督学习 和 无监督学习。

回归和分类的区别不在于连续与否而在于损失函数的形式不同

回归用于预测输入变量和输出变量之间的关系,特别是当输入变量的值发生变化时,输出变量的值随之发生的变化。

线性回归的表示是一个方程,它描述了一条线,通过寻找输入变量系数(B)的特定权重,拟合输入变量(x)和输出变量(y)之间的关系。

 

似然函数:预测值成为真实值的可能性,越大越好

 

 

 

 

 

 

2.思考线性回归算法可以用来做什么?(大家尽量不要写重复)

对大量的观测数据进行处理,从而得到比较符合事物内部规律的数学表达式。也就是说寻找到数据与数据之间的规律所在,从而就可以模拟出结果,也就是对结果进行预测,就是通过已知的数据得到未知的结果,例如对房价的预测、判断信用评价、电影票房预估等。举个具体的例子,就是在某网页内容推荐中根据用户的浏览偏好进行内容排序对提高用户的点击率具有至关重要的作用。推荐流中内容随着时间变化呈现出流动性,分析历史数据中用户和推荐内容的点击信息进行回归分析,提取用户在内容点击时特征的相关性,并对特征进行归一化,拟合出在当前特征分布下的点击率,以线性回归作为拟合模型进行用户点击率预测。

3.自主编写线性回归算法 ,数据可以自己造,或者从网上获取。(加分题)