1 认识机器学习

机器学习：通过学习经验E（expearence），在解决任务T（task）时达到更好的效果，其效果由P（performance measure）来衡量。例如，在系统学习自动帮助用户归类垃圾邮件的过程中，观察学习用户是如何归类邮件过程是E，归类收到的邮件是任务T，正确归类的比例是度量P。

有监督学习：通过学习正确的数据（训练集），预测其他情况下的输出结果

细分为回归问题和分类问题

回归问题是连续型的预测，例如对于不同面积大小，年份的房屋价格的预测

分类问题是离散型的预测，例如对于肿瘤的大小，患者的年龄情况，预测肿瘤是良性还是恶性

回归问题中，\(m\)是训练数据的条数，\(h\)是目标函数，\(J(\theta_0,\theta_1)\)是代价函数，目的是找到使得代价函数值最小的对应回归曲线的参数值。可以通过梯度下降策略来找到对应的参数，即\(\theta_0\)和\(\theta_1\)

\[\theta_1:=\theta_1-\alpha\cfrac{\partial J(\theta_1,\theta_2)}{\partial \theta_1} \tag{1} \]

无监督学习：主要是具有不同特征数据的聚类，没有标准，相似的自动聚集成一类。例如，通过用户的不同属性（年龄、性别、订阅频道等）的相似度，将某产品的用户自动聚集成集中类型，但是具体是是什么样的类型，没有人知道，这需要数据分析者根据聚类情况进行总结。

posted @ 2021-04-10 21:55 Snailser 阅读(97) 评论(0) 收藏举报

刷新页面返回顶部