1 认识机器学习

机器学习:通过学习经验E(expearence),在解决任务T(task)时达到更好的效果,其效果由P(performance measure)来衡量。例如,在系统学习自动帮助用户归类垃圾邮件的过程中,观察学习用户是如何归类邮件过程是E,归类收到的邮件是任务T,正确归类的比例是度量P。

有监督学习:通过学习正确的数据(训练集),预测其他情况下的输出结果

细分为回归问题分类问题

回归问题是连续型的预测,例如对于不同面积大小,年份的房屋价格的预测

分类问题是离散型的预测,例如对于肿瘤的大小,患者的年龄情况,预测肿瘤是良性还是恶性

回归问题中,\(m\)是训练数据的条数,\(h\)是目标函数,\(J(\theta_0,\theta_1)\)是代价函数,目的是找到使得代价函数值最小的对应回归曲线的参数值。可以通过梯度下降策略来找到对应的参数,即\(\theta_0\)\(\theta_1\)

\[\theta_1:=\theta_1-\alpha\cfrac{\partial J(\theta_1,\theta_2)}{\partial \theta_1} \tag{1} \]

无监督学习:主要是具有不同特征数据的聚类,没有标准,相似的自动聚集成一类。例如,通过用户的不同属性(年龄、性别、订阅频道等)的相似度,将某产品的用户自动聚集成集中类型,但是具体是是什么样的类型,没有人知道,这需要数据分析者根据聚类情况进行总结。

posted @ 2021-04-10 21:55  Snailser  阅读(71)  评论(0编辑  收藏  举报