吴恩达机器学习笔记(1-1到2-1)

吴恩达机器学习笔记(1-1到2-1)
https://www.bilibili.com/video/BV164411b7dx?p=1
https://www.bilibili.com/video/BV164411b7dx?p=2
https://www.bilibili.com/video/BV164411b7dx?p=3
https://www.bilibili.com/video/BV164411b7dx?p=4

机器学习-吴恩达

一、初学

1、什么是机器学习

“A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P if its performance at tasks in T, as measured by P, improves with experience E.”

​ 翻译过来就是:一个电脑程序要完成任务(T),如果电脑获取的关于T的经验(E)越多,就表现(P)越好,那么我们就可以说这个程序“学习”了关于T的经验。简单来说,机器学习是一个输入的经验(训练数据)越多,表现就越好的电脑程序。

​ 机器学习定义:在没有明确设置情况下,使得机器能具有学习能力。

2、机器学习算法分类
  • 有监督学习:通俗来说就是人为辅助计算机进行学习

  • 无监督学习:计算机自己学习

​ 心得:机器学习正真的含义是让机器学习知识并能够使得计算机应用到对应使用领域。不必追求使用高大上的框架技术,而是应该掌握从零搭建机器学习的过程并掌握其细节与原理,为应对不同实际问题能够随心搭建解决问题的机器学习模型/框架。当然学习最新技术也是不可缺少的,学习其优点与思想,而不是去背繁琐的“人造无用概念知识”。与此同时,也要掌握常见的AI工具进行辅助

二、有监督学习

​ 通俗来说,有监督学习就是,给机器(或程序)输入一定量的数据集(这些数据都是真实情况采集到的,都是正确的数据),然后程序能够对这些数据进行学习,然后推算出其他不存在于样本中的数据(这些数据尽管不是真实的,但是却可以对真实的预测)。其特征是,人为的将正确的数据鉴别好,机器对从确鉴别好的数据进行学习,然后对未来或不存在的数据进行预测(预测结果符合数据集规律)。

​ 这种有监督学习的常见算法:

  • 回归问题:对数据集进行回归方程拟合(即拟合符数据集规律的函数曲线),解出方程参数,最后使用方程对其他数据进行预测。通常用在数据集有类似于连续函数特性的情况。例如房价随着占地面积的变化,一般情况占地面积和房价类似于一元一次函数或幂函数。

    • 房价预测
  • 分类问题: 对数据集进行分类,将数据集按照某种依据进行分类,然后通过分布或者分类曲线对其他数据进行概率推测。例如肿瘤预测。

    • 肿瘤预测
    • 说明:图中y轴是年龄大小,x轴使肿瘤块大小,数据集蓝色环圈表示恶性肿瘤,红色叉叉表示良性肿瘤。通过将数据集分类如上图之后,当输入参数年龄以及肿瘤块大小,就能预测该肿瘤的良性与恶性概率。很明显越靠近黑色分割线的右上方肿瘤为良性概率越大,越靠近右下方恶性概率越大。

三、无监督学习

​ 无监督学习通俗来说相对于有监督学习,给定的数据集并没有经过人为的鉴定,也没有人为对程序进行强制筛选,而是通过无监督学习,机器能够对这些看似无规律且分散的数据集进行聚类(自动把某些数据按照符合一定规律或者数据结构等特征聚集在一类)。

​ 例如在海量的新闻里对新闻自动分类,哪些是经济新闻,哪些是娱乐新闻等,并且这个分类并不是人为给出的,而是聚类分出的。再如从杂音里剥离人声,在杂音中将某个人的声音聚类,从而得到该人的说话声音信息。

posted @ 2024-04-19 04:58  麦块程序猿  阅读(5)  评论(0编辑  收藏  举报