吴恩达机器学习笔记|(1)概述及分类
声明:本系列十二篇文章均为[中英字幕]吴恩达机器学习系列课程_哔哩哔哩_bilibili学习笔记,另外收集了课程相关课件、作业原题及参考源码,以及我的笔记原文件,已经放在我的github上,欢迎大家取用~
侵删~
一、概述
学习算法是一组工具,如何正确使用这些工具是最重要的
- 定义:计算机从经验E中学习,解决某一任务T,进行某一性能度量P,通过P测定在T上的表现因经验E而提高。
例:邮件程序根据你对垃圾邮件和非垃圾邮件的标记,从而基于此来学习如何过滤垃圾邮件。其中E是你给邮件的标签,T是区分垃圾邮件,P是区分成功率 - 分类:
- Supervised Learning
- Unsupervised Learning
- Others: Reinforcement Learning,Recommender Systems
二、监督学习(Supervised Learning)
- 定义:我们给算法一个数据集,其中包含了“正确答案”,算法的目的就是给出更多的“正确答案”。
- “回归问题”,即预测连续值的输出。(房价预测实例)
- “分类问题”,即预测离散值输出,0/1、0/1/2/...。(肿瘤分类实例)
- 如何处理无穷多的特征?
- 设计一个算法来解决——什么算法?
三、无监督学习(Unsupervised Learning)
-
定义:数据集无标签或者标签相同,算法自动识别数据集的结构特征。
- 聚类算法:根据数据集的特征将其分为不同的簇
- Octave/Matlab
学会用Octave建立算法原型并运行(因为很快),然后再迁移到其它环境中
Octave和Matlab语法兼容
Octave开源且轻量级