5-15日报
机器学习的分类
从机器学习算法本身来看,可分为监督学习、非监督学习、半监督学习、增强学习。
监督学习:给机器的训练数据拥有标记或标签的学习方式是监督学习。监督学习主要处理分类和回归问题,本系列大部分算法都是监督学习类算法,主要的监督学习算法有下面几种。
k近邻 线性回归和多项式回归 逻辑回归 SVM支持向量机 决策树和随机森林
非监督学习:给机器的训练数据没有任何标记或标签答案。
它经常对这些数据做聚类分析型分类和异常值检测。另外非监督学习可用于对数据进行降维,降维包括特征提取和特征压缩,经典的PCA算法就是非监督学习算法用于实现特征压缩,降维把高纬特征向量变为低纬,方便计算和可视化。
半监督学习:顾名思义是监督学习和非监督学习的组合,给机器的训练数据一部分有标记或答案,另一部分没有。这种情况往往更常见,现实中各种原因都可能导致标记缺失。比如手机照片的分类,有些我们自己标记了类别,有些没有,对手机照片的分类就类似一个半监督学习。这类问题一般先使用无监督学习对数据进行处理,之后使用监督学习手段做模型的训练和预测。
增强学习:也叫强化学习,它根据周围环境的情况采取行动,根据每次行动的结果和反馈,学习和调整行动方式,它必须学习什么是最好的策略从而随着时间推移能获得最大回报。如AlphaGo内部的算法。现在无人驾驶,机器人等都是这种方式进行学习。监督学习和半监督学习依然是增强学习的基础。