AI引论---机器学习
AI引论---机器学习
监督学习
在已知输入和输出的情况下, 通过训练建立起输入到输出的映射模型
应用最广的机器学习方法, 可进一步分为分类(结果离散)和回归(结果连续)两类算法
K-临近
给定一个待分样本(数据), 在训练集中查找离它最近的前 k 个邻居
根据这些邻居的类别来给该样本的候选类别进行评分, 并根据一定的规则给出
样本的类别标签
朴素贝叶斯
贝叶斯公式 : P(A|B)=P(B|A)*P(A)/P(B)
期中A为分类结果,B为条件
P(B|A)可以拆成若干P(bi|A)的乘积,可以由统计得到
那么最终最大的P(B,A')所对应的A'即为答案
应用条件:假设属性之间相互独立
感知机
求出将训练数据进行线性划分的
分离超平面
分类性能评估
K-交叉验证(Cross-validation)
无监督学习
学习过程中, 只有输入数据, 没有对应的输出数据作为参考
通过模型自我归纳, 自我改进来获得数据中隐含的结构信息
例子:下棋
• 降维 (Dimensionality Reduction)
对原始数据进行压缩但尽量保留本质的、有价值的信息
• 聚类 (Clustering)
把数据对象集合分割成不同的子集
相同子集的对象之间相似性最大化, 不同子集的对象之间不相似性最大化
经典算法:K-Means