AI引论---机器学习

AI引论---机器学习

监督学习

在已知输入和输出的情况下, 通过训练建立起输入到输出的映射模型
应用最广的机器学习方法, 可进一步分为分类(结果离散)和回归(结果连续)两类算法

 

K-临近

给定一个待分样本(数据), 在训练集中查找离它最近的前 k 个邻居
根据这些邻居的类别来给该样本的候选类别进行评分, 并根据一定的规则给出
样本的类别标签

 

朴素贝叶斯 

贝叶斯公式 : P(A|B)=P(B|A)*P(A)/P(B)

期中A为分类结果,B为条件

P(B|A)可以拆成若干P(bi|A)的乘积,可以由统计得到

那么最终最大的P(B,A')所对应的A'即为答案

 

应用条件:假设属性之间相互独立

 

 

 

感知机

求出将训练数据进行线性划分的
分离超平面

 

分类性能评估

 K-交叉验证(Cross-validation 

 

无监督学习

 

学习过程中, 只有输入数据, 没有对应的输出数据作为参考
通过模型自我归纳, 自我改进来获得数据中隐含的结构信息

例子:下棋

• 降维 (Dimensionality Reduction)
     对原始数据进行压缩但尽量保留本质的、有价值的信息
• 聚类 (Clustering)
     把数据对象集合分割成不同的子集
     相同子集的对象之间相似性最大化, 不同子集的对象之间不相似性最大化
     经典算法:K-Means

 

posted @ 2022-03-22 20:28  liankewei123456  阅读(43)  评论(0编辑  收藏  举报