摘要: P(y|X)=P(y)*P(X|y)/P(X) 样本中的属性相互独立; 原问题的等价问题为: 数据处理为防止P(y)*P(X|y)的值下溢,对原问题取对数,即: 注意:若某属性值在训练集中没有与某个类同时出现过,则直接P(y)或P(X|y)可能为0,这样计算出P(y)*P(X|y)的值为0,没有可比 阅读全文
posted @ 2019-09-27 23:22 王琳杰 阅读(3498) 评论(0) 推荐(1) 编辑
摘要: k-近邻算法(KNN) 目录 trainingDigits 中包含了大约 2000 个例子,每个例子内容如下图所示,每个数字大约有 200 个样本;目录 testDigits 中包含了大约 900 个测试数据。 将一个32x32的二进制图像矩阵转化为1x1024的向量。 函数img2vector,将 阅读全文
posted @ 2019-09-27 22:59 王琳杰 阅读(556) 评论(0) 推荐(0) 编辑