摘要:
基本概念:信息熵是信息的一种不确定的程度的度量。假定一个系统s具有概率分布p={pi}(0#include#include#include#define SHORT 0#define MEDIUM 1#define TALL 2#define MAIL 0#define FEMAIL 1#define GENDER 0#define HEIGHT 1#define KIND 2#define LEAF -1typedef struct TNODE{ int attribute; int arriv_value; struct TNODE *... 阅读全文
摘要:
朴素贝叶斯分类器作为最简单的分类器,只要明白贝叶斯的两个概率公式即可:贝叶斯公式:全概率公式:p(X)=P(X|Y1)+P(X|Y2)+...+P(X|Yn)朴素贝叶斯分类把所有的属性看成是相互独立得,因此使用计算向量概率得时候只需要相乘起来就可以了。即使用乘法公式:p(xyz)=p(x)*p(y)*p(z)贝叶斯分类得思想是:对于给出得待分类项,从训练集中知道,在该项出现得条件下,哪个类别得概率最大,那么就把它分成哪一类。贝叶斯公式得定义如下:1.假设是一个待分类项,而每个a为x得一个特征属性。2.有类别集合3.计算4.如果,则现在所要做得就是计算第三步中得概率。1.找到一个已知分类项得集合 阅读全文