摘要:
/*神经网络SOM算法思想:分为输入层和竞争层,输入层就是样本的输入,假如我现在有5个样本A,B,C,D,E,他们是5维向量,竞争层是10*10的二维平面,相当于100个神经元,这些神经元也是5维向量,这些神经元对输入向量进行竞争,最后只有一个神经元获胜,越是与输入向量相似,竞争力越强,假如现在位于(7,8)的神经元最相似,它有权力去修改以它为中心的神经元的值,越靠近它的神经元影响越大,越是接近... 阅读全文
摘要:
/*K-中心点算法思想: 将n个样本分成k个聚类,每个聚类里的样本关联性(相似性)较强。假如我现在有5个样本,分别是A,B,C,D,E,他们是二维向量。第一步是随机选择其中两个样本,就选A和B好了,并称他们为中心点,其他的称为非中心点,即C,D,E为非中心点。第二步,将非中心点归类到距离它最近的那个中心点的聚类。比如现在C归到A的聚类中,D归到B的聚类中,E归到A的聚类中,此时A,C,E是一个聚... 阅读全文
摘要:
/*K-Means思想: 将n个样本分成k个聚类,每个聚类里的样本关联性(或者说是相似性)比较高。举个例子,假如有5个样本,每个样本是一个2维向量,分别记做A,B,C,D,E,我要将他们分成2个聚类,第一步是随机选2个样本(也可以是虚拟的)把它们当做中心点,然后将A,B,C,D,E归类到距离最小的那个中心点,之后再对每个聚类进行调整中心点,假如现在A,B,C是一个聚类,D,E是一个聚类,调整的方... 阅读全文
摘要:
/*决策树ID3算法思想:从根节点开始,每一步的选择决定朝下一层的哪个节点走去,到达叶子节点即是它所属的类别,举个例子:假如要判断某一天是否适合打网球,分成两类:是和否。有3个因素对其有影响,分别是天气,温度和是否有风,天气有3个值:晴,多云,有雨。温度有3个值:高,正常,低。是否有风有两个值:是和否。现在我要选择3个因素中哪一个作为根节点最好呢?这里涉及一个计算信息增益的问题,可以通过数学的相... 阅读全文