随笔分类 - R语言
摘要:通过包来实现R版本的更新(速度较慢,建议还是官网下载) # windows if(!require(installr)){ install.packages("installr"); require(installr)} updateR() # ios install.packages('devto
阅读全文
摘要:旭日图(sunburst chart)也叫太阳图,一种圆环镶接图,每一个圆环就代表了同一级别的比例数据,离原点越近的圆环级别越高,最内层的圆表示层次结构的顶级。除了圆环外,旭日图还有若干从原点放射出去的‘射线’,这些‘射线’展示出了不同级别数据间的脉络关系。旭日图从圆心出发,层层向外推进,可以清晰的
阅读全文
摘要:一、简介 决策树分类算法(decision tree)通过树状结构对具有某特征属性的样本进行分类。其典型算法包括ID3算法、C4.5算法、C5.0算法、CART算法等。每一个决策树包括根节点(root node),内部节点(internal node)以及叶子节点(leaf node)。 根节点:表
阅读全文
摘要:朴素贝叶斯分类(naive bayesian,nb)源于贝叶斯理论,其基本思想:假设样本属性之间相互独立,对于给定的待分类项,求解在此项出现的情况下其他各个类别出现的概率,哪个最大,就认为待分类项属于那一类别。邮箱内垃圾邮件的筛选即应用朴素贝叶斯算法。 朴素贝叶斯分类实现的三阶段: 第一阶段,准备工
阅读全文
摘要:组合数:从m个不同元素中取出n(n≤m)个元素的所有组合的个数,叫做从m个不同元素中取出n个元素的组合数。 代码: 运行结果:
阅读全文
摘要:K近邻算法(KNN)是指一个样本如果在特征空间中的K个最相邻的样本中的大多数属于某一个类别,则该样本也属于这个类别,并具有这个类别上样本的特性。即每个样本都可以用它最接近的k个邻居来代表。KNN算法适合分类,也适合回归。KNN算法广泛应用在推荐系统、语义搜索、异常检测。 KNN算法分类原理图: 图中
阅读全文