摘要:
caret包(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。
本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数:model.matrix(),dummyVars(),nearZeroVar(),findCorrelation(),findLinearCombos(),preProcess(),classDist(),featurePlot() 阅读全文
摘要:
本文时针对R语言tm包文本挖掘的学习。 阅读全文
摘要:
bags of word(WOE) 它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的 循环神经网络(recurrent neural networks) 会考虑到词序,基于对先前所见词的理解来推断当前词的真实含义 当相关的信息和预测的 阅读全文
摘要:
引用Echarts 方法1:下载echarts.js后,进行引用,如 <script src="echarts.min.js"></script> 方法2:在线引用,在线网址可为 http://echarts.baidu.com/dist/echarts.min.js R语言中有相应的R包,统计之都 阅读全文
摘要:
JSON语法 JSON 的语法主要有以下5点: 数组(Array)用方括号(“[]”)表示。 对象(Object)用大括号(”{}”)表示。 名称/值对(name/value)之间用冒号(”:”)隔开。 名称(name)置于双引号中,值(value)有字符串、数值、布尔值、null、对象和数组。 并 阅读全文
摘要:
在 D3.js 中提供了 d3.csv() 函数来读取 CSV 文件。函数 API 可参见: https://github.com/mbostock/d3/wiki/CSV 变量中 csvdata 是保存了一个数组,数组中的每个元素都一个对象,每个对象里都有 age 、name、sex 三个成员变量 阅读全文
摘要:
D3 总共提供了 12 个布局:饼状图(Pie)、力导向图(Force)、弦图(Chord)、树状图(Tree)、集群图(Cluster)、捆图(Bundle)、打包图(Pack)、直方图(Histogram)、分区图(Partition)、堆栈图(Stack)、矩阵树图(Treemap)、层级图( 阅读全文
摘要:
首先,介绍一下D3中三个非常重要的概念Update、Enter、Exit 。 如果数组为 [3, 6, 9, 12, 15],将此数组绑定到三个 p 元素的选择集上。可以想象,会有两个数据没有元素与之对应,这时候 D3 会建立两个空的元素与数据对应,这一部分就称为 Enter。而有元素与数据对应的部 阅读全文