摘要: caret包(Classification and Regression Training)是一系列函数的集合,它试图对创建预测模型的过程进行流程化。本系列将就数据预处理、特征选择、抽样、模型调参等进行介绍学习。 本文将就caret包中的数据预处理部分进行介绍学习。主要包括以下函数:model.matrix(),dummyVars(),nearZeroVar(),findCorrelation(),findLinearCombos(),preProcess(),classDist(),featurePlot() 阅读全文
posted @ 2018-01-15 18:45 Hyacinth-Yuan 阅读(10849) 评论(0) 推荐(0) 编辑
摘要: 本文时针对R语言tm包文本挖掘的学习。 阅读全文
posted @ 2018-01-09 21:09 Hyacinth-Yuan 阅读(3997) 评论(0) 推荐(0) 编辑
摘要: 本文时针对R语言jiebaR包的分词学习 阅读全文
posted @ 2018-01-08 19:58 Hyacinth-Yuan 阅读(10756) 评论(0) 推荐(1) 编辑
摘要: 本文将利用Python实现JSON数据到RDF格式文件的转化,并基于RDF知识库进行查询,从而实现一个简易的知识图谱。 阅读全文
posted @ 2018-01-08 14:53 Hyacinth-Yuan 阅读(1351) 评论(0) 推荐(0) 编辑
摘要: bags of word(WOE) 它的基本思想是假定对于一个文本,忽略其词序和语法、句法,仅仅将其看做是一些词汇的集合,而文本中的每个词汇都是独立的 循环神经网络(recurrent neural networks) 会考虑到词序,基于对先前所见词的理解来推断当前词的真实含义 当相关的信息和预测的 阅读全文
posted @ 2018-01-03 11:26 Hyacinth-Yuan 阅读(311) 评论(0) 推荐(0) 编辑
摘要: 引用Echarts 方法1:下载echarts.js后,进行引用,如 <script src="echarts.min.js"></script> 方法2:在线引用,在线网址可为 http://echarts.baidu.com/dist/echarts.min.js R语言中有相应的R包,统计之都 阅读全文
posted @ 2017-12-23 22:55 Hyacinth-Yuan 阅读(139) 评论(0) 推荐(0) 编辑
摘要: JSON语法 JSON 的语法主要有以下5点: 数组(Array)用方括号(“[]”)表示。 对象(Object)用大括号(”{}”)表示。 名称/值对(name/value)之间用冒号(”:”)隔开。 名称(name)置于双引号中,值(value)有字符串、数值、布尔值、null、对象和数组。 并 阅读全文
posted @ 2017-12-23 14:02 Hyacinth-Yuan 阅读(263) 评论(0) 推荐(0) 编辑
摘要: 在 D3.js 中提供了 d3.csv() 函数来读取 CSV 文件。函数 API 可参见: https://github.com/mbostock/d3/wiki/CSV 变量中 csvdata 是保存了一个数组,数组中的每个元素都一个对象,每个对象里都有 age 、name、sex 三个成员变量 阅读全文
posted @ 2017-12-23 13:50 Hyacinth-Yuan 阅读(2082) 评论(0) 推荐(0) 编辑
摘要: D3 总共提供了 12 个布局:饼状图(Pie)、力导向图(Force)、弦图(Chord)、树状图(Tree)、集群图(Cluster)、捆图(Bundle)、打包图(Pack)、直方图(Histogram)、分区图(Partition)、堆栈图(Stack)、矩阵树图(Treemap)、层级图( 阅读全文
posted @ 2017-12-22 16:48 Hyacinth-Yuan 阅读(1700) 评论(0) 推荐(0) 编辑
摘要: 首先,介绍一下D3中三个非常重要的概念Update、Enter、Exit 。 如果数组为 [3, 6, 9, 12, 15],将此数组绑定到三个 p 元素的选择集上。可以想象,会有两个数据没有元素与之对应,这时候 D3 会建立两个空的元素与数据对应,这一部分就称为 Enter。而有元素与数据对应的部 阅读全文
posted @ 2017-12-22 16:46 Hyacinth-Yuan 阅读(1305) 评论(0) 推荐(0) 编辑