摘要: R语言-自动批处理文件 在处理数据的过程中,可以制作一个自动批处理文件,让它具有智能的效果,自动化完成复杂的数据处理过程,提高工作效率,解放生产力,从而可以投入更多的精力到数据分析和数据挖掘中,发现数据中的"金子",体现数据的真正价值!!! 方法1: R语言中 C:\Program Files\R\ 阅读全文
posted @ 2016-11-18 10:16 马家寨香椿 阅读(1377) 评论(0) 推荐(0) 编辑
摘要: 这7款工具的说明整理自如下网站: http://www.linuxlinks.com/article/20110306113701179/GUIsforR.html Graphical user interfaces for R RStudio Integrated development envi 阅读全文
posted @ 2016-11-17 20:37 马家寨香椿 阅读(2839) 评论(0) 推荐(0) 编辑
摘要: 一、日期时间、字符串的处理 日期 Date: 日期类,年与日 POSIXct: 日期时间类,精确到秒,用数字表示 POSIXlt: 日期时间类,精确到秒,用列表表示 Sys.date(), date(), difftime(), ISOdate(), ISOdatetime() 字符串处理 ncha 阅读全文
posted @ 2016-11-05 19:32 马家寨香椿 阅读(462) 评论(0) 推荐(0) 编辑
摘要: R语言学习笔记——数据结构 & 数据框基本操作 参考书籍:R语言实战 数据结构: 1. 向量 : 用于存储数值型、字符型或逻辑型数据的一维数组 1.1 创建 : a <- c(1, 2, 3, 4) 1.2 访问 : a[1] : 1 a[c(2, 4)] : 2 4 (向量a中的第二个和第四个元素 阅读全文
posted @ 2016-10-27 21:20 马家寨香椿 阅读(288) 评论(0) 推荐(0) 编辑
摘要: 导入CSV、TXT文件 read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。 read.table读取数据非常方便,通常只需要文件路径、URL或连接对象就可以了,也接受非常丰富的参数设置: file参数:这是必须的,可 阅读全文
posted @ 2016-10-27 21:18 马家寨香椿 阅读(947) 评论(0) 推荐(0) 编辑
摘要: GA算法-R语言实现 旅行商问题 班共有30位同学,来自22个地区,我们希望在假期来一次说走就走的旅行,将所有同学的家乡走一遍。算起来,路费是一笔很大的花销,所以希望设计一个旅行方案,确保这一趟走下来的总路程最短。 旅行商问题是一个经典的NP问题 NP就是Non-deterministic Poly 阅读全文
posted @ 2016-10-27 21:12 马家寨香椿 阅读(572) 评论(0) 推荐(0) 编辑
摘要: 关联规则 shangfr 2015年10月29日 本文旨在演示r语言arules包的关联规则用法,以及利用arulesViz对结果进行可视化 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent 阅读全文
posted @ 2016-10-27 21:01 马家寨香椿 阅读(1170) 评论(0) 推荐(0) 编辑
摘要: 前提假设 妹子们一生中可以遇到100个追求者,追求者的优秀程度符合正态分布; 每个妹子都具备判断并比较追求者优秀程度的能力; 接受或拒绝一个追求者后永远无法后悔。 那么,问题来了 当遇到追求者时,如何选择才能获得最优结果? 如果人的优秀程度符合均值为80,方差20的正态分布,随机产生100个追求者, 阅读全文
posted @ 2016-10-27 20:59 马家寨香椿 阅读(329) 评论(0) 推荐(0) 编辑
摘要: d3network包 http://www.cnblogs.com/shangfr/p/5417054.html ShangFR 2016年5月6日 d3network包 http://www.cnblogs.com/shangfr/p/5417054.html ShangFR 2016年5月6日 阅读全文
posted @ 2016-10-27 20:56 马家寨香椿 阅读(2140) 评论(0) 推荐(0) 编辑
摘要: 问题到数据 理解问题 理解客户的问题:谁是客户(某航空公司)?交流,交流,交流! 问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较、描述、聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部 阅读全文
posted @ 2016-10-27 20:36 马家寨香椿 阅读(986) 评论(0) 推荐(0) 编辑