摘要: R语言学习笔记——数据结构 & 数据框基本操作 参考书籍:R语言实战 数据结构: 1. 向量 : 用于存储数值型、字符型或逻辑型数据的一维数组 1.1 创建 : a <- c(1, 2, 3, 4) 1.2 访问 : a[1] : 1 a[c(2, 4)] : 2 4 (向量a中的第二个和第四个元素 阅读全文
posted @ 2016-10-27 21:20 马家寨香椿 阅读(284) 评论(0) 推荐(0) 编辑
摘要: 导入CSV、TXT文件 read.table函数:read.table函数以数据框的格式读入数据,所以适合读取混合模式的数据,但是要求每列的数据数据类型相同。 read.table读取数据非常方便,通常只需要文件路径、URL或连接对象就可以了,也接受非常丰富的参数设置: file参数:这是必须的,可 阅读全文
posted @ 2016-10-27 21:18 马家寨香椿 阅读(926) 评论(0) 推荐(0) 编辑
摘要: GA算法-R语言实现 旅行商问题 班共有30位同学,来自22个地区,我们希望在假期来一次说走就走的旅行,将所有同学的家乡走一遍。算起来,路费是一笔很大的花销,所以希望设计一个旅行方案,确保这一趟走下来的总路程最短。 旅行商问题是一个经典的NP问题 NP就是Non-deterministic Poly 阅读全文
posted @ 2016-10-27 21:12 马家寨香椿 阅读(565) 评论(0) 推荐(0) 编辑
摘要: 关联规则 shangfr 2015年10月29日 本文旨在演示r语言arules包的关联规则用法,以及利用arulesViz对结果进行可视化 关联规则是形如X→Y的蕴涵式,其中, X和Y分别称为关联规则的先导(antecedent或left-hand-side, LHS)和后继(consequent 阅读全文
posted @ 2016-10-27 21:01 马家寨香椿 阅读(1124) 评论(0) 推荐(0) 编辑
摘要: 前提假设 妹子们一生中可以遇到100个追求者,追求者的优秀程度符合正态分布; 每个妹子都具备判断并比较追求者优秀程度的能力; 接受或拒绝一个追求者后永远无法后悔。 那么,问题来了 当遇到追求者时,如何选择才能获得最优结果? 如果人的优秀程度符合均值为80,方差20的正态分布,随机产生100个追求者, 阅读全文
posted @ 2016-10-27 20:59 马家寨香椿 阅读(328) 评论(0) 推荐(0) 编辑
摘要: d3network包 http://www.cnblogs.com/shangfr/p/5417054.html ShangFR 2016年5月6日 d3network包 http://www.cnblogs.com/shangfr/p/5417054.html ShangFR 2016年5月6日 阅读全文
posted @ 2016-10-27 20:56 马家寨香椿 阅读(2108) 评论(0) 推荐(0) 编辑
摘要: 问题到数据 理解问题 理解客户的问题:谁是客户(某航空公司)?交流,交流,交流! 问题要具体 某航空公司: 乘客体验如何?哪方面需要提高? 类别:比较、描述、聚类,判别还是回归 需要什么样的数据:现有数据,数据质量,需要收集的数据,自变量,因变量 哪些方面的满意度?哪些主要竞争对手? 内部数据?外部 阅读全文
posted @ 2016-10-27 20:36 马家寨香椿 阅读(962) 评论(0) 推荐(0) 编辑
摘要: 数据解析 XML是一种可扩展标记语言,它被设计用来传输和存储数据。XML是各种应用程序之间进行数据传输的最常用的工具。它与Access,Oracle和SQL Server等数据库不同,数据库提供了更强有力的数据存储和分析能力,例如:数据索引、排序、查找、相关一致性等,它仅仅是存储数据。事实上它与其他 阅读全文
posted @ 2016-10-27 20:33 马家寨香椿 阅读(1541) 评论(0) 推荐(0) 编辑
摘要: #爬取电影票房信息 library(stringr) library(XML) library(maps) #htmlParse()用来interpreting HTML #创建一个object movie_parsed<-htmlParse("http://58921.com/boxoffice/ 阅读全文
posted @ 2016-10-27 20:26 马家寨香椿 阅读(445) 评论(0) 推荐(0) 编辑
摘要: 在文章(http://www.cnblogs.com/homewch/p/5749850.html)中有提到R可以自定义启动环境,需要修改R安装文件中的ect文件夹下的配置文件Rprofile.site即可: Rprofile.site文件里,设置的内容包括默认编辑器,CRAN镜像选取,自动加载包等 阅读全文
posted @ 2016-10-27 20:17 马家寨香椿 阅读(1128) 评论(0) 推荐(0) 编辑
摘要: ASA的美国总统竞选 在这个大选之年,美国统计协会(ASA)将学生竞赛和总统选举放在一起,将学生预测谁是2016年总统大选的赢家准确的百分比作为比赛点。详情见: http://thisisstatistics.org/electionprediction2016/ 获取数据 互联网上有很多公开的民调 阅读全文
posted @ 2016-10-27 20:12 马家寨香椿 阅读(306) 评论(0) 推荐(0) 编辑