摘要: 本文对应《R语言编程艺术》第2章:向量;第3章:矩阵和数组;第4章:列表;第5章:数据框;第6章:因子和表 R语言最基本的数据类型就是向量(vector),单个数值和矩阵都是向量的一种特例。 声明:R中不需要声明变量,但是注意函数式语言的特性,如果读写向量中的元素时,R事先不知道对象是向量的话,则函 阅读全文
posted @ 2017-03-09 19:24 gy_jerry 阅读(1380) 评论(0) 推荐(0) 编辑
摘要: 这本书与手上其他的R语言参考书不同,主要从编程角度阐释R语言,而不是从统计角度。因为之前并没有深刻考虑这些,因此写出的代码往往是一条条命令的集合,并不像是“程序”,因此,希望通过学习这本书,能提高编程效率,以及让自己更像是一个“程序员”。 本文对应《R语言编程艺术》第1章:快速入门。 生成向量的函数 阅读全文
posted @ 2017-03-09 19:10 gy_jerry 阅读(588) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第15章:处理缺失数据的高级方法 本文仅在书的基础上进行简单阐述,更加详细的缺失数据问题研究将会单独写一篇文章。 处理缺失值的一般步骤: 缺失数据的分类: 完全随机缺失(MCAR):某变量的缺失数据与其他任何观测或未观测的变量都不相关; 随机缺失(MAR):某变量上的缺失数据与 阅读全文
posted @ 2017-02-28 21:55 gy_jerry 阅读(3786) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关 阅读全文
posted @ 2017-02-28 21:41 gy_jerry 阅读(19840) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第13章:广义线性模型 广义线性模型扩展了线性模型的框架,包含了非正态因变量的分析。 两种流行模型:Logistic回归(因变量为类别型)和泊松回归(因变量为计数型) glm()函数的参数 分布族 默认的连接函数 binomial (link = “logit”) gaussi 阅读全文
posted @ 2017-02-28 21:34 gy_jerry 阅读(17050) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第11章:中级绘图;第16章:高级图形进阶 基础图形一章,侧重展示单类别型或连续型变量的分布情况;中级绘图一章,侧重展示双变量间关系(二元关系)和多变量间关系(多元关系)的绘图;高级绘图进阶一章介绍四种图形系统,主要介绍lattice和ggplot2包。 基础图形一章,侧重展示 阅读全文
posted @ 2017-02-28 21:31 gy_jerry 阅读(10778) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第12章:重抽样与自助法 之前学习的基本统计分析、回归分析、方差分析,是假定观测数据抽样自正态分布或者其他性质较好的理论分布,进而进行的假设检验和总体参数的置信区间估计等方法。但在许多实际情况中统计假设并不一定满足,比如抽样于未知或混合分布、样本量过小、存在离群点、基于理论分布 阅读全文
posted @ 2017-01-19 12:59 gy_jerry 阅读(7588) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第9章:方差分析;第10章:功效分析 本文对应《R语言实战》第9章:方差分析;第10章:功效分析 方差分析: 回归分析是通过量化的预测变量来预测量化的响应变量,而解释变量里含有名义型或有序型因子变量时,我们关注的重点通常会从预测转向组别差异的分析,这种分析方法就是方差分析(AN 阅读全文
posted @ 2017-01-15 20:43 gy_jerry 阅读(19113) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第8章:回归 回归是一个广义的概念,通指那些用一个或多个预测变量(也称自变量或解释变量)来预测响应变量(也称因变量、效标变量或结果变量)的方法。通常,回归分析可以用来挑选与相应变量相关的解释变量,可以描述两者的关系,也可以生成一个等式,通过解释变量来预测响应变量。 回归分析的各 阅读全文
posted @ 2017-01-15 15:57 gy_jerry 阅读(8380) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第6章:基本图形;第7章:基本统计分析 本章讨论的图形,主要用于分析数据前,对数据的初步掌握。想要对数据有一个初步的印象,最好的方式就是观察它,也就是将数据可视化。在这个过程中,我们不必要过于纠结图形是否漂亮美观,而重点关注各个简单图形的含义:观察数据的哪个方面时需要用到哪些图 阅读全文
posted @ 2016-12-26 10:41 gy_jerry 阅读(2649) 评论(0) 推荐(0) 编辑