摘要: 本文对应《R语言实战》第15章:处理缺失数据的高级方法 本文仅在书的基础上进行简单阐述,更加详细的缺失数据问题研究将会单独写一篇文章。 处理缺失值的一般步骤: 缺失数据的分类: 完全随机缺失(MCAR):某变量的缺失数据与其他任何观测或未观测的变量都不相关; 随机缺失(MAR):某变量上的缺失数据与 阅读全文
posted @ 2017-02-28 21:55 gy_jerry 阅读(3786) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第14章:主成分和因子分析 主成分分析(PCA)是一种数据降维技巧,它能将大量相关变量转化为一组很少的不相关变量,这些无关变量成为主成分。 探索性因子分析(EFA)是一系列用来发现一组变量的潜在结构的方法。通过寻找一组更小的、潜在的或隐藏的结构来解释已观测到的、显式的变量间的关 阅读全文
posted @ 2017-02-28 21:41 gy_jerry 阅读(19840) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第13章:广义线性模型 广义线性模型扩展了线性模型的框架,包含了非正态因变量的分析。 两种流行模型:Logistic回归(因变量为类别型)和泊松回归(因变量为计数型) glm()函数的参数 分布族 默认的连接函数 binomial (link = “logit”) gaussi 阅读全文
posted @ 2017-02-28 21:34 gy_jerry 阅读(17050) 评论(0) 推荐(0) 编辑
摘要: 本文对应《R语言实战》第11章:中级绘图;第16章:高级图形进阶 基础图形一章,侧重展示单类别型或连续型变量的分布情况;中级绘图一章,侧重展示双变量间关系(二元关系)和多变量间关系(多元关系)的绘图;高级绘图进阶一章介绍四种图形系统,主要介绍lattice和ggplot2包。 基础图形一章,侧重展示 阅读全文
posted @ 2017-02-28 21:31 gy_jerry 阅读(10778) 评论(0) 推荐(0) 编辑