摘要:
一、Rwordseg安装顺序: 1、java 下载Java并安装:https://support.apple.com/kb/DL1572?locale=zh_CN 2、rjava 下载rjava:https://cran.rstudio.com/bin/macosx/mavericks/contri 阅读全文
摘要:
6.49 饼图 6.50 散点图 6.51 折线图 注:在画时间与其他变量的关系图时,要将导入文件中的时间变量,使用函数as.POSIXlt()转化为日期型变量。 6.52 柱形图 6.53直方图 注:hist()函数的返回值是一个list,以数值的形式给出break,frequency等的信息。 阅读全文
摘要:
5.41 基本统计 5.42 分组统计 注:function 参数只写统计函数的名字,不带任何参数。如aggregate(score~class,data,FUN= mean). 5.43 分布分析 利用分组来看分布 查看数据表的前几行用head()函数。 5.44 交叉分析 注:tapply(用户 阅读全文
摘要:
4.24 数据的导入 导入csv、txt及任意格式文件,都可以用read.csv()函数。 如果文件没有列名,当参数header=TRUE,则认为文件的第一行为列名;如果=FALSE,则会赋予表v1,v2,...列名; 如果文件有列名,当参数header=TRUE,则认为文件的第一行为列名;如果=F 阅读全文
摘要:
3.17 程序结构 有3种结构: 顺序结构:A B 选择结构:只有满足一定条件时才会执行的程序模块。 循环结构:只要满足一定的条件,程序模块就会不断的执行。 3.18 for循环 遍历 seq:序列。seq()函数创建序列。 注:seq为各种序列时,则为各序列的名字;seq为数字时,则写成 for( 阅读全文
摘要:
2.6 和R“工作空间”概念相对应,Rstudio中有“项目”概念。 项目是软件工程中的概念,用于管理软件开发,可理解为源代码和相关文档的集合。 在Rstudio中的项目,可理解为一个文件夹,里面放着R的源代码、相关数据文件和R的工作空间。 如何创建项目,创建项目不是必须,但是一个好的习惯;保存R文 阅读全文
摘要:
卡方检验-考察分类变量相关性-“交叉表”或“设定表”中进行; t检验-考察连续变量与分类变量相关性-“设定表”中进行; 线性logsitic回归-研究分类因变量与一组自变量(可连续可分类)的关系; 树结构模型-研究自变量间是否存在交互作用 广义线性模型-在更广范畴建立模型。 1、案例背景 收集脑外伤 阅读全文
摘要:
散点图 曲线直线化:变量变换后拟合线性模型、曲线拟合模型 非线性模型 残差的独立性、正态性、方差齐性检验 预测值 1、案例背景 利用某车企过去14年的汽车销售量来预测未来2-3年的销售量。变量:时间、销售量 2、数据理解 画时间与销售量的散点图,发现以下三类关键信息: 变量间是否存在数量关联趋势; 阅读全文
摘要:
分类变量、连续变量分布的描述 bootstrap抽样、秩和检验探索变量关联:比较均值、独立样本 变量变换:P-P图 秩变换分析:个案排秩 Cox回归模型 方差分析实质是自变量含有分类变量的一般线性模型。 方差分析属于参数检验,有一定的假设条件。当不满足方差分析的假设条件时,就选择 (1)非参数检验( 阅读全文
摘要:
比较均值:列表和图形 拆分文件 单因素方差分析 双因素方差分析(含交互项、只含主效应) 组间两两比较 随机因素分析 方差分析原理: 变异分解。将样本的总变异分解为随机误差的作用、某影响因素的作用。通过比较某影响因素所致变异与随机误差所致变异的大小建立F检验统计量进行检验。 yij=总平均+ai+随机 阅读全文