摘要:
1、随机变量 我们不关心随机试验的具体结果或发生顺序,关系的是与之有关的数字。 随机变量是将随机试验的结果与数字联系起来的一种函数,而且它的取值有一定的概率。 随机变量用大写字母表示,实数用小写字母表示。 如:投掷三次硬币出现2次正面的概率。 随机试验A的结果为={正正反,正反正,反正正} 随机变量 阅读全文
摘要:
确定性现象:在一定条件下必然发生的。 统计规律性:在大量重复试验或观察中所呈现出的固有规律性。 随机现象:在个别试验中其结果呈现出不确定性,在大量重复试验中其结果又具有统计规律性的现象。 概率论与数理统计是研究和揭示随机现象统计规律性的一门数学学科。 1、随机试验 随机试验具有三个特点: 可以在相同 阅读全文
摘要:
1、回归的多面性 (1)OLS回归的使用情境 OLS回归是通过预测变量(即解释变量)的加权和来预测量化的因变量(即响应变量),其中权重是通过数据估计而得的参数。2、OLS回归 OLS回归拟合模型的形式: (1)用lm()拟合回归模型: 画真实样本和拟合曲线的图用到的函数: abline() line 阅读全文
摘要:
1、描述性统计分析-定量变量 (1)基础安装包包括: summary()函数提供了最小值、最大值、四分位数和数值型变量的均值,以及因子向量和逻辑型向量的频数统计;apply()或sapply()函数可计算所选择的任意描述性统计量。格式为:sapply(x,FUN,options)。其中的x是你的数据 阅读全文
摘要:
当包含的因子(名义型或解释型因子)是解释变量时,我们关注的重点通常会从预测(建立回归模型)转向组别差异的分析,这种分析法称作方差分析(ANOVA)。ANOVA在各种实验和准实验设计的分析中都有广泛应用。 用一个或多个定量变量来拟合和预测另一个定量变量,需要建立回归模型; 当分类变量作为解释变量时,通 阅读全文
摘要:
在分析数据前需要先观察它,本章将关注那些可以帮助理解单个类别型或连续型变量的图形。 1、条形图-针对类别型变量 (1)简单的条形图 涉及:table()函数用于提取对象各单元的计数 注:若要绘制的类别型变量是一个因子或有序型因子,就可以使用函数plot()快速创建。 (2)堆砌条形图和分组条形图 ( 阅读全文
摘要:
1、本章概况:学习多种数学、统计和字符处理函数; 学习循环和条件执行语句来完成用户自编函数; 了解数据的整合、重塑方法。 2、数值和字符处理函数 处理函数分为:数值(数学、统计、概率)函数、字符处理函数 (1)数学函数 (2)统计函数 很多统计函数都拥有可以影响输出结果的可选参数 数据标准化函数:s 阅读全文
摘要:
1、创建新变量 新变量<-表达式,表达式中会涉及到算数运算符,+-*/^ 2、变量的重编码 对满足条件的赋值:语句variable[condition] <- expression将仅在condition的值为TRUE时执行赋值。 在此用到函数within(),与函数with()类似(见2.2.4节 阅读全文
摘要:
1、使用图形 R是在交互式会话中,通过逐条输入语句构建图形,逐渐完善图形特征,直至得到想要的效果。保存图形: 可以通过代码或图形用户界面来保存图形。 (1)通过代码保存图形,将绘图语句夹在开启目标图形设备的语句和关闭目标图形设备的语句之间即可。 (2)对于Windows,在图形窗口中选择“文件”→“ 阅读全文
摘要:
1、数据集的概念 R的数据结构:包括标量、向量、矩阵、数组、数据框和列表; R的数据类型:包括数值型、字符型、逻辑型(TRUE/FALSE)、复数型(虚数)和原生型(字节); 不同的行业对于数据集的行和列叫法不同。统计学家称它们为观测(observation)和变量(variable),数据库分析师 阅读全文