摘要:线性回归变量选择方法 输入(回归)(Enter (Regression))一种变量选择过程,其中一个块中的所有变量在一个步骤中输入。Stepwise(逐步)在每一步,不在方程中的具有 F 的概率最小的自变量(对因变量贡献最大)被选入(如果该概率足够小)。对于已在回归方程中的变量,如果它们的 F 概率
阅读全文
摘要:参考链接:https://jingyan.baidu.com/article/597a064395087c312b524313.html 在回归分析模型 Y=β0+β1X+ε(一元线性回归模型)中,Y是被解释变量,就称为因变量。X是解释变量,称为自变量。表示为:因变量Y随自变量X的变化而变化。协变量
阅读全文
摘要:平均值检验 Anova :方差分析 单样本的t检验 目的:推断样本数据的平均值和指定检验值之间的差异是否显著 零假设:样本数据平均值和检验值之间不存在差异 0.001<0.05 则拒绝零假设:认为样本数据平均值和检验值之间存在显著差异
阅读全文
摘要:概念通过频数交叉表来讨论两个或多个变量之间是否存在关联,并提供了各种双向表检验和相关性测量。基本思路和假设检验基本一致,先建立零假设认为变量之间无关联/无差异,然后进行卡方检验通过概率是否达显著水平来判段接受或拒绝零假设。 “精确检验”提供了另外两种计算方法,用于计算通过“交叉表”和“非参数检验”过
阅读全文
摘要:置信区间 置信区间,就是一种区间估计。 先来看看什么是点估计,什么是区间估计。 1 点估计与区间估计 买奖片卡: 点估计:买一张,猜测这一张是否会中奖 区间估计:买一盒,这一盒里面是否有一张中奖 下面解释置信区间是如何进行区间估计的? 2.置信区间 在统计学中,一个概率样本的置信区间(Confide
阅读全文
摘要:分析 描述统计 频率 频率:统计 百分位值 四分位数 (如100个数中,第25 50 75 100个参数是多少) 值为组的中点:如【30,40】内的值全部编码为35,那么选择此选项以估计原始未分组的数据的中位数和百分位数。 多个变量:比较变量就是指多个变量的频数表集中输出。按变量组织输出:每个变量单
阅读全文
摘要:加全个案 数据 加全个案 以个案出现频次加全 加全前: 交叉表格 加全后 交叉表格: 计算新的变量 转换 计算变量 可筛选,可计算 对个案内值的计数 实现某种类别的统计,当然也可以计算当下的频率(分析 描述统计) 变量的重新编码1.重新编码为相同变量 对数值型和字符串型的变量编码 但如果选择多个变量
阅读全文
摘要:数据排序 1.可以直接右键排序 2. 可以实现主排序和次排序 数据-排序个案 可以先按照树高升序,当树高一样时再按照冠幅降序排列 具体操作,先选择树高:升序 ,再选择冠幅 :降序 3.也可以数据--排序变量(按照一些属性变量来排序) 4. 排序--合并文件--合并变量非活动:以源文件为基础,其他文件
阅读全文
摘要:B站链接:https://www.bilibili.com/video/BV1Ms41177gs?p=5 文档参考链接:https://www.ibm.com/support/knowledgecenter/zh/SSLVMB_subs/statistics_mainhelp_ddita/stati
阅读全文