摘要: 任何事物和人都不是以个体存在的,它们都被复杂的关系链所围绕着,具有一定的相关性,也会具备一定的因果关系,(比如:父母和子女,不仅具备相关性,而且还具备因果关系,因为有了父亲和母亲,才有了儿子或女儿),但不是所有相关联的事物都具备因果关系。 下面用SPSS采用回归—线性分析的方式来分析一下:居民总储蓄 和 “居民总消费”情况是否具备相关性,如果具备相关性,那相关关系的密切程度为多少。下面以“居民总储蓄”和“居民总消费”的调查样本做统计分析,数据如下所示:第一步:我们先来分析“居民总储蓄”和“居民总消费”是否具备相关性 (采用SPSS 19版本)1:点击“分析”—相关—双变量,进入如下界面:将“居 阅读全文
posted @ 2013-08-07 18:03 AnswerXin 阅读(933) 评论(0) 推荐(0) 编辑
摘要: 今天跟大家研究和分享一下:spss非参数检验——两独立样本检验,我还是引用教程里面的案例,以:一种产品有两种不同的工艺生产方法,那他们的使用寿命分别是否相同下面进行假设:1:一种产品两种不同的工艺生产方法,他们的使用寿命分布是相同的 2:一种产品两种不同的工艺生产方法,他们的使用寿命分布是不相同的我们采用SPSS进行分析,数据如下所示:点击“分析”选择“非参数检验” 再选择“旧对话框——2个独立样本检验 如下所示:在检验类型 下面 选择"Mann-Whitney U “ 检验类型 (Mann-whitney u 检验等同于对两组数据的Wilcoxon秩和检验和Kruskal-Wall 阅读全文
posted @ 2013-08-07 18:02 AnswerXin 阅读(3569) 评论(1) 推荐(0) 编辑
摘要: 今天和大家一起探讨和分下一下SPSS-非参数检验--K个独立样本检验 ( Kruskal-Wallis检验)。 还是以SPSS教程为例:假设:HO: 不同地区的儿童,身高分布是相同的 H1: 不同地区的儿童,身高分布是不同的不同地区儿童身高样本数据如下所示:提示:此样本数为4个(北京,上海,成都 ,广州)每个样本的样本量(观察数)都为5个即:K=4>3 n=5, 此时如果样本逐渐增大,呈现出自由度为K-1的平方的分布,(即指:卡方检验)点击“分析”——非参数检验——旧对话框——K个独立样本检验,进入如下界面:将“周岁儿童身高”变量拖入右侧“检验变量列表”内, 将“城市(CS)变量” 拖入 阅读全文
posted @ 2013-08-07 18:01 AnswerXin 阅读(16919) 评论(0) 推荐(1) 编辑
摘要: 今天跟大家讨论和分享一下:spss-Friedman 秩和检验-非参数检验-K个(多个)相关样本检验,下面以“数学,物理,生物”样本数据为例,假设:H0: 数学,物理,生物三门课程的总体分布是相同的 H1:数学,物理,生物三门课程的总体分布是不相同的。样本数据如下所示:从上图可以看出:处理组为:3组(假设用K表示) 区组为:5组(我们只取前面的5组) (假设用b表示) (上图只截取了一部分)1:我们先将每一组进行“秩序编号”并进行排序, 例如第一组秩序为:1, 2,, 3. 第二组秩序为:1, 2, 3第三组秩序为:1, 2, 3 第四组秩序为:1, 2, 3第五组秩序为:2, 1, 3我们相 阅读全文
posted @ 2013-08-07 18:00 AnswerXin 阅读(872) 评论(0) 推荐(0) 编辑
摘要: SPSS-多重响应--频率和交叉表分析,希望大家能够多提点提点在云南电信网上营业厅做了一个关于“客户不使用电信3g业务的原因有哪些的问卷调查,问题所示:这份问卷调查总更有35人参与,样本容量偏少,其中1:选择 A :3G资费过高的有 14人2:选择 B: 网络覆盖率低,信号不稳定的 15人3:选择 C:买手机太麻烦的 15人4:选择 D: 换手机号麻烦 15人5:选择 E: 3G功能用处不大 9人6:选择F: 朋友使用后,觉得不好 10人第一步:我们将 A , B, C , D , E ,F,六个答案选项分别做为一个单独的变量,分别赋值为“0”和“1”,0代表没有被选中,“1”代表被选中,这个 阅读全文
posted @ 2013-08-07 17:59 AnswerXin 阅读(1430) 评论(0) 推荐(0) 编辑
摘要: 多元线性回归,主要是研究一个因变量与多个自变量之间的相关关系,跟一元回归原理差不多,区别在于影响因素(自变量)更多些而已,例如:一元线性回归方程 为: 毫无疑问,多元线性回归方程应该为:上图中的 x1, x2, xp分别代表“自变量”Xp截止,代表有P个自变量,如果有“N组样本,那么这个多元线性回归,将会组成一个矩阵,如下图所示:那么,多元线性回归方程矩阵形式为: 其中:代表随机误差, 其中随机误差分为:可解释的误差 和 不可解释的误差,随机误差必须满足以下四个条件,多元线性方程才有意义(一元线性方程也一样)1:服成正太分布,即指:随机误差必须是服成正太分别的随机变量。2:无偏性假设,即指:期 阅读全文
posted @ 2013-08-07 17:57 AnswerXin 阅读(2058) 评论(0) 推荐(0) 编辑
摘要: 虽然线性回归能够满足大部分的数据分析的要求,但是,线性回归并不是对所有的问题都适用, 因为有时候自变量和因变量是通过一个已知或未知的非线性函数关系相联系的,如果通过函数转换,将关系转换成线性关系,可能会造成数据失真或更为复杂的计算,导致结果出现偏差回归分析中,变量转换的方法,如下所示:举例说明一下公式的转换过程:幂函数: 我们将两边取对手 (以自然数e 为底的对数)得到Y'=Iny x'=Inx 将Y'和X‘分别代入方程得到:Y'=In=Ina + In= Ina + βInx = Ina + βX' 此公式分解是请参考:对数的运算性质此时,我们一般会采 阅读全文
posted @ 2013-08-07 17:55 AnswerXin 阅读(5622) 评论(0) 推荐(0) 编辑
摘要: 非线性回归过程是用来建立因变量与一组自变量之间的非线性关系,它不像线性模型那样有众多的假设条件,可以在自变量和因变量之间建立任何形式的模型 非线性,能够通过变量转换成为线性模型——称之为本质线性模型,转换后的模型,用线性回归的方式处理转换后的模型,有的非线性模型并不能够通过变量转换为线性模型,我们称之为:本质非线性模型 还是以“销售量”和“广告费用”这个样本为例,进行研究,前面已经研究得出:“二次曲线模型”比“线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现的趋势变化”,那么“二次曲线”会不会是最佳模型呢? 答案是否定的,因为“非线性模型”能够更好的拟合“销售量随着广告费用的增加而呈现 阅读全文
posted @ 2013-08-07 17:52 AnswerXin 阅读(2409) 评论(0) 推荐(0) 编辑
摘要: 二元Logistic,从字面上其实就可以理解大概是什么意思,Logistic中文意思为“逻辑”但是这里,并不是逻辑的意思,而是通过logit变换来命名的,二元一般指“两种可能性”就好比逻辑中的“是”或者“否”一样,Logistic 回归模型的假设检验——常用的检验方法有似然比检验(likelihood ratio test) 和 Wald检验)似然比检验的具体步骤如下:1:先拟合不包含待检验因素的Logistic模型,求对数似然函数值INL02:再拟合包含待检验因素的Logistic模型,求新的对数似然函数值InL13:最后比较两个对数似然函数值的差异,若两个模型分别包含l个自变量和P个自变量 阅读全文
posted @ 2013-08-07 17:49 AnswerXin 阅读(4423) 评论(0) 推荐(0) 编辑
摘要: 两个变量之间存在确定性:关系和不确定关系(会存在一定的波动范围),就好比你的亲生母亲绝对只有一个,而你的亲叔叔可能有好几个(可以在1叔—4叔之间波动) 相关性一般分为 1:强正相关关系 (一个值会随着另一个值的增加而增加,增加幅度很明显) 2:弱正相关关系 (一个值会随着另一个值的增加而稍增加,增加幅度不太明显,但是有变化趋势) 3:负正相关关系 (一个值会随着另一个值的增加而减少,减少幅度很明显) 4:弱负相关关系 (同弱正相关关系一个原理) 5:非线性相关关系 (说明两个变量之间没有明显的线性关系,却存在着某种非线性关系,比如:曲线,S型,Z型等等) 6:不相关 (两者之间,没有相关性)两 阅读全文
posted @ 2013-08-07 17:43 AnswerXin 阅读(3870) 评论(0) 推荐(0) 编辑