11 2012 档案
摘要:相关系数又称线性相关系数.它是衡量变量之间线性相关程度的指标。样本相关系数用r表示,总体相关系数用ρ表示,相关系数的取值范围为[-1,1]。|r|值越大,误差Q越小,变量之间的线性相关程度越高;|r|值越接近0,Q越大,变量之间的线性相关程度越低。计算公式:excel计算函数:CORREL(array1,array2),返回单元格区域 array1 和 array2 之间的相关系数
阅读全文
摘要:一元线性回归预测法(其中操作方法和数据解释适用于多元线性回归)重要目录锚定位:根据残差,输出直方图,判断是否异方差性一元线性回归预测法是分析一个因变量与一个自变量之间的线性关系的预测方法以一个公司的不同地区的广告费和销售额当例子,来预测广告费和销售额之间的数据关系,(x,y),x表示广告费,y表示销售额。图例。图表说明一般高的广告费,一般销售额也高,但是也有例外情况。但是图示大多数的点近似的位于一条线上。(当然没有一条直线通过这些点,但是合理的情况是有条线通过或者接近大部分的点)图中的点是观测数据(x,y),广告费x是自变量,销售额Y是因变量。简单的线性回归认为x,y直接是线性关系,构造一个线
阅读全文
摘要:线性回归预测法 所谓线性回归模型就是指因变量和自变量之间的关系是直线型的。 回归分析预测法中最简单和最常用的是线性回归预测法。 回归分析是对客观事物数量依存关系的分析是数理统计中的一个常用的方法.是处理多个变量之间相互关系的一种数学方法.线性回归分析是对客观事物数量关系的分析,是一种重要的统计分析方法,被广泛的应用于社会经济现象变量之间的影响因素和关联的研究.由于客观事物的联系错 综复杂经济现象的变化往往用一个变量无法描述, 故本篇论文在深入分析一元线性回归及数学模型的情况下,又详细地介绍了多元线性回归方程的参数估计和其显著性检验等.全面揭示了这种复杂的依存关系,准确测定现象之间的数量变...
阅读全文
摘要:置信区间置信区间(Confidence interval)什么是置信区间 置信区间又称估计区间,是用来估计参数的取值范围的。常见的52%-64%,或8-12,就是置信区间(估计区间)置信区间的计算步骤 第一步:求一个样本的均值 第二步:计算出抽样误差。 人们经过实践,通常认为调查: 100个样本的抽样误差为±10%; 500个样本的抽样误差为±5%; 1,200个样本时的抽样误差为±3%; 第三步:用第一步求出的“样本均值”加、减第二步计算的“抽样误差”,得出置信区间的两个端点。
阅读全文
摘要:均值:表示一系列数据或统计总体的平均特征的值。统计学术语,与“平均”(Average)意义相同。例如: l、3、6,10、20这5个数的均值是8。也同期望。中值[midpoint] 组距的上下限之算术平均数 [median] 是在一组数据中居于中间的数(特别注意的地方是:这组数据之前已经经过升序排列!!!),即在这组数据中,有一半的数据比它大,有一半的数据比它小。如果这组数据包含偶数个数字,中值是位于中间的两个数的平均值。标准离差 = 标准差 = 均方差标准差(Standard Deviation) ,也称均方差(mean square error),是各数据偏离平均数的距离的平均数,它...
阅读全文
摘要:决策树(decision tree)决策树(decision tree)是组织和表示决策者所面临的各种决定和不确定问题的一个系统化的方法。参考DMD书籍 和mbawiki http://wiki.mbalib.com/wiki/%E5%86%B3%E7%AD%96%E6%A0%91%E6%A8%A1%E5%9E%8B决策树构成比较简单,主要以下几个要素1.决策点 : 决策点用方括号表示,他表示需要决策者自己做选择,不需要犹豫,自己可以独立的做出判断,事情是确定性。2.事件点 : 事件点 用圆圈表示,这表示了一个不确定性的选择,需要决策者根据EMV数据来判断3.分支 : 决策发展过程中箭头线条来
阅读全文