04 2020 档案
摘要:相关和回归的区别:回归是一种趋势考察,相关是一种紧密性的考察,从散点图看,点越分散程度表现为相关性,点呈现的趋势表现为回归 线性模型的几个重要点 独立性考察:wd检验 正态性考察:对残差,但是也可以先看看自变量和因变量是否存在强烈偏态 方差齐性考察: 决定系数:即百分之多少的变异程度可由当前模型解释
阅读全文
摘要:关联分析(相关分析):用于考察变量间数据关联密切程度的统计分析方法,几乎所有涉及到多个变量的假设检验分析,这些都可以看作是这样变量间的关联分析 相关分析的分类 按照变量数量 一个变量 vs 另一个变量(平常指的就是这个) 一个变量 vs 一组变量 一组变量 vs 另一组变量 多组变量间的相关分析 按
阅读全文
摘要:import statsmodels.stats.contingency_tables as tb # 卡方检验,不同家庭收入级别在轿车拥有率上是否有区别 table = tb.Table(pd.crosstab(ccss.Ts9, ccss.O1)) table <statsmodels.stat
阅读全文
摘要:参数统计方法的局限 需要事先明确假定的总体分布:t检验,方差分析 总体分布未知,或分布不符合要求时无法使用,比如时间明显是偏态分布的 结果为有序分类变量时无法使用 样本数据两端有不确定值,比如实验测含量,含量很低时无法用精确数值表示,只能说小于某个数值 非参数分析方法的特点 不依赖总体分布的具体形式
阅读全文
摘要:试验中要考察的指标称为试验指标,影响试验指标的条件称为因素(分类变量),因素所处的状态称为水平,若试验中只有一个因素改变则称为单因素试验,若有两个因素改变则称为双因素试验,若有多个因素改变则称为多因素试验。方差分析就是对试验数据进行分析,检验方差相等的多个正态总体均值是否相等,进而判断各因素对试验指
阅读全文
摘要:''' ORM是python编程语言后端web框架Django的核心思想,'Object Relational Mapping' 即对象-关系映射 简称'ORM' 一句话理解就是:创建一个实例对象,用它创建它的类名当做数据表名,用它创建类属性对应的数据表的字段, 当这个实例对象操作时,能够对应MyS
阅读全文
摘要:def upper_attr(class_name, class_parents, class_attr): # Foo object {'bar':"bip"} ''' 将所有类属性或者方法的名字改成大写''' new_attr = {} for name, value in class_attr
阅读全文
摘要:独立性:不同案例间的取值互相独立,不受到除研究中考虑的分组因素、配对因素等研究因素之外任何其他因素的影响,其他非研究因素的影响基本可以等同于随机误差 非独立的情形:研究儿童生长发育,样本中存在兄弟、表兄弟等近亲关系 数据的非独立的影响是比较大的,因为传统统计模型均按照数据独立假设进行推导,非独立会导
阅读全文
摘要:假设检验原理:https://baike.baidu.com/item/%E5%81%87%E8%AE%BE%E6%A3%80%E9%AA%8C/638320 原假设H0:一般是我们不希望成立的情况 备择假设H1:意义在于当原假设被拒绝时供采用 检验水准:常用α表示,指检验假设H0本来成立,却拒绝H
阅读全文
摘要:泰坦尼克数据集描述: 案例数:1309 特征数:14个,包括年龄,性别,舱位等 总存活率:38% 整个分析分为两部分:一是根据性别和舱位进行统计描述推断,二是对幸存进行预测 统计描述部分只详细看仓位和性别这两个特征值,以及它们的联合起来对幸存率的影响,我们通过简单的三张统计表格就可以发现数据具有欺骗
阅读全文

浙公网安备 33010602011771号