用R理解统计学
摘要:1、随机变量( random variable)概念的引入 该数据来自杰克逊实验室。2组数据,每组12只老鼠,一组普通食物,另一组高脂肪(hf)饮食。几周后,科学家们称了每只老鼠的体重,得到了这个数据: 因此,食用hf的小鼠体重增加了10%我们做了什么?为什么我们需要p值和置信区间?原因是这些平均值
阅读全文
Maximum Likelihood及Maximum Likelihood Estimation
摘要:1、What is Maximum Likelihood? 极大似然是一种找到最可能解释一组观测数据的函数的方法。 在基本统计学中,通常给你一个模型来计算概率。例如,你可能被要求找出X大于2的概率,给定如下泊松分布:X ~ Poisson (2.4)。在这个例子中,已经给定了你泊松分布的参数 λ(2
阅读全文
Wilcoxon Signed Rank Test
摘要:1、Wilcoxon Signed Rank Test Wilcoxon有符号秩检验(也称为Wilcoxon有符号秩和检验)是一种非参数检验。当统计数据中使用“非参数”一词时,并不意味着您对总体一无所知。这通常意味着总体数据没有正态分布。如果两个数据样本来自重复观察,那么它们是匹配的。利用Wilco
阅读全文
Parametric Statistics
摘要:1、What are “Parametric Statistics”? 统计中的参数指的是总体的一个方面,而不是统计中的一个方面,后者指的是样本的一个方面。例如,总体均值是一个参数,而样本均值是一个统计量。参数统计检验对总体参数和数据的分布进行假设。这些类型的测试包括学生的T测试和方差分析测试,假设
阅读全文
Chi-Square Statistic/Distribution
摘要:、 1、What is a Chi Square Test? 卡方检验有两种类型。两者使用卡方统计量和分布的目的不同。 第一种:卡方拟合优度检验确定样本数据是否与总体匹配。(这里不介绍) 第二种:独立性的卡方检验比较列联表中的两个变量,看看它们是否相关。在更一般的意义上,它测试分类变量的分布是否不同
阅读全文
Z-Score
摘要:1、 What is a Z-Score? 简单地说,z分数就是数据距离均值有多少个标准差。但更严格地说,它衡量的是一个数值偏离总体均值以上或以下多少个标准差。z分数也称为标准分数,可以放在正态分布曲线上。z分数范围从-3个标准差(落在正态分布曲线的最左边)到+3个标准差(落在正态分布曲线的最右边)
阅读全文
T分布(T-Distribution)
摘要:1、What is the T Distribution? T分布(也叫Student 's T分布)是一组与正态分布曲线几乎相同的分布,只是更短更胖一点。当有小样本时,使用t分布而不是正态分布。样本容量越大,t分布越接近正态分布。事实上,对于大于20的样本容量(如自由度),其分布与正态分布几乎完全
阅读全文
Confidence Interval
摘要:1、what is the Definition of a Confidence Interval? 置信区间是特定统计量的不确定性。置信区间通常有误差范围。它告诉你,你有多大的信心,从民意调查或调查的结果,反映出你会发现什么,如果有可能调查整个群体。置信区间与置信水平(confidence lev
阅读全文
Alpha Level (Significance Level)
摘要:1、Alpha Level (Significance Level,显著水平): What is it? 在了解之前首先看一下什么是一类错误和二类错误 2. Alpha Levels / Significance Levels: Type I and Type II errors 在假设检验中,有两
阅读全文
Null Hypothesis and Alternate Hypothesis
摘要:1、Null Hypothesis Overview 零假设,H0是普遍接受的事实;这与备择假设(alternate hypothesis)正好相反。研究人员努力否定、驳斥零假设。研究人员提出了另一种假设(alternate hypothesis),他们认为这种假设可以解释一种现象,然后努力拒绝零假
阅读全文
p-value
摘要:1、什么是p-value p值用于假设检验,以帮助您支持或拒绝零假设。p值是反对零假设的证据。p值越小,拒绝原假设的证据就越强p A p value is used in hypothesis testing to help you support or reject the null hypoth
阅读全文
t检验,T Test (Student’s T-Test)
摘要:1、什么是T test? t-test:比较数据的均值,告诉你这两者之间是否相同,并给出这种不同的显著性(即是否是因为偶然导致的不同) 例子:制药公司可能想测试一种新的抗癌药物,看看它是否能提高预期寿命。在实验中,总有一个对照组(给一组人服用安慰剂,或“糖丸”)。对照组的平均预期寿命为+5岁,而服用
阅读全文
伽马分布
摘要:https://cosx.org/2013/01/lda-math-gamma-function
阅读全文
各种分布
摘要:https://blog.csdn.net/bitcarmanlee/article/details/82156281?utm_source=blogxgwz1
阅读全文
柏松分布
摘要:0、History The distribution was first introduced by Siméon Denis Poisson (1781–1840) and published, together with his probability theory, in 1837 in hi
阅读全文
第二章 描述性统计
摘要:2.1 描述定性数据的图形法和数值法 定义2.1 类(或组)频数:落入这个类中的观测值的个数 类(或组)相对频率:落入这个类中的观测值的个数相对于观测值总数的比例 定性数据描述常用条形图和饼图 条形图:给出每一类的频数(或频率),长方形的高度或长度与类频数(或频率)成比例 饼图:一个整圆分成几份,每
阅读全文
第一章:统计学概论
摘要:1.1 :统计学:数据的科学 定义1.1 统计学:是数据的科学,包括数据的收集、分类、概括、整理、分析以及解释。 统计学经常用于两种类型问题的解决: 1、概括,描述以及探索数据。(对应为描述性统计学) 2、利用样本数据推断被选取样本的数据集的性质。(对应为推断统计学) 定义1.2 描述性统计学:致力
阅读全文
极大似然估计
摘要:极大似然估计 以前多次接触过极大似然估计,但一直都不太明白到底什么原理,最近在看贝叶斯分类,对极大似然估计有了新的认识,总结如下: 贝叶斯决策 首先来看贝叶斯分类,我们都知道经典的贝叶斯公式: 其中:p(w):为先验概率,表示每种类别分布的概率;:类条件概率,表示在某种类别前提下,某事发生的概率;而
阅读全文
秩和检验
摘要:转自http://wiki.mbalib.com/wiki/%E7%A7%A9%E5%92%8C%E6%A3%80%E9%AA%8C 什么是秩和检验 秩和检验方法最早是由维尔克松提出,叫维尔克松两样本检验法。后来曼—惠特尼将其应用到两样本容量不等()的情况,因而又称为曼—惠特尼U检验。这种方法主要用
阅读全文
箱型图
摘要:箱型图是在1977年由美国的统计学家约翰·图基(John Tukey)发明的。它由五个数值点组成:最小值(min),下四分位数(Q1),中位数(median),上四分位数(Q3),最大值(max)。也可 以往盒图里面加入平均值(mean)。如上图。下四分位数、中位数、上四分位数组成一个“带有隔间的盒
阅读全文