摘要:一个随机变量的分布,可以取决于一些参数的值。而充分统计量,则能够完全捕捉这些参数所包含的关于分布的信息。也就是说,如果知道充分统计量的值,那么这个随机变量关于它的条件分布,不再取决于原来参数的值。网上找到的定义如下: In statistics, a statistic is sufficient for the parameter θ, which indexes the distributi...
阅读全文
随笔分类 - Statistics
摘要:Covariate: In design of experiments, a covariate is an independent variable not manipulated by the experimenter but still affecting the response. See Variables (in design of experiments) for an explan...
阅读全文
摘要:一、统计学基础部分 1、《统计学》 David Freedman等著,魏宗舒,施锡铨等译 中国统计出版社 据说是统计思想讲得最好的一本书,读了部分章节,受益很多。整本书几乎没有公式,但是讲到了统计思想的精髓。 2、《Mind on statistics(英文版)》 机械工业出版社 只需要高中的数学水平,统计的扫盲书。有一句话影响很深: Mathematics as to sta...
阅读全文
摘要:Around the middle of the 20th century the Russian theoretician Andre Tikhonov was working on the solution of ill-posed problems. These are mathematical problems for which no unique solution exists bec...
阅读全文
摘要:Maximum likelihood和Bayesian inference是目前谱系分析(phylogenetic analyses)常用的两种方法。但是由于两者使用的观念或多或少都牵涉到机率与统计的范畴,应用这两种方法的人常常会把两者相互混淆。 虽然一般教学上都会提到,Maximum likelihood用的是统计方法计算谱系树的likelihood,搜寻最佳谱系树;Bayesian infer...
阅读全文
摘要:Applied Cryptography - http://cacr.math.uwaterloo.ca/hac/1996 CRC Handbook of Applied Cryptography by Menezes, van Oorschot and Vanstone in PDF.Trigonometry - http://aleph0.clarku.edu/~djoyce/java/tri...
阅读全文
摘要:有趣且浅显易懂的举例 刚刚在找MAP的资料,无意中找到有人写的一个有趣的文章,拿减肥当例子真的是浅显易懂 XD 如果拿 Artificial Intelligence: A Modern Approach (ISBN-10: 0137903952, ISBN-13: 978-0137903955 , find it in Amazon)这本书里头的例子来说的话是这样: 假设有五个袋子,各袋中都有无...
阅读全文
摘要:课本上没有讲古典概型与概率的联系,这里补充一下。 古典概型:有限个事件,等可能发生。放宽条件后得到几何概型:无限个事件,等可能发生;再放宽条件得到概率:无限个事件,不一定等可能发生。 古典概率 古典概率讨论的对象局限于随机试验所有可能结果为有限个等可能的情形,即基本空间由有限个元素或基本事件组成,其个数记为n,每个基本事件发生的可能性是相同的。若事件A包含m个基本事件,则定义事件A发生的概率为p(...
阅读全文
摘要:昨天突然看到了蒲丰投针实验,于是想看看到底是怎么推导出来的,baidu上搜索了一下,发现就这篇文章写的比较好,而且也简单的讲解了一下蒙特卡洛方法,在此推荐之! 蒲丰投针与蒙特卡洛模拟.pdf
阅读全文
摘要:在多元统计分析中,多元正态分布有着核心地位(很容易与一元统计分析类比),今日将其分布密度函数及最大似然估计(ML)的简单推导过程和结果记载于此,供我向SEM迈进奠基之用。首先是密度函数: 对于来自多元正态分布总体的样本Y~Nm(μ, V), 显然很容易写出这n个样品的联合分布密度: 按ML的常规套路,取对数(注意为了书写方便现令Ψ=V-1): 现在根据推导需要引进几个记...
阅读全文
摘要:delta(i,j) 被定义为: 1, 如果 i=j; 0, 如果 i!=j;
阅读全文
摘要:LDA和FLD(Fisher linear discriminant)在统计中都是用来寻找特征的某种线性组合,该组合变量可以作为分类的依据,也可以用于数据集的将维处理,为进一步的分类作准备。 LDA与方差分析 ANOVA及回归分析都是用其他特征或测量值的线性组合来表达一个因变量。不同的是,LDA中涉及的因变量是“分类变量”(如类标号),而后两者都是指具体的数值。 LDA、主元分析( princip...
阅读全文
摘要:在统计学中,最大后验概率(MAP) 估计可以用于未知参量的点估计,它和最大似然估计maximum likelihood (ML)的Fisher方法差不多,但是这里的后验概率的最大化是和先验分布紧密相关的。故而MAP可以看作是ML估计的正则化。 假设我们要根据观测变量x估计参量 θ,并假设x的采样分布是f,那么基于θ的x的条件概率为 f(x | θ) 于是就有似然函数 ,估计 ...
阅读全文
摘要:设xn和yn分别是n维度量空间中的点,则其欧几里德距离定义为: d(x,y)=(∑(xi-yi)2)1/2 当n=2时,则为平面上两点的距离,当n=3时,则为三维空间中两点的距离。
阅读全文