[13] 数学/数理统计 - 随笔分类(第2页) - emanlee

Bonferroni correction

摘要：From Wikipedia: In statistics, the Bonferroni correction is a method used to counteract the problem of multiple comparisons. It was developed and introduced by Italian mathematician Carlo Emilio Bonf... 阅读全文

posted @ 2012-06-11 21:42 emanlee 阅读(3144) 评论(0) 推荐(0)

偏态分布（Skewed distribution）

摘要：频数分布有正态分布和偏态分布之分。正态分布是指多数频数集中在中央位置，两端的频数分布大致对称。偏态分布是指频数分布不对称，集中位置偏向一侧。若集中位置偏向数值小的一侧，称为正偏态分布；集中位置偏向数值大的一侧，称为负偏态分布。如果频数分布的高峰向左偏移，长尾向右侧延伸称为正偏态分布，也称右偏态分布；同样的，如果频数分布的高峰向右偏移，长尾向左延伸则成为负偏态分布，也称左偏态分布。峰左... 阅读全文

posted @ 2012-04-17 17:52 emanlee 阅读(72452) 评论(0) 推荐(0)

拉格朗日乘子/拉格朗日乘数（Lagrange multiplier）

摘要：基本的拉格朗日乘子法(又称为拉格朗日乘数法)，就是求函数f(x1,x2,...)在g(x1,x2,...)=0的约束条件下的极值的方法。其主要思想是引入一个新的参数λ（即拉格朗日乘子），将约束条件函数与原函数联系到一起，使能配成与变量数量相等的等式方程，从而求出得到原函数极值的各个变量的解。具体方法：假设需要求极值的目标函数 (objective function) 为 f(x,... 阅读全文

posted @ 2012-02-06 08:58 emanlee 阅读(6538) 评论(0) 推荐(3)

最大熵原理/最大熵原则/最大熵模型(the maximum entropy principle,MEP)

摘要：最大熵原理是在1957 年由E.T.Jaynes 提出的，其主要思想是，在只掌握关于未知分布的部分知识时，应该选取符合这些知识但熵值最大的概率分布。因为在这种情况下，符合已知知识的概率分布可能不止一个。我们知道，熵定义的实际上是一个随机变量的不确定性，熵最大的时候，说明随机变量最不确定，换句话说，也就是随机变量最随机，对其行为做准确预测最困难。从这个意义上讲，那么最大熵原理的... 阅读全文

posted @ 2012-02-05 10:16 emanlee 阅读(3448) 评论(0) 推荐(1)

贝赛尔曲线

摘要：贝塞尔曲线又称贝兹曲线或贝济埃曲线，一般的矢量图形软件通过它来精确画出曲线，贝兹曲线由线段与节点组成，节点是可拖动的支点，线段像可伸缩的皮筋，我们在绘图工具上看到的钢笔工具就是来做这种矢量曲线的。当然在一些比较成熟的位图软件中也有贝塞尔曲线工具，如PhotoShop等。在Flash4中还没有完整的曲线工具，而在Flash5里面已经提供出贝塞尔曲线工具。贝塞尔曲线是应用于二... 阅读全文

posted @ 2012-02-03 13:18 emanlee 阅读(922) 评论(0) 推荐(0)

样条曲线 spline curves

摘要：所谓样条曲线是指给定一组控制点而得到一条曲线，曲线的大致形状由这些点予以控制，一般可分为插值样条和逼近样条两种，插值样条通常用于数字化绘图或动画的设计，逼近样条一般用来构造物体的表面。样条曲线是经过一系列给定点的光滑曲线。最初，样条曲线都是借助于物理样条得到的，放样员把富有弹性的细木条（或有机玻璃条），用压铁固定在曲线应该通过的给定型值点处，样条做自然弯曲所绘制出来的曲线就... 阅读全文

posted @ 2012-02-03 13:13 emanlee 阅读(4444) 评论(0) 推荐(0)

统计独立性和统计相关性

摘要：在随机信号分析中，不相关、正交、统计独立等是非常重要的，这里进一步讨论各自的严格概念和相互关系。当两个随机过程保持统计独立时，它们必然是不相关的，但反过来则不一定成立，即不相关的两个随机过程不一定能保持统计独立，唯有在高斯随机过程中才是例外。这就是说，从统计角度看，保持统计独立的条件要比不相关还要严格。另外，在确知信号分析中已知，内积为零可作为两个信号之间正交的定义。对于随机过程来说，除了... 阅读全文

posted @ 2012-01-31 20:38 emanlee 阅读(13552) 评论(0) 推荐(0)

rank sum test 秩和检验

摘要：秩和检验方法最早是由维尔克松(Wilcoxon)提出，叫维尔克松两样本检验法。后来曼—惠特尼将其应用到两样本容量不等(n1不等于n2)的情况，因而又称为曼—惠特尼U检验。这种方法主要用于比较两个独立样本的差异。 1、假设中的等价问题设有两个连续型总体, 它们的概率密度函数分别为： f1(x),f2(x)(均为未知) 已知f1(x) = f2(x − a)，a为末知常数，要检验... 阅读全文

posted @ 2011-12-17 11:41 emanlee 阅读(29706) 评论(0) 推荐(0)

线性判别式分析-LDA-Linear Discriminant Analysis

摘要：线性判别式分析(Linear Discriminant Analysis, LDA)，也叫做Fisher线性判别(Fisher Linear Discriminant ,FLD)，是模式识别的经典算法，它是在1996年由Belhumeur引入模式识别和人工智能领域的。线性判别式分析的基本思想是将高维的模式样本投影到最佳鉴别矢量空间，以达到抽取分类信息和压缩特征空间维数的效果，投影后保证模式样本在新... 阅读全文

posted @ 2011-12-16 23:00 emanlee 阅读(2027) 评论(0) 推荐(0)

回归分析

摘要：回归分析（regression analysis)是确定两种或两种以上变数间相互依赖的定量关系的一种统计分析方法。运用十分广泛，回归分析按照涉及的自变量的多少，可分为一元回归分析和多元回归分析；按照自变量和因变量之间的关系类型，可分为线性回归分析和非线性回归分析。如果在回归分析中，只包括一个自变量和一个因变量，且二者的关系可用一条直线近似表示，这种回归分析称为一元线性回归分析。如果回归分析中包括两... 阅读全文

posted @ 2011-08-06 15:38 emanlee 阅读(1930) 评论(0) 推荐(0)

贝叶斯网络(Bayesian network)

摘要：贝叶斯网络是一种概率网络，它是基于概率推理的图形化网络，而贝叶斯公式则是这个概率网络的基础。贝叶斯网络是基于概率推理的数学模型,所谓概率推理就是通过一些变量的信息来获取其他的概率信息的过程，基于概率推理的贝叶斯网络(Bayesian network)是为了解决不定性和不完整性问题而提出的，它对于解决复杂设备不确定性和关联性引起的故障有很的优势，在多个领域中获得广泛应用。贝叶斯网络又称信度网络，... 阅读全文

posted @ 2011-08-04 09:38 emanlee 阅读(7541) 评论(0) 推荐(0)

海森矩阵 Hessian matrix

摘要：二阶偏导数矩阵也就所谓的赫氏矩阵(Hessian matrix). 一元函数就是二阶导，多元函数就是二阶偏导组成的矩阵. 求向量函数最小值时用的，矩阵正定是最小值存在的充分条件。经济学中常常遇到求最优的问题，目标函数是多元非线性函数的极值问题尚无一般的求解方法，但判定局部极小值的方法是有的，就是用hessian矩阵，在x0点上，hessian矩阵是负定的，且各分量的一阶偏导数为0，则x0为极大... 阅读全文

posted @ 2011-08-03 15:26 emanlee 阅读(20132) 评论(0) 推荐(1)

众数

摘要：众数（Mode）统计学名词，在统计分布上具有明显集中趋势点的数值，代表数据的一般水平（众数可以不存在或多于一个）。修正定义：是一组数据中出现次数最多的数值，叫众数，有时众数在一组数中有好几个。用M表示。理性理解：简单的说，就是一组数据中占比例最多的那个数。 http://baike.baidu.com/view/170875.htm 阅读全文

posted @ 2011-07-24 20:42 emanlee 阅读(839) 评论(0) 推荐(0)

直线回归的概念

摘要：直线回归的概念直线回归(linear regreSSion)是用直线回归方程表示两个数量变量间依存关系的统计分析方法，属双变量分析的范畴。如果某一个变量随着另一个变量的变化而变化，并且它们的变化在直角坐标系中呈直线趋势，就可以用一个直线方程来定量地描述它们之间的数量依存关系，这就是直线回归分析。直线回归分析中两个变量的地位不同，其中一个变量是依赖另一个变量而变化的，因此分别称为因变量(depe... 阅读全文

posted @ 2011-07-24 19:50 emanlee 阅读(2133) 评论(0) 推荐(0)

最大期望算法

摘要：最大期望算法（Expectation-maximization algorithm，又译期望最大化算法）在统计中被用于寻找，依赖于不可观察的隐性变量的概率模型中，参数的最大似然估计。在统计计算中，最大期望（EM）算法是在概率（probabilistic）模型中寻找参数最大似然估计或者最大后验估计的算法，其中概率模型依赖于无法观测的隐藏变量（Latent Variable）。最大期望经常用在机器... 阅读全文

posted @ 2011-07-04 20:55 emanlee 阅读(2465) 评论(0) 推荐(0)

置换检验代码, matlab codes for permutation tests

摘要：Matlab 排列组合代码 COMBNTNS All possible combinations of a set of values c = COMBNTNS(choicevec,choose) returns all combinations of the values of the input 阅读全文

posted @ 2011-06-28 17:41 emanlee 阅读(3613) 评论(0) 推荐(0)

Scale parameter 尺度参数

摘要：In probability theory and statistics, a scale parameter is a special kind of numerical parameter of a parametric family of probability distributions. The larger the scale parameter, the more spread out the distribution.If a family of probability distributions is such that there is a parameter s (and 阅读全文

posted @ 2011-06-26 18:50 emanlee 阅读(1470) 评论(0) 推荐(0)

Location parameter 位置参数

摘要：In statistics, a location family is a class of probability distributions parametrized by a scalar- or vector-valued parameter μ, which determines the "location" or shift of the distribution. Formally, this means that the probability density functions or probability mass functions in this c 阅读全文

posted @ 2011-06-26 18:35 emanlee 阅读(779) 评论(0) 推荐(0)

Shape parameter 形状参数

摘要：In probability theory and statistics, a shape parameter is a kind of numerical parameter of a parametric family of probability distributions. A shape parameter is any parameter of a probability distri... 阅读全文

posted @ 2011-06-26 18:18 emanlee 阅读(2226) 评论(0) 推荐(0)

Goodness-of-fit tests for the generalized pareto distribution.

摘要：Abstract: Tests of fit are given for the generalized Pareto distribution (GPD) based on Cramer-von Mises statistics. Examples are given to illustrate the estimation techniques and the goodness-of-fit ... 阅读全文

posted @ 2011-06-21 07:47 emanlee 阅读(1214) 评论(0) 推荐(0)

随笔分类 - [13] 数学/数理统计