摘要: 因为在研究上篇pLSA中运用到likelihood function,而且对其中的 likelihood function 倍感困惑。所以另开一篇,专讲likelihood function。参考来自wikipedia:http://en.wikipedia.org/wiki/Likelihood_function在统计学中,likelihood function是一个非常重要的量,在统计推断、参数估计中扮演着重要的角色。Likelihood function是一个基于统计模型中的参数的函数,注意变量是 parameter 参数,而不是variables。在wikipedia中,有thelik 阅读全文
posted @ 2012-08-27 16:48 YYNicholas 阅读(1629) 评论(0) 推荐(0) 编辑
摘要: Probabilistic Latent Semantic Analysis 实际上是对PCA在LSA这个应用上的一个概率上的延展。PCA中并未给出对于数据的任何假设,是否为同一分布的随机抽样,是否数据的每一维都相互独立,等等。但如果数据存在某种分布,则PCA没有办法予以利用。而且PCA没有一个稳固的概率解释,也让人颇为遗憾。除此之外,PCA在处理 latent semantic analysis 时没有办法处理一词多义 polysymy 现象,就是没有办法将一个词分列入两个阵营,所以很遗憾。而且在大规模的 latent semantic analysis 中,由于词汇量巨大,使得文章x词汇的 阅读全文
posted @ 2012-08-27 01:40 YYNicholas 阅读(1113) 评论(0) 推荐(0) 编辑