2011年10月31日
摘要: 首先,我以前总结过,关于北邮一个人写的导读,连接在这里。肯定得看Blei 2003年的论文,点击下载。然后很重要的Blei的视频和一个80多页的Lecture。Topic ModelsLatent Dirichlet Allocation(LDA) [pdf]模型是近年来提出的一种具有文本主题表示能力的非监督学习模型。关键所在:it posits that each document is a mixture of a small number of topics and that each word’s creation is attributable to one of the docum 阅读全文
posted @ 2011-10-31 16:11 COS 阅读(521) 评论(0) 推荐(1) 编辑
摘要: 又是碰到了一些简单的基本概念,但是仔细想想发现自己没有理解透彻,Search一下,总结如下:【摘要】- 生成模型:无穷样本==》概率密度模型 = 产生模型==》预测- 判别模型:有限样本==》判别函数 = 预测模型==》预测【简介】简单的说,假设o是观察值,q是模型。如果对P(o|q)建模,就是Generative模型。其基本思想是首先建立样本的概率密度模型,再利用模型进行推理预测。要求已知样本无穷或尽可能的大限制。这种方法一般建立在统计力学和bayes理论的基础之上。如果对条件概率(后验概率) P(q|o)建模,就是Discrminative模型。基本思想是有限样本条件下建立判别函数,不考虑 阅读全文
posted @ 2011-10-31 16:09 COS 阅读(1570) 评论(0) 推荐(0) 编辑