摘要: 在那篇2003年发表的文章之前,pLSI提出了每个word是有一个特定的topic也就是主题产生的,而word可以看做是每个document的样本,于是我们不难可以认为每个document是不同的主题在其上的一个近似的一个概率分布。同时,有两个前提。第一,document以及word的顺寻是可以交换并且是可以忽略的。第二,可交换性不以为着各个元素之间是完全独立的,而是条件性的独立。由以上两条,就可以引出LDA。其实,在我看来这是一种存在弱相互联系的概率分布。而后来我通过查资料了解发现潜在的狄利克雷分布正是强调的这一点。但是LDA具体的推到还是不能很好地看懂。 Gibbs采样在我推测看来可... 阅读全文
posted @ 2012-07-13 15:01 Today makes Tomorrow 阅读(2455) 评论(0) 推荐(0) 编辑