2013 年 1月 14 日随笔档案 - haolujun

2013年1月14日

摘要：介绍一个概率检索模型-二值独立模型。这个模型我自认为比较扯淡，如有大神在可以指点一下。这个模型用了N多个假设。假设1：词项之间的出现是相互独立的。这样文档和查询都可以向量化，如下：当词项t出现在文档或查询中，则xt或qt的值为1，否则为0。由于我们假设词项出现是相互独立的，并且向量取值只取0,1两个值，故这个模型就叫做二值独立模型。那么这个模型是如何进行文档检索以及排序的呢，接下来就详细介绍一下。给定一个查询Q，文档D与Q相关的概率可以用P(R=1|(D,Q))表示，不相关的概率可用P(R=0|(D,Q))表示。，。那么我们自然能想到一个可以用来进行排序的指标：P(R=1|(D,Q))，但是实阅读全文

posted @ 2013-01-14 15:49 haolujun 阅读(3361) 评论(0) 推荐(0) 编辑

haolujun

大智大愚

公告