会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
屌丝眼里看金融
从互联网到金融
博客园
首页
新随笔
联系
订阅
管理
2012年1月10日
LSA/PLSA
摘要: 引子 Bag-of-Words 模型是NLP和IR领域中的一个基本假设。在这个模型中,一个文档(document)被表示为一组单词(word/term)的无序组合,而忽略了语法或者词序的部分。BOW在传统NLP领域取得了巨大的成功,在计算机视觉领域(Computer Vision)也开始崭露头角,但在实际应用过程中,它却有一些不可避免的缺陷,比如: 稀疏性(Sparseness): 对于大词典,...
阅读全文
posted @ 2012-01-10 10:08 哈度普
阅读(2184)
评论(0)
推荐(0)
编辑
公告