摘要:
背景是这样的,留给自己看: 由于今年工作不好找,大家都走上了人人都当程序员的道路。(本来不是人人都是产品经理嘛?? p.s. 这是2016年春) 本人可以说对编程从来没有系统学过,都是写论文做实验的时候需要用什么就现学的那种,只在本科上课的课堂上了解过编程的基本思想 以前只写过java,把编程当作是 阅读全文
摘要:
在文本分类中,用于特征选择的统计量主要有这些:特征频度(term frequency,tf)原理是:低频的往往对分类影响不大,从而可以被排除掉。同时,不是所以高频都是影响大的,比如在文本中分布均匀的高频的贡献是不大的。应用: 主要用在文本标引时直接删除某些低频特征 2. 文本频度(documen... 阅读全文
摘要:
一、发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distributed IR expert finding passage retrieval web search g 阅读全文