摘要: 背景是这样的,留给自己看: 由于今年工作不好找,大家都走上了人人都当程序员的道路。(本来不是人人都是产品经理嘛?? p.s. 这是2016年春) 本人可以说对编程从来没有系统学过,都是写论文做实验的时候需要用什么就现学的那种,只在本科上课的课堂上了解过编程的基本思想 以前只写过java,把编程当作是 阅读全文
posted @ 2016-04-01 14:19 betterSN 阅读(597) 评论(1) 推荐(0) 编辑
摘要: 在文本分类中,用于特征选择的统计量主要有这些:特征频度(term frequency,tf)原理是:低频的往往对分类影响不大,从而可以被排除掉。同时,不是所以高频都是影响大的,比如在文本中分布均匀的高频的贡献是不大的。应用: 主要用在文本标引时直接删除某些低频特征 2. 文本频度(documen... 阅读全文
posted @ 2015-03-20 11:50 betterSN 阅读(1719) 评论(0) 推荐(0) 编辑
摘要: 一、发展 起源:统计语言模型起源于 Ponte 和 Croft 在 1998年的 SIGIR上发表的论文 应用:语言模型的应用很多: corsslingual retrieval distributed IR expert finding passage retrieval web search g 阅读全文
posted @ 2015-03-20 11:30 betterSN 阅读(309) 评论(0) 推荐(0) 编辑
摘要: 一直想坚持用博客,曾经也试图开始,申请了几个,试用了几个。今天突发奇想再次启用,但发现竟然不记得我注册是哪一个了??突然浮现博客园,一百度果然有这个博客,一登录竟然没有注册过!! SO,果断选择这个了,纪念一下哈哈 阅读全文
posted @ 2015-03-03 14:43 betterSN 阅读(146) 评论(1) 推荐(0) 编辑