08 2014 档案

摘要:Luke是一个用于Lucene搜索引擎的第三方工具,它可以访问现有Lucene的索引,并允许您显示和修改。可以看每篇文档建立了哪些索引,验证有没有成功建立了索引。不然建立了,不能确定有没有成功。可以用luke看文章怎么分的词。当搜索query过来以后,query也会被分词,拿这个分好的词去索引中查询... 阅读全文
posted @ 2014-08-20 22:23 楠小楠 阅读(530) 评论(0) 推荐(0) 编辑
摘要:文/顾森 对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/结婚/的/和尚/未/结婚/的”呢? 这就是所谓的分词歧义难题。不过,现在很多语言... 阅读全文
posted @ 2014-08-18 15:16 楠小楠 阅读(1322) 评论(2) 推荐(0) 编辑
摘要:1、关系越好的,往往是最爱损你的和他们说话时,你总是能自动屏蔽那些不爱听的。你的毛病他们永远比你更清楚。碰到你以前喜欢过的人,他们总是特别激动地喊你快看快看。有了小秘密,总是第一个想跟他们分享。其实最关心你的,永远是那个最爱打击你的。2、越害怕的事情越容易发生口袋装着刚买的手机,在公车上生怕被盗,每... 阅读全文
posted @ 2014-08-01 10:42 楠小楠 阅读(441) 评论(0) 推荐(0) 编辑