摘要: 今天,翻出了我以前在本科阶段写的一些论文,虽然有几篇没有发表。突然发现很多还是比较实用,虽然学术价值并不是很大,于是我重新整理了下,用最简单的方式,摘要了部分出来拼成此文,当然拼的原料都是自己的,本文适合初学者,如若转载,请著名版权。 中文分词已经是老调重弹的话题了,传统的基于词库的分词技术应该是目前最基本的分词技术,在这里我不去深入挖掘,什么好什么不好的问题,今天我只想根据我自己的经验,来设计和实现一套中文分词与词性分析的一套系统,系统其实已经实现与Iveely Search Engine中。 我们采用隐马尔可夫模型(HMM)来实现中文分词和词性分析。在使用HMM之前,我们先了解下H... 阅读全文
posted @ 2013-01-07 23:26 Iveely Liu 阅读(5637) 评论(6) 推荐(7) 编辑