摘要: 今天是清明本来打算回家了,后来想了想发现回家也没什么意思,就不回了,在实验室呆了一天研究了一天的中文分词,终于也找到了一个开源的中文分词,这个中文分词是继承自Lucence的分词包。因为Lucence的中文分词效果不好,只是对中文简单的拆分没有什么实际效果。这个开源的分词包叫“庖丁解牛”分词的效率还是不错的,今天看了一下它的原理感觉还是很好的,打算明天写个测试代码试试。 阅读全文
posted @ 2008-04-05 00:27 yiling 阅读(602) 评论(2) 推荐(0) 编辑