清明搞了一天分词搜索

        今天是清明本来打算回家了,后来想了想发现回家也没什么意思,就不回了,在实验室呆了一天研究了一天的中文分词,终于也找到了一个开源的中文分词,这个中文分词是继承自Lucence的分词包。因为Lucence的中文分词效果不好,只是对中文简单的拆分没有什么实际效果。这个开源的分词包叫“庖丁解牛”分词的效率还是不错的,今天看了一下它的原理感觉还是很好的,打算明天写个测试代码试试。
posted @ 2008-04-05 00:27  yiling  阅读(602)  评论(2编辑  收藏  举报