学习搜索引擎知识部分摘录
摘要:
中文分词技术把中文的汉字序列切分成有意义的词,就是中文分词,有些人也称为切词。现有的分词算法可分为三大类:基于字符串匹配的分词方法、基于理解的分词方法和基于统计的分词方法。关于搜索引擎的一个站点:http://www.stlchina.org/twiki/bin/view.pl/Main/SECrawlerWeb中文搜索引擎的“准”,需要保证搜索的前几十条结果都和搜索词十分相关,这 需由“分词技术... 阅读全文
posted @ 2007-03-29 17:31 flashicp 阅读(370) 评论(0) 推荐(0) 编辑