摘要: 中文分词技术属于自然语言处理技术范畴,对于一句话,人可以通过自己的知识来明白哪些是词,哪些不是词,但如何让计算机也能理解?其处理过程就是分词算法。现有的分词算法可分为三大类:基于词典的分词方法、基于统计的方法、基于规则的方法。 1 基于词典的分词方法(字符串匹配,机械分词方法) 定义:按照一定策略将 阅读全文
posted @ 2021-03-30 16:57 早起的小虫子 阅读(1442) 评论(0) 推荐(0) 编辑