主要分为两大类 1. 字符串匹配(扫描字符串),发现子串与词匹配,就算是匹配 这类分词通常加入一些启发式规则,比如“正向/反向最大匹配”,“长词优先”等策略。 优点:速度快、O(n)时间复杂度。 缺点:歧义和未登陆词处理不好。 歧义的例子很简单"长春市/长春/药店" "长春/市长/春药/店". 未登 Read More
posted @ 2017-12-27 11:10 明将军 Views(1576) Comments(0) Diggs(0) Edit
恨怨悲苦憎怒嗔、仁爱慈孝耻义廉。是故恨人所以得仁,无爱者必不怨,不慈者必无悲,孝而有苦,憎后耻来,义自怒生,廉人心嗔。夹天地七大苦,破人情七大碍,遂舍善恶之心,得称剑神。