摘要: python分词模块,基于mmseg算法编写,核心代码c++,提供python接口。最近在做BUG质量分析的时候,要提取BUG关键词,正好用到的pymmseg这分词模块,分词的效率还不错。Code Example: #-*- coding: utf-8 -*-from pymmseg import mmsegimport osimport sysdef CWS_pymmseg(shortdeslist,wordlist): if os.path.isfile(shortdeslist): mmseg.dict_load_defaults() sd = open... 阅读全文
posted @ 2012-03-20 22:33 地瓜日记 阅读(678) 评论(0) 推荐(0) 编辑
摘要: 2012 需要一种智慧。2012 需要一种智慧。2012 需要一种智慧。2012 需要一种智慧。 阅读全文
posted @ 2012-02-10 20:59 地瓜日记 阅读(68) 评论(0) 推荐(0) 编辑