python的jieba分词词性标注(转载)

  http://blog.csdn.net/li_31415/article/details/48660073

  结巴分词可以增加自定义词典

  

import  jieba
jieba.add_word("和其正")
jieba.add_word("酒鬼酒")
jieba.add_word("哈尔滨啤酒")

-词典格式:一个词一行:词语,词频(可省略),词性(可省略),用空格隔开,顺序不可颠倒。UTF-8编码。
jieba.load_userdict('D:/work/test2/word.txt')

 

posted on 2018-01-18 14:16  shaomine  阅读(2235)  评论(0编辑  收藏  举报