python的jieba分词词性标注(转载)
http://blog.csdn.net/li_31415/article/details/48660073
结巴分词可以增加自定义词典
import jieba
jieba.add_word("和其正")
jieba.add_word("酒鬼酒")
jieba.add_word("哈尔滨啤酒")
或
-词典格式:一个词一行:词语,词频(可省略),词性(可省略),用空格隔开,顺序不可颠倒。UTF-8编码。
jieba.load_userdict('D:/work/test2/word.txt')