项目需要,需要分词外加情感分析,网上的很多直接用的情感分析不适合本项目,因此需要修改情感词典从而加以修正。本次使用的就是pynlpir进行分词,然后情感分析逻辑自己搞。
先跑几个小demo,可以试一试效果
相关简短介绍:
NLPIR分詞系統前身為2000年發布的ICTCLAS詞法分析系統,從2009年開始,為了和以前工作進行大的區隔,並推廣NLPIR自然語言處理與信息檢索共享平臺,調整命名為NLPIR分詞系統。
其主要的功能有中文分詞,標註詞性和獲取句中的關鍵詞。
主要用到的函數有兩個:
pynlpir.segment(s, pos_tagging=True, pos_names=‘parent‘, pos_english=True)
pynlpir.get_key_words(s, max_words=50, weighted=False)
分詞:pynlpir.segment(s, pos_tagging=True, pos_names=‘parent‘, pos_english=True)
S: 句子
pos_tagging:是否進行詞性標註
pos_names:顯示詞性的父類(parent)還是子類(child) 或者全部(all)
pos_english:詞性顯示英語還是中文
获取关键词:pynlpir.get_key_words(s, max_words=50, weighted=False)
s: 句子
max_words:最大的關鍵詞數
weighted:是否顯示關鍵詞的權重