模块jieba库的使用

一 jieba库基本介绍

jieba库是优秀的中文分词第三方库

pip install jieba (cmd命令行)

jieba分词依靠中文词库

import jieba

txt = '中国，是以华夏文明为源泉、中华文化为基础，并以汉族为主体民族的多民族国家，通用汉语、汉字，汉族与少数民族被统称为“中华民族”，又自称为炎黄子孙、龙的传人。'

# 精确模式

# res = jieba.cut(txt) # 获取可迭代对象

res = jieba.lcut(txt) # 生成的是一个列表

# 全模式

# res1 = jieba.cut(txt, cut_all=True) # 获取可迭代对象

res1 = jieba.lcut(txt, cut_all=True) # 生成的是一个列表

# 搜索引擎模式

# res2 = jieba.cut_for_search(txt) # 获取可迭代对象

res2 = jieba.lcut_for_search(txt) # # 生成的是一个列表

# for i in res2:

print(res2)

posted on 2019-10-28 19:42 Everuse 阅读(309) 评论(0) 编辑收藏举报

刷新页面返回顶部