分词-1

复制代码
# encoding=utf-8
import jieba
 
jieba.enable_paddle()# 启动paddle模式。
strs=["我关注了数据STUDIO","我是数据分析师","四川大学"]
for str in strs:
    seg_list = jieba.cut(str,use_paddle=True) # 使用paddle模式
    print("Paddle Mode: " + '/'.join(list(seg_list)))
 
seg_list = jieba.cut("我毕业于四川大学,我关注了数据STUDIO", cut_all=True)
print("Full Mode: " + "/ ".join(seg_list))  # 全模式
 
seg_list = jieba.cut("我毕业于四川大学,我关注了数据STUDIO", cut_all=False)
print("Default Mode: " + "/ ".join(seg_list))  # 精确模式
 
seg_list = jieba.cut("他来到了网易杭研大厦")  # 默认是精确模式
print(", ".join(seg_list))
 
seg_list = jieba.cut_for_search("我是云朵君,我关注了数据STUDIO")  # 搜索引擎模式
print(", ".join(seg_list))
复制代码

Paddle enabled successfully......
Paddle Mode: 我/关注/了/数据/STUDIO
Paddle Mode: 我/是/数据/分析师
Paddle Mode: 四川大学
Full Mode: 我/ 毕业/ 于/ 四川/ 四川大学/ 大学/ ,/ 我/ 关注/ 了/ 数据/ STUDIO
Default Mode: 我/ 毕业/ 于/ 四川大学/ ,/ 我/ 关注/ 了/ 数据/ STUDIO
他, 来到, 了, 网易, 杭研, 大厦
我, 是, 云朵, 君, ,, 我, 关注, 了, 数据, STUDIO

posted @   小张睡醒了  阅读(5)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· winform 绘制太阳,地球,月球 运作规律
· AI与.NET技术实操系列(五):向量存储与相似性搜索在 .NET 中的实现
· 超详细:普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 【硬核科普】Trae如何「偷看」你的代码?零基础破解AI编程运行原理
· 上周热点回顾(3.3-3.9)
点击右上角即可分享
微信分享提示