最近遇到一个问题,需要将一批中文用户名转换成拼音,网上查了一下,有两个模块可以使用,pypinyin和xpinyin模块,用起来也很方便。
一、pypinyin模块
1、安装
pip3 install pypinyin
2、转换
from pypinyin import pinyin print(pinyin('张三')) [['zhāng'], ['sān']]
可以看到结果是一个二维列表,每个元素都是一个列表,并且包含了每个字的读音。
如果是多音字,比如 “朝阳”,默认只能识别其中一个读音 from pypinyin import pinyin print(pinyin('朝阳')) [['zhāo'], ['yáng']] 如果想要显示多个读音的话,只需添加 heteronym参数并设置为True: from pypinyin import pinyin print(pinyin('朝阳', heteronym=True)) [['zhāo', 'cháo'], ['yáng']]
3、其实多数情况下我们是不需要管多音字的,我们只是用它来转换一下名字而已,而处理上面的二维数组又比较麻烦,那么可以使用lazy_pinyin这个方法来生成
from pypinyin import lazy_pinyin name_list = [ '张三', '李四', '小六子' ] for name_zh in name_list: # 将每个中文汉字转换成拼音,组成列表 name_pinyin_list = lazy_pinyin(name_zh) # print(name_pinyin_list) ''' ['zhang', 'san'] ['li', 'si'] ['xiao', 'liu', 'zi'] ''' name_pinyin = '' # 将拼音拼接到一起 for i in name_pinyin_list: name_pinyin += i print(name_pinyin) ''' zhangsan lisi xiaoliuzi '''
二、xpinyin模块
from xpinyin import Pinyin p = Pinyin() # 实例拼音转换对象 re1 = p.get_pinyin('小姐姐真可爱',tone_marks=None,splitter=' ') #转换,不显示声调,使用空格作为分隔符。 #其中tone_marks指定是否带声调,默认为None;splitter指定分隔符,默认为'-'。 re2 = p.get_pinyin('小姐姐真可爱',tone_marks='marks',splitter=' ') #转换,显示声调。 re3 = p.get_pinyin('小姐姐真可爱',tone_marks='numbers',splitter=' ') #转换,显示声调数字。 p.get_initials("小姐姐真可爱",splitter=' ') #获取首字母 print(re1,re2,re3) #打印
分类:
python第三方模块
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 分享一个免费、快速、无限量使用的满血 DeepSeek R1 模型,支持深度思考和联网搜索!
· 25岁的心里话
· 基于 Docker 搭建 FRP 内网穿透开源项目(很简单哒)
· 闲置电脑爆改个人服务器(超详细) #公网映射 #Vmware虚拟网络编辑器
· ollama系列01:轻松3步本地部署deepseek,普通电脑可用