如何用Python将Excel表格中的汉字转换成拼音

最近有个项目需要将excel表格中的汉字转换成拼音,看到几万行的数据,一个一个手动输入貌似是不大合适(猴年马月能完成。。。)于是灵机一动可不可以使用python来完成这个任务呢?接下来就是查找相关的实现代码,终于功夫不负有心人,让我找到了一个大侠的笔记,接下来分享给大家,供有需要的小伙伴使用

import pandas as pd 
import pypinyin


io="area.xls"  #定义一个字符串用来保存地址
df =pd.read_excel(io,sheet_name=0,header=0)  #阅读这个表格并将这个DataFrame类型的数据保存在df里

#定义两个空列表
lst=[]
lst1=[]

for a in range(0,len(df)):  #使用for循环遍历这个表格数据
    a=df['姓名'][a]
    s=''
    #将每一行的名字遍历得到单独的汉字并转换为没有音标的拼音
    for i in pypinyin.pinyin(a, style=pypinyin.NORMAL):
        #再将单独的汉字合并回去
        s += ''.join(i)

    lst1=[a,s]      #将名字和拼音保存到列表
    lst.append(lst1)    #将这些大的列表合并到一个大的列表中
    #将lst集合转换为DataFrame型加上姓名和拼音两个表头
af = pd.DataFrame(lst, columns=['姓名','拼音'])
#将这个表格输出到下列地址的文件中,如果没有此xlsx文件会自动创建
af.to_excel("abd.xlsx",index=False,sheet_name='Sheet1')

重点需要注意的几个地方就是安装几个库

pandas pypinyin xlrd (最后这个这个虽然没有引用但是是需要安装滴)

接下来就是见证奇迹的时刻了

posted @ 2023-10-17 17:59  知数网络  阅读(51)  评论(0编辑  收藏  举报  来源