如何用Python将Excel表格中的汉字转换成拼音
最近有个项目需要将excel表格中的汉字转换成拼音,看到几万行的数据,一个一个手动输入貌似是不大合适(猴年马月能完成。。。)于是灵机一动可不可以使用python来完成这个任务呢?接下来就是查找相关的实现代码,终于功夫不负有心人,让我找到了一个大侠的笔记,接下来分享给大家,供有需要的小伙伴使用
import pandas as pd
import pypinyin
io="area.xls" #定义一个字符串用来保存地址
df =pd.read_excel(io,sheet_name=0,header=0) #阅读这个表格并将这个DataFrame类型的数据保存在df里
#定义两个空列表
lst=[]
lst1=[]
for a in range(0,len(df)): #使用for循环遍历这个表格数据
a=df['姓名'][a]
s=''
#将每一行的名字遍历得到单独的汉字并转换为没有音标的拼音
for i in pypinyin.pinyin(a, style=pypinyin.NORMAL):
#再将单独的汉字合并回去
s += ''.join(i)
lst1=[a,s] #将名字和拼音保存到列表
lst.append(lst1) #将这些大的列表合并到一个大的列表中
#将lst集合转换为DataFrame型加上姓名和拼音两个表头
af = pd.DataFrame(lst, columns=['姓名','拼音'])
#将这个表格输出到下列地址的文件中,如果没有此xlsx文件会自动创建
af.to_excel("abd.xlsx",index=False,sheet_name='Sheet1')
重点需要注意的几个地方就是安装几个库
pandas pypinyin xlrd (最后这个这个虽然没有引用但是是需要安装滴)
接下来就是见证奇迹的时刻了