遍历两个pandas列 iterate through two pandas columns
使用for filePath,content in corpos.itertuples(index=False)遍历两行数据
问题:在遍历pandas进行分词时,并将修改后的文本写入源文件
一开始使用for content in corpos['content'],
虽然content有遍历,但是filePath在for循环中,始终停留在corpos的最后一行filepath,并未能遍历成功。
经修改后:
#-------------------------------------------------建立corpos corpos = pandas.DataFrame(columns=['filePath','content'] #-------------中间corpos存入数据的过程省略 #-------------分词并修改文本 t='/' for filePath,content in corpos.itertuples(index=False): f = codecs.open(filePath,'r','utf-8') cont=f.read() f.close() gai='' segs=jieba.cut(content) for seg in segs: if seg ==' ' or seg =="\r\n" or seg==' ' or seg=='': gai=gai+seg else: gai=gai+seg+t cont=gai[2:] f = codecs.open(filePath,'w','utf-8') f.write(cont) f.flush() f.close()
参考链接:http://stackoverflow.com/questions/15125343/how-to-iterate-through-two-pandas-columns
生活不易,本人有意向做数据分析兼职或python在线辅导,如有需要请联系qq号1334832194。