用python第三方库xlwt解决数据提取后存到execl
在做文本处理的时候需要将txt里的部分文件提取到execl中,因为刚开始学python不太熟悉,正则表达式也是初学,是一头雾水,就度娘了一下,别人都提到xlwt是处理excel文本极好的,而且百度知道上的截取字段到execl的程序也用到了xlwt,就度娘到xlwt的下载地址:
https://pypi.python.org/pypi/xlwt/#downloads
此地址如果不容易下的话可到百度盘下载:
http://pan.baidu.com/s/1mg8ED2g 里面是xlwt-1.0.0
当时搜到百度知道作为参考的程序地址找不到了,贴下他的部分程序:
#!/usr/bin/python import xlwt wb = xlwt.Workbook() ws = wb.add_sheet('shujue') f = open(r'e:\shuju.txt') x = f.readline() y = x.split() print (y)上面是读取一行shuju.txt里面的内容,然后以行里面的空格分割成几个字串,然后组成一个list就是y,然后把y打印出来,有参考了xlwt下载页面的Quick Start:
import xlwt from datetime import datetime style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on', num_format_str='#,##0.00') style1 = xlwt.easyxf(num_format_str='D-MMM-YY') wb = xlwt.Workbook() #? ws = wb.add_sheet('A Test Sheet') #新建一个execl sheet ws.write(0, 0, 1234.56, style0) #把1234.56以style0的格式放到excel中的第一行的第一列中 ws.write(1, 0, datetime.now(), style1) #把现在的时间以style1的格式放到第二行的第一列中 ws.write(2, 0, 1) #把1放到第三行的第一列中 ws.write(2, 1, 1) #把1放到第三行的第二列中 ws.write(2, 2, xlwt.Formula("A3+B3")) #把第三行的第一列和第二列相加再放到第三行的第三列中 wb.save('example.xls') #保存到examle.xls中
结合上面再结合python的一些基础知识,如列表元素的遍历方法,for循环以及一些比较就能完成基本的数据截取。
假设我的shuju.txt的文件中有成对的[]和()将某些数据分割开:如
hell [] tianya dongci daci [] () love me love my dog good morning ()[] see hello to () [] every aaa () hehe cocos python () [] very good ding ling [] () dingling () ling ling da da de () [] ma ti我要把把()或[]出现第一次后把后面的数据给截取出来,放到excel中,并要求()和[]起始的要不同编号,程序如下:
#!/usr/bin/python import xlwt style0 = xlwt.easyxf('font: name Times New Roman, color-index red, bold on')#红色字体,加粗 wb = xlwt.Workbook() ws = wb.add_sheet('A Test Sheet', cell_overwrite_ok=True) #cell...=True是防止重复操作一个单元格报错 f = open(r'e:\shuju.txt') loop = 0 #控制写入execl的行 loop_test = 0 #控制以[]开始的出现的次序 loop_sub = 0 #控制以()开始出现的次序 temp_str = "" #做缓存的字符串,循环添加空格用到 loop_zk = 0 #控制截取字符串的范围 for j in range(300): #txt文件要小于300行 x = f.readline() #读取一行数据 y = x.split() #以空格分割为若干字符串 for i in y: loop_zk += 1 #记录()或[]出现在列表的哪个位置,便于截取后面的数据 if ((i == "[]") or (i == "()")) and (len(y) > loop_zk): #(len(y)>loop_zk)来保证()和[]后面还有数据 if(i == "[]"): loop_test += 1 ws.write(loop, 0, loop_test, style0) for s in y[loop_zk:]: temp_str += (s + " ") ws.write(loop, 1, temp_str, style0) elif(i == "()"): loop_sub += 1 ws.write(loop, 0, loop_sub) for s in y[loop_zk:]: temp_str += (s + " ") ws.write(loop, 1, temp_str) loop += 1 #excel写入位置移动一行 temp_str = "" #temp_str清空 break #找到一个()或[]后就跳出此行的搜索 loop_zk = 0 #()和[]位置清零 wb.save('e:\shuju.xls') #将数据存到execl中运行结果如下:
ok~~~~
不负自己