python爬虫操作excel
1.xlwt 写入xls文件内容
import xlwt book = xlwt.Workbook() # 新建工作簿 table = book.add_sheet('Over',cell_overwrite_ok=True) # 如果对同一单元格重复操作会发生overwrite Exception,cell_overwrite_ok为可覆盖 sheet = book.add_sheet('Test') # 添加工作页 sheet.write(1,1,'A') # 行,列,属性值 (1,1)为B2元素,从0开始计数 style = xlwt.XFStyle() # 新建样式 font = xlwt.Font() #新建字体 font.name = 'Times New Roman' font.bold = True style.font = font # 将style的字体设置为font table.write(0,0,'Test',style) book.save(filename_or_stream='excel_test.xls') # 一定要保存
2.xlrd读取xls文件内容
import xlrd data = xlrd.open_workbook('excel_test.xls') print(data.sheet_names()) # 输出所有页的名称 table = data.sheets()[0] # 获取第一页 table = data.sheet_by_index(0) # 通过索引获得第一页 table = data.sheet_by_name('Over') # 通过名称来获取指定页 nrows = table.nrows # 为行数,整形 ncolumns = table.ncols # 为列数,整形 print(type(nrows)) print(table.row_values(0))# 输出第一行值 为一个列表 # 遍历输出所有行值 for row in range(nrows): print(table.row_values(row)) # 输出某一个单元格值 print(table.cell(0,0).value) print(table.row(0)[0].value)
3.综合使用python-excel三大模块完成Excel内容追加写入
import xlwt,xlrd from xlutils.copy import copy data = xlrd.open_workbook('excel_test.xls',formatting_info=True) excel = copy(wb=data) # 完成xlrd对象向xlwt对象转换 excel_table = excel.get_sheet(0) # 获得要操作的页 table = data.sheets()[0] nrows = table.nrows # 获得行数 ncols = table.ncols # 获得列数 values = ["E","X","C","E","L"] # 需要写入的值 for value in values: excel_table.write(nrows,1,value) # 因为单元格从0开始算,所以row不需要加一 nrows = nrows+1 excel.save('excel_test.xls')
4.写入数据
import json import xlwt import requests url = 'http://www.kfc.com.cn/kfccda/ashx/GetStoreList.ashx?op=keyword' data = { 'cname': '', 'pid': '', 'keyword': '上海',# 查询城市 'pageIndex':'1', # 显示第几页的数据 'pageSize': '100', # 一页显示多少数据 } headers = { 'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36' } # 请求网址 response = requests.post(url=url,data=data,headers=headers) # 反序列化 dic = json.loads(response.text) title = ["storeName","addressDetail","pro","provinceName","cityName"] li = [] # 获取数据 for i in dic["Table1"]: storeName = i["storeName"] addressDetail = i["addressDetail"] pro= i["pro"] provinceName = i["provinceName"] cityName = i["cityName"] li.append([storeName,addressDetail,pro,provinceName,cityName]) #新建一个excel对象 wbk = xlwt.Workbook() #添加一个名为stu的sheet页 sheet = wbk.add_sheet('stu') # 写入表头 for i in range(len(title)): # 从0行i列写入标题 sheet.write(0,i,title[i]) # 写入数据 for i in range(len(li)): # 如果不是表头的话 if i!=0: # 循环写入数据 for j in range(len(title)): sheet.write(i,j,li[i][j]) wbk.save('szz.xls') print("下载成功")