python操作excel之openpyxl
前言: 下面介绍的用python对excel的简单读写操作,不涉及复杂功能.
1. 支持excel格式
- xlsx
- xlsm
- xltx
- xltm
2. 基本用法
首先介绍下Excel的一些基本概念,Workbook相当于是一个文件,WorkSheet就是文件里面的每个具体的表,比如新建Excel文件里面的'Sheet1'这个,一个Workbook里面有一个或多个WorkSheet.
2.1 操作Workbook对象
获取Workbook对象的方式有两种,一种是创建一个新的,还有就是导入一个已存在的。
2.1.1 获取Workbook对象
Method1: 创建Workbook
# 导入模块 from openpyxl import Workbook # 创建一个Workbook wb = Workbook() #默认生成一个名为'Sheet'的WorkSheet
Method2: 导入已有的Workbook
from openpyxl import load_workbook # 导入一个Workbook wb = load_workbook(filename = './empty_book.xlsx') #路径
2.1.2 Workbook属性
#sheetnames: #返回所有WorkSheet的名字列表,类型为list #worksheets: #返回所有WorkSheet的列表,类型为list #active: #返回当前默认选中的WorkSheet import openpyxl wb = openpyxl.load_workbook('./白宝乡贫困劳动力核实(霞头).xlsx') #加载已有的文件 print(wb.sheetnames) print(wb.worksheets) print(wb.active)
2.2.3 Workbook方法
get_sheet_names(): 同sheetnames #不建议使用 get_active_sheet(): 同active属性 #不建议使用 get_sheet_by_name(name):根据名称获取WorkSheet #不建议使用 remove(worksheet): 删除一个WorkSheet,注意是WorkSheet对象,不是名字 save(filename): 保存到文件,记住有写入操作记得保存!!!
2.2 操作WorkSheet
2.2.1 获取WorkSheet对象
# 获取默认打开的(active)的WorkSheet ws1 = wb.active # 创建一个WorkSheet ws2 = wb.create_sheet() # 可传title和index两个参数,不传生成的WorkSheet名在'Sheet'后面递增加数字 # 通过名称获取WorkSheet ws3=wb['Sheet1']
2.2.2 WorkSheet属性
rows: 返回所有有效数据行,有数据时类型为generator,无数据时为tuple
columns:返回所有有效数据列,类型同rows
max_column:有效数据最大列
max_row:有效数据最大行
min_column:有效数据最小列,起始为1
min_row:有效数据最大行,起始为1
values:返回所有单元格的值的列表,类型为tuple
title:WorkSheet的名称
2.2.3 WorkSheet方法
cell(coordinate=None, row=None, column=None, value=None): 获取指定单元格或设置单元格的值,具体使用在cell下面介绍
2.3 操作Cell
2.3.1 获取Cell对象
# 使用WorkSheet的Cell方法 c1=ws.cell('A1') c2=ws.cell(row=1,column=1) # 获取A1单元格 # 通过坐标获取Cell c3=ws['A1'] # 获取多个 c3=ws['A1:E5'] // 返回多行数据,类型为tuple
2.3.2 设置Cell的值
# 直接使用WorkSheet的cell方法设置 ws.cell(row=1,column=1,value=10) # 设置Cell对象value属性 c1=ws.cell('A1') c1.value=100
2.3.3 Cell属性
column:所在列,起始为1 row:所在行,起始为1 coordinate: 所在坐标,如'A1' parent: 所属的WorkSheet value: 单元格的值
2.3.4 Cell方法
offset(row=0, column=0): 偏移
3. 使用实例
# 1. load module from openpyxl import load_workbook dest_filename = 'test.xlsx' # 2. load Workbook from existed file wb=load_workbook(dest_filename) # 3. get a WorkSheet ws=wb['Sheet1'] # 4. modify data ws['A10']=100 ws.cell(row=1,column=1,value=100) # 5. read data # read data for row in ws.rows: # 返回的row是一个tuple对象 for cell in row: print 'row: %s column: %s value: %s' % (cell.row,cell.column,cell.value) # 6. save Workbook to file wb.save(dest_filename)
4. Note
- Cell的row和column都是从1开始的
- 文件操作完记得调用Workbook的save()方法
5. Reference
- openpyxl - A Python library to read/write Excel 2010 xlsx/xlsm files
- Difference Between Excel Worksheet & Workbook
原文:https://www.jianshu.com/p/ce2ba7caa414