python+selenium+new——python读取Excel文件
python处理Excel
相关说明:
1、Python自带的csv模块可以处理.csv文件。
2、xlrd和xlwt两个模块分别用来读Excel和写Excel,只支持.xls和.xlsx格式,xlutils模块可以同时读写一个已存在的Excel文件,依赖于xlrd和xlwt。
3、openpyxl(可读写excel表)专门处理Excel2007及以上版本产生的xlsx文件;2007一下的版本为xls结尾的文件,需要使用xlrd(读)和xlwt(写)库进行操作
4、excel表的文字编码如果是“gb2312” 读取后就会显示乱码,请先转成Unicode
5、workbook: 工作簿,一个excel文件包含多个sheet。
6、sheet:工作表,一个workbook有多个,表名识别,如“sheet1”,“sheet2”等。
7、cell: 单元格,存储数据对象
8、常用单元格中的数据类型empty(空的),string(text),number, date, boolean, error,blank(空白表格)
使用xlrd读Excel
xlrd提供的接口比较多,常用的方法如下:
方法 说明
open_workbook()
打开指定的Excel文件,返回一个Book对象:通过Book对象可以得到各个Sheet对象(一个Excel文件可以有多个Sheet,每个Sheet就是一张表格)
Book.nsheets 返回Sheet的数目
Book.sheets() 返回所有Sheet对象的list
Book.sheet_by_index(index) 返回指定索引处的Sheet。相当于Book.sheets()[index]
Book.sheet_names() 返回所有Sheet对象名字的list(为一个str类型的列表)
Book.sheet_by_name(name) 根据指定Sheet对象名字返回She
通过Sheet对象可以获取各个单元格,每个单元格是一个Cell对象
方法 说明
Sheet.name 返回表格的名称
Sheet.nrows 返回表格的行数
Sheet.ncols 返回表格的列数
Sheet.row(r) 获取指定行,返回Cell对象的list
Sheet.col(c) 获取指定列,返回Cell对象的list
Sheet.row_values(r) 获取指定行的值,返回list
Sheet.col_values(c) 获取指定列的值,返回list
Sheet.cell(r, c) 根据位置获取Cell对象
Sheet.cell_value(r, c) 根据位置获取Cell对象的值
Cell.value 返回单元格的值
注:
总的来说在处理Excel时的步骤是:先获取需要处理的Excel文件对象(Book对象,open_workbook()),
再获得工作簿中的sheet对象(Book.sheet_by_index(index)等方法),在sheet对象中进行处理