python里面的xlrd模块详解以及样例

什么是xlrd模块?

  ♦python操作excel主要用到xlrd和xlwt这两个库,即xlrd是读excel,xlwt是写excel的库。

  ♦python读取excel中单元格的内容返回的有5种类型:

    ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

相关方法介绍

Book(class) 由xlrd.open_work("example.xls")返回

nsheets:                      sheets数
sheet_names:                  sheet名称列表
sheets:                       sheet列表
sheet_by_index(sheetx):       按序号提取sheet
sheet_by_name(sheet_name):    按名称提取sheet



Sheet(class) 由Book object相关方法返回

name:                         sheet名
nrows:                                          行数
ncols:                                          列数
cell(rowx,colx):                                第rows行colx列的单元格
cell_type(rowx,colx):                           数据类型
cell_value(rows,colx):                          数值
col(colx):                                      第colx列所有单元格组成的列表
col_slice(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格组成的列表
col_types(colx,start_rowx=0,end_rowx=None):     第colx列指定单元格数值类型组成的列表
col_values(colx,start_rowx=0,end_rowx=None):    第colx列指定单元格数值组成的列表
row同样有col的各项操作,此处略去



Cell(class) 由Sheet object(s)相关方法返回

ctype:    一个int型变量,对应不同的数值类型
value:    单元格的值
方法以及返回值介绍

 

一、安装xlrd模块

  ♦ 到python官网下载http://pypi.python.org/pypi/xlrd模块安装,前提是已经安装了python 环境。

  ♦或者在cmd窗口  pip3 install  xlrd

二、使用介绍

  1、常用单元格中的数据类型

  2、导入模块

 import xlrd

  3、打开Excel文件读取数据

data = xlrd.open_workbook(filename)#文件名以及路径,如果路径或者文件名有中文给前面加一个r拜师原生字符。

 

  4、常用的函数

       ♦ excel中最重要的方法就是book和sheet的操作

      1)获取book中一个工作表

复制代码
table = data.sheets()[0]          #通过索引顺序获取

table = data.sheet_by_index(sheet_indx)) #通过索引顺序获取

table = data.sheet_by_name(sheet_name)#通过名称获取

以上三个函数都会返回一个xlrd.sheet.Sheet()对象

names = data.sheet_names()    #返回book中所有工作表的名字

data.sheet_loaded(sheet_name or indx)   # 检查某个sheet是否导入完毕
复制代码

如:

   2)行的操作

复制代码
nrows = table.nrows  #获取该sheet中的有效行数

table.row(rowx)  #返回由该行中所有的单元格对象组成的列表

table.row_slice(rowx)  #返回由该列中所有的单元格对象组成的列表

table.row_types(rowx, start_colx=0, end_colx=None)    #返回由该行中所有单元格的数据类型组成的列表

table.row_values(rowx, start_colx=0, end_colx=None)   #返回由该行中所有单元格的数据组成的列表

table.row_len(rowx) #返回该列的有效单元格长度
复制代码

 3)列(colnum)的操作

复制代码
ncols = table.ncols   #获取列表的有效列数

table.col(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表

table.col_slice(colx, start_rowx=0, end_rowx=None)  #返回由该列中所有的单元格对象组成的列表

table.col_types(colx, start_rowx=0, end_rowx=None)    #返回由该列中所有单元格的数据类型组成的列表

table.col_values(colx, start_rowx=0, end_rowx=None)   #返回由该列中所有单元格的数据组成的列表
复制代码

如:

 

      4)单元格的操作  

复制代码
table.cell(rowx,colx)   #返回单元格对象

table.cell_type(rowx,colx)    #返回单元格中的数据类型

table.cell_value(rowx,colx)   #返回单元格中的数据

table.cell_xf_index(rowx, colx)   # 暂时还没有搞懂
复制代码

♦单元格:单元格是表格中行与列的交叉部分,它是组成表格的最小单位,可拆分或者合并。单个数据的输入和修改都是在单元格中进行的

如:

注意:注意作用域问题,之前获取的sheet之后,都在获取到这个sheet值后,在进行,行和列以及单元格的操作。

 

问题现象: 

问题一:

  ♦1、使用open()函数、xlrd.open_workbook()函数打开文件,文件名若包含中文,会报错找不到这个文件或目录。 

  ♦2、获取sheet时若包含中文,也会报错。

复制代码
#打开文件
file = open(filename,'rb')

#打开excel文件
workbook = xlrd.open_workbook(filename)

#获取sheet
sheet = workbook.sheet_by_name(sheetname)
复制代码

解决方案:

  ♦对参数进行转码即可。如:

filename = filename.decode('utf-8')

  ♦也试过unicode函数,不过,在ride中运行时出现了报错,所以不赞成使用。

filename = unicode(filename,'utf-8')

 问题二;

  问题描述:  python读取excel中单元格内容为日期时,字段里明明是日期,可读取后显示的却是浮点数。

  ♦python读取excel中单元格的内容返回的有5种类型:

    ctype :  0 empty,1 string, 2 number, 3 date, 4 boolean, 5 error

 

1.判断类型演示:
>>> sheet2.cell(2,2).ctype #1990/2/22 3 >>> sheet2.cell(2,1).ctype #18 2 >>> sheet2.cell(2,0).ctype #测试 1 >>> sheet2.cell(2,4).ctype #空值(这里是合并单元格的原因) 0

2。解决浮点数问题,正确取值方式:
>>> sheet2.cell(2,2).value #1990/2/22 33656.0 >>> xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) (1992, 2, 22, 0, 0, 0) >>> date_value =xlrd.xldate_as_tuple(sheet2.cell_value(2,2),workbook.datemode) >>> date_value (1992, 2, 22, 0, 0, 0) >>> date(*date_value[:3]) datetime.date(1992, 2, 22) >>> date(*date_value[:3]).strftime('%Y/%m/%d') '1992/02/22'

即可以做下简单处理,判断ctype是否等于3,如果等于3,则用时间格式处理:

if (sheet.cell(row,col).ctype == 3):
    date_value = xlrd.xldate_as_tuple(sheet.cell_value(rows,3),book.datemode)
    date_tmp = date(*date_value[:3]).strftime('%Y/%m/%d')

问题三:

  问题描述:读取合并单元格内容中内容sheet2.cell(2,4).ctype返回的值是0,说明这个单元格的值是空值,这就是这个包不完善的地方,如果是合并单元格那么应该合并的单元格内容一样,但是它只是合并的第一个单元格有值,其它为空。

  解决办法:通过获取merge_cells返回的row和col低位的索引来判断哪些是合并单元格,然后做后续取值操作。

    读取文件的时候需要将formatting_info参数设置为True,默认是False,所以上面获取合并的单元格数组为空,

    详细查看该链接:https://www.cnblogs.com/zhoujie/p/python18.html

 

 

2.为什么使用xlrd模块?

  ♦在UI自动化或者接口自动化中数据维护是一个核心,所以此模块非常实用。

 

3.怎样使用xlrd模块?

  读取表格数据样例https://www.cnblogs.com/iamjianghao/p/10764473.html

  python selenium中Excel数据维护:https://www.cnblogs.com/insane-Mr-Li/p/9093212.html

  

  

 

posted @ 2019-04-24 19:16  姜浩  阅读(2265)  评论(0编辑  收藏  举报