第一节:python读取excel文件

  写在前面:

       (1)Excel中数字格式int(1),读出的是float(1.0)类型,导致传参时造成不同,强制转换时,int(str(1.0))在2.7版本又会报错ValueError: invalid literal for int() with base 10: '1.0'经查阅资料后,发现数字类型在Excel中设置格式为

“文本”时会避免此问题发生;

       (2)Excel中包含中文时,读出的是str类型,断言时,self.assertEqual(self.info['msg'], int(self.msg)),self.info['msg']为<type 'unicode'>,这就会导致断言失败。self.assertEqual(self.info['msg'], self.msg.decode("utf-8"))能够解决此问题;

       本文中,读取Excel文件用的是xlrd库,检查库是否已安装(import xlrd),未报错则说明已安装成功,然后就可以开始练习啦!

       在度娘里了解了xlrd库的用法后,先尝试着写了下面这些简单代码:

# -*- coding:utf-8 -*-
import xlrd
def read_excel(xls_name,sheet_name):
    worksheet = xlrd.open_workbook(xls_name)
    sheet = worksheet.sheet_by_name(sheet_name)

    for row in range(sheet.nrows):
        for col in range(sheet.ncols):
            #打印单元格内容
            print sheet.cell(row,col)

if __name__ == "__main__":
    read_excel(r"F:\AONE\parameter.xlsx","第一周")

      运行后,果然不负所望,运行报错,学习的路程是艰难的,顺风顺水是不存在的。错误如下:

      xlrd.biffh.XLRDError: No sheet named <'\xe7\xac\xac\xe4\xb8\x80\xe5\x91\xa8'>

      查看报错位置,带有中文字符“第一周”,然后这个sheet没有找到!OK,根据以往经验,又是编码问题了,乖乖的设置默认编码后,运行后,成功!!,完整代码如下:

# -*- coding:utf-8 -*-
import xlrd

import sys
reload(sys)
sys.setdefaultencoding("utf-8")

def read_excel(xls_name,sheet_name):
    worksheet = xlrd.open_workbook(xls_name)
    sheet = worksheet.sheet_by_name(sheet_name)

    for row in range(sheet.nrows):
        for col in range(sheet.ncols):
            print sheet.cell(row,col)

if __name__ == "__main__":
    read_excel(r"F:\AONE\parameter.xlsx","第一周")

      上面代码运行后,的确是没有报错,但是呢,结果Excel文件里中文不显示,时间显示怪异,直接上图:

      得!继续排雷!先解决时间显示异常的问题吧!然后呢!又问度娘!前辈是伟大的,果然有前辈留的武功秘籍,判断表格中的ctype,将包含时间的表格内容转换为tuple。按照思路,对我的时间格式进行了下整理。幸运的是,在解决时间异常的问题时,也解决了中文显示异常的问题!果然上帝还是眷顾爱学习的人啊!

      完整代码:

# -*- coding:utf-8 -*-
import xlrd
import sys
reload(sys)
sys.setdefaultencoding("utf-8")

def read_excel(xls_name,sheet_name):
    worksheet = xlrd.open_workbook(xls_name)
    sheet = worksheet.sheet_by_name(sheet_name)

    for row in range(sheet.nrows):
        for col in range(sheet.ncols):
            #获取单元格内容
            value = sheet.cell(row,col).value
            #如果表格中ctype为3,则将其转换为tuple
            if sheet.cell(row,col).ctype == 3:
                date = xlrd.xldate_as_tuple(sheet.cell(row,col).value,0)
                value = str(date[3])+":"+str(date[4])
            print value

if __name__ == "__main__":
    read_excel(r"F:\AONE\parameter.xlsx","第一周")

       运行结果如下图:

        至此,使用xlrd读取Excel文件并输出已完成!

 

posted @ 2018-11-13 17:23  南山散人  阅读(5495)  评论(0编辑  收藏  举报