用python解析word文件(段落篇(paragraph) 表格篇(table) 样式篇(style))

首先需要安装相应的支持库:
直接在命令行执行pip install python-docx

示例代码如下:

import docx
from docx import Document #导入库

path = "E:\\python_data\\1234.docx" #文件路径
document = Document(path) #读入文件
tables = document.tables #获取文件中的表格集
table = tables[0 ]#获取文件中的第一个表格
for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
result = table.cell(i,0).text + "" +table.cell(i,1).text+
table.cell(i,2).text + table.cell(i,3).text
#cell(i,0)表示第(i+1)行第1列数据,以此类推
print(result)
---------------------

_table_list = []
for i, row in enumerate(table.rows):   # 读每行
    row_content = []
    for cell in row.cells:  # 读一行中的所有单元格
        c = cell.text
        if c not in row_content:
            row_content.append(c)
    # print(row_content)
    _table_list.append(row_content)


https://www.cnblogs.com/anpengapple/p/8372987.html
posted @ 2018-11-19 14:25  konglingbin  阅读(9480)  评论(0编辑  收藏  举报