用python解析word文件（段落篇（paragraph）表格篇（table）样式篇（style））

首先需要安装相应的支持库：
直接在命令行执行pip install python-docx

示例代码如下：

import docx
from docx import Document #导入库

path = "E:\\python_data\\1234.docx" #文件路径
document = Document(path) #读入文件
tables = document.tables #获取文件中的表格集
table = tables[0 ]#获取文件中的第一个表格
for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
result = table.cell(i,0).text + "" +table.cell(i,1).text+
table.cell(i,2).text + table.cell(i,3).text
#cell(i,0)表示第(i+1)行第1列数据，以此类推
print(result)
---------------------

_table_list = []
for i, row in enumerate(table.rows):   # 读每行
    row_content = []
    for cell in row.cells:  # 读一行中的所有单元格
        c = cell.text
        if c not in row_content:
            row_content.append(c)
    # print(row_content)
    _table_list.append(row_content)


https://www.cnblogs.com/anpengapple/p/8372987.html

posted @ 2018-11-19 14:25 konglingbin 阅读(9601) 评论(0) 收藏举报

刷新页面返回顶部

konglingbin

用python解析word文件（段落篇（paragraph） 表格篇（table） 样式篇（style））

公告

用python解析word文件（段落篇（paragraph）表格篇（table）样式篇（style））