用python解析word文件(段落篇(paragraph) 表格篇(table) 样式篇(style))
首先需要安装相应的支持库:
直接在命令行执行pip install python-docx
示例代码如下:
import docx
from docx import Document #导入库
path = "E:\\python_data\\1234.docx" #文件路径
document = Document(path) #读入文件
tables = document.tables #获取文件中的表格集
table = tables[0 ]#获取文件中的第一个表格
for i in range(1,len(table.rows)):#从表格第二行开始循环读取表格数据
result = table.cell(i,0).text + "" +table.cell(i,1).text+
table.cell(i,2).text + table.cell(i,3).text
#cell(i,0)表示第(i+1)行第1列数据,以此类推
print(result)
---------------------
_table_list = [] for i, row in enumerate(table.rows): # 读每行 row_content = [] for cell in row.cells: # 读一行中的所有单元格 c = cell.text if c not in row_content: row_content.append(c) # print(row_content) _table_list.append(row_content)
https://www.cnblogs.com/anpengapple/p/8372987.html