九、docx， win32file

目录

一、python解析word

1.1 判断是不是doc或者docx文件
1.2 按照元素解析word
1.3 word转成txt文件

二、word中创建内容（表格）

一、python解析word

pip install python-docx

1.1 判断是不是doc或者docx文件

import fnmatch

def judge_word_file(filename):
    if (not fnmatch.fnmatch(filename, "*.doc")) and (not fnmatch.fnmatch(filename, "*.docx")):
        return False
    if fnmatch.fnmatch(filename, "~#$*"):  # 判断是不是已经被打开了的word的临时文件
        return False
    return True

1.2 按照元素解析word

复制代码

from docx import Document

filename = "xxx.docx"


class ParserWord:
    filename = None
    doc = None

    def __init__(self, filename):
        self.filename = filename

    def run_parser(self):
        self.doc = Document(self.filename)
        self.parser_text()
        self.parser_tables()
        self.parser_text_box()

    def parser_tables(self):
        """
        解析文档中的表格
        :return: 表格的数据
        """
        # 获取表格内容
        with open('table.txt', 'w', encoding='utf-8') as f:
            for tab in self.doc.tables:
                # 读取每一行
                for row in tab.rows:
                    # 读取每一行的列
                    for cell in row.cells:
                        f.write(cell.text + '\n')



    def parser_text(self):
        """
        解析文档中的文本
        :return: 文本数据
        """
        with open('text.txt', 'w', encoding='utf-8') as f:
            for para in self.doc.paragraphs:
                if para.text:
                    f.write(para.text + '\n')
                    print(para.text)


    def parser_text_box(self):
        """
        解析文档中文本框中的文本内容
        :return: 文本框中的数据
        """
        text = ['']
        for _docElement in self.doc.element.body.iter():  # 从所有的word中的元素获取文本框的元素
            if _docElement.tag.endswith(('textbox')):
                for _ele in _docElement.iter():
                    if _ele.tag.endswith(('main}r', 'main}pPr')):
                        if _ele.tag.endswith("main}pPr"):
                            text.append("")
                        else:
                            text[-1] += _ele.text
                        _ele.text = ''

复制代码

1.3 word转成txt文件

pip install pypiwin32

复制代码

import os
from win32com import client as wc
def transfer_to_txt(filename,txt_word_folder_path,txt_file_name):
 
    wordapp = wc.Dispatch('Word.Application')
    try:
        # 获取文件所在的绝对路径
        doc_path = os.path.abspath(os.path.join(os.getcwd(), filename))
        doc = wordapp.Documents.Open(doc_path)
        word_to_txt = os.path.join(txt_word_folder_path, txt_file_name)
        doc.SaveAs(word_to_txt, 4)
        doc.Close()
    finally:
        wordapp.Quit()

复制代码

二、word中创建内容（表格）

复制代码

from docx import Document
from docx.shared import Inches, Pt
from docx.oxml.ns import qn
from docx.enum.text import WD_TAB_ALIGNMENT


# 设置用例表格的内容
USeCaseNumber = "USeCaseNumber"
Test_Case_Description = "Test_Case_Description"
Test_Method = "Test_Method"
Pre_Condition = "Pre-condition"
# Test_STeps = "Test_Steps"
Actions = "Actions"
Expected_Result = "Result"

# 创建document对象
document = Document()

# 设置字体
document.styles['Normal'].font.name = u'宋体'
document.styles['Normal']._element.rPr.rFonts.set(qn('w:eastAsia'), u'宋体')

# 添加段落文字说明，表示用例编号内容
p = document.add_paragraph()
p.paragraph_format.alignment = WD_TAB_ALIGNMENT.LEFT  # 设置文字居左
r = p.add_run(USeCaseNumber) # 设置文字内容
r.font.size = Pt(14)  # 设置字体大小
# r.bold = True  # 字体是否加粗

# 设置表格内容
table = document.add_table(rows=5, cols=3, style='Table Grid')  # 设置行数5和列数3
table.autofit = False

table.columns[0].width = Inches(2)  # 设置每个单元格的宽度是2

# 合并单元格（cell(x,y)中 x代表行，y代表列，都从0开始，比如第一行第一列即为cell(0,0)）
table.cell(0, 0).merge(table.cell(0, 0)) # 0行0列 与 0行0列合并
table.cell(0, 1).merge(table.cell(0, 2)) # 0行1列 与 0行2列合并

table.cell(1, 0).merge(table.cell(1, 0))
table.cell(1, 1).merge(table.cell(1, 2))

table.cell(2, 0).merge(table.cell(2, 0))
table.cell(2, 1).merge(table.cell(2, 2))

table.cell(3, 0).merge(table.cell(3, 0))
table.cell(3, 1).merge(table.cell(3, 1))
table.cell(3, 2).merge(table.cell(3, 2))

table.cell(4, 0).merge(table.cell(4, 0))
table.cell(4, 1).merge(table.cell(4, 1))
table.cell(4, 2).merge(table.cell(4, 2))


hdr_cells0 = table.rows[0].cells  # 将第0行设为对象 hdr_cells0
hdr_cells1 = table.rows[1].cells  # 将第1行设为对象 hdr_cells1
hdr_cells2 = table.rows[2].cells
hdr_cells3 = table.rows[3].cells
hdr_cells4 = table.rows[4].cells

# 设置第0行 0 列的 为标题 文字描述为  Test Case Description
hdr_cells0[0].add_paragraph('Test Case Description').alignment=WD_TAB_ALIGNMENT.CENTER
# 设置第0行 1 列的 为内容 文字描述为 自定义的数据 Test_Case_Description
hdr_cells0[1].add_paragraph(Test_Case_Description).alignment=WD_TAB_ALIGNMENT.CENTER

hdr_cells1[0].add_paragraph('Test method').alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells1[1].add_paragraph(Test_Method).alignment=WD_TAB_ALIGNMENT.CENTER


hdr_cells2[0].add_paragraph('Pre-condition').alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells2[1].add_paragraph(Test_Case_Description).alignment=WD_TAB_ALIGNMENT.CENTER


hdr_cells3[0].add_paragraph('Test Steps').alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells3[1].add_paragraph('Actions').alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells3[2].add_paragraph('Expected Result').alignment=WD_TAB_ALIGNMENT.CENTER


hdr_cells4[0].add_paragraph('1').alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells4[1].add_paragraph(Actions).alignment=WD_TAB_ALIGNMENT.CENTER
hdr_cells4[2].add_paragraph(Expected_Result).alignment=WD_TAB_ALIGNMENT.CENTER

# 创建文件名称并保存文件
document.save("用例文档.docx")

复制代码

posted on 2021-06-08 13:16 软饭攻城狮阅读(156) 评论(0) 编辑收藏举报

努力加载评论中...

刷新页面返回顶部

【推荐】100%开源！大型工业跨平台软件C++源码提供，建模，组态！
【推荐】还在用 ECharts 开发大屏？试试这款永久免费的开源 BI 工具！
【推荐】国内首个AI IDE，深度理解中文开发场景，立即下载体验Trae
【推荐】编程新体验，更懂你的AI，立即体验豆包MarsCode编程助手
【推荐】轻量又高性能的 SSH 工具 IShell：AI 加持，快人一步

导航

<

2025年4月

>

日

一

二

三

四

五

六

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

6

7

8

9

10

公告

昵称：软饭攻城狮
园龄： 6年4个月
粉丝： 23
关注： 15

随笔档案

阅读排行榜

评论排行榜

1. Celery异步框架(1)

最新评论

1. Re:加密接口文档
up大大，我想问一下为什么101.34.221.219连接超时，是因为没在同一个局域网内吗
--nia886
2. Re:十、PyQt5 之数据显示（列表控件、表格控件、树控件）
谢谢博主，通俗易懂，用到了！
--代码改变钱包
3. Re:二、树莓派（ Raspberry）机械臂配置telnet服务
感谢，跟着配置成功了
--星吹雨
4. Re:Celery异步框架
写得赞，作者用心了。但主要还是celery太难了。此国产分布式函数调度框架，从用法调用难度，用户所需代码量，超高并发性能，qps控频精确程度，支持的中间件类型，任务控制方式，稳定程度等19个方面全...
--北风之神0509
5. Re:二、树莓派（ Raspberry）机械臂配置telnet服务
不错，步骤挺详细
--sayanouta