用python处理word文档的操作

提取超链接

from docx import Document
注意docx包不是python自带的包需要下载下一篇，我会给大家说相关的下载，可以点这里跳转到下一篇博客

from docx import RT

import re

d=Document('D:\无名字的文件夹\python练习\材料.docx')

for p in d.paragraphs:
rels=d.part.rels
for rel in rels:
if rels[rel].reltype==RT.HYPERLINK:
print("\n超链接文本为",rels[rel],"超链接网址为：",rels[rel]._target)

doc=Document('D:\无名字的文件夹\python练习\材料.docx')

for p in doc.paragraphs:
t=p.text
print(t)

from zipfile import ZipFile
from os.path import basename

zf = ZipFile("D:\无名字的文件夹\python练习\材料.docx")
for item in zf.filelist:
fn = item.filename
if fn.endswith(('.jpg','.jpeg','.png')):
print(fn)

posted on 2023-05-20 10:38 阿苏勒的吕归尘阅读(127) 评论(0) 编辑收藏举报

刷新页面返回顶部