摘要: # 安装 pip install pypdf2 import os from PyPDF2 import PdfFileReader, PdfFileWriter dir_name = '分割后PDF文件' if not os.path.exists(dir_name): os.mkdir(dir_ 阅读全文
posted @ 2020-09-04 19:13 不会飞的鲨鱼 阅读(666) 评论(0) 推荐(0) 编辑
摘要: # 安装 pip install pdfplumber import pdfplumber # 利用pdfplumber提取文字 with pdfplumber.open('基于python的网页爬虫.pdf') as pdf: first_page = pdf.pages[0] print(fir 阅读全文
posted @ 2020-09-04 19:11 不会飞的鲨鱼 阅读(3051) 评论(0) 推荐(0) 编辑
摘要: from pptx import Presentation from pptx.util import Cm, Pt from pptx.enum.text import MSO_VERTICAL_ANCHOR, PP_PARAGRAPH_ALIGNMENT from pptx.dml.color 阅读全文
posted @ 2020-09-04 19:10 不会飞的鲨鱼 阅读(2078) 评论(0) 推荐(0) 编辑
摘要: # 安装 pip install python-pptx from pptx import Presentation from pptx.util import Cm, Pt # 打开ppt prs = Presentation('测试.pptx') # 获取slide幻灯片 for slide i 阅读全文
posted @ 2020-09-04 19:07 不会飞的鲨鱼 阅读(5486) 评论(0) 推荐(0) 编辑
摘要: from docx import Document from docx.enum.text import WD_PARAGRAPH_ALIGNMENT from docx.shared import Pt, RGBColor from docx.oxml.ns import qn doc = Doc 阅读全文
posted @ 2020-09-04 19:06 不会飞的鲨鱼 阅读(2156) 评论(0) 推荐(0) 编辑
摘要: ''' # 安装 pip install python-docx Document: 文档 Paragraph: 段落 Run: 文字块 ''' from docx import Document from docx.shared import Cm # 打开word文档 doc = Documen 阅读全文
posted @ 2020-09-04 19:05 不会飞的鲨鱼 阅读(2068) 评论(0) 推荐(0) 编辑
摘要: import requests import re import os from lxml import etree def get_index(): url = 'https://pvp.qq.com/web201605/herolist.shtml' response = requests.ge 阅读全文
posted @ 2020-09-02 16:51 不会飞的鲨鱼 阅读(359) 评论(0) 推荐(0) 编辑
摘要: from openpyxl.styles import Font, Alignment, Side, Border, PatternFill, GradientFill from openpyxl import load_workbook # 只能打开已经存在的表格,不能用该方法创建一个新的表格 w 阅读全文
posted @ 2020-09-02 16:50 不会飞的鲨鱼 阅读(2462) 评论(0) 推荐(0) 编辑
摘要: from openpyxl import load_workbook from openpyxl.drawing.image import Image from openpyxl.chart import BarChart, Reference, LineChart # 只能打开已经存在的表格,不能 阅读全文
posted @ 2020-09-02 16:49 不会飞的鲨鱼 阅读(648) 评论(0) 推荐(0) 编辑
摘要: from openpyxl import load_workbook # 只能打开已经存在的表格,不能用该方法创建一个新的表格 workbook = load_workbook(filename='score.xlsx') # 获取表格文件内的所有sheet名称 ['Sheet1', 'Sheet2 阅读全文
posted @ 2020-09-02 16:48 不会飞的鲨鱼 阅读(2478) 评论(0) 推荐(0) 编辑