摘要: 由于PyPDF2提取中文乱码,无法识别。所以使用pdfminer pdfminer : https://github.com/euske/pdfminer from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument impor 阅读全文
posted @ 2020-04-15 13:43 活捉火星人 阅读(1036) 评论(0) 推荐(0) 编辑
摘要: # -*- coding: UTF-8 -*- from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param 阅读全文
posted @ 2020-04-14 23:40 活捉火星人 阅读(593) 评论(0) 推荐(0) 编辑
摘要: from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param out_path: 拆分成单页的pdf文件的存 阅读全文
posted @ 2020-04-14 22:21 活捉火星人 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 由于在公司网络一直通过 pip install PyPDF2 或 pip3 insall PyPDF2 ,都提示连接失败,安装不成功PyPDF2 遂通过github下载安装文件:https://github.com/mstamy2/PyPDF2 解压,在解压目录按住Shift+右键,选择在此处打开P 阅读全文
posted @ 2020-04-14 16:31 活捉火星人 阅读(1233) 评论(0) 推荐(0) 编辑
摘要: https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128 通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访 阅读全文
posted @ 2020-04-05 10:13 活捉火星人 阅读(79) 评论(0) 推荐(0) 编辑
摘要: https://www.liaoxuefeng.com/wiki/1016959663602400/1017317609699776 列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。 举个例子,要生成list [1, 2, 3, 阅读全文
posted @ 2020-04-05 10:10 活捉火星人 阅读(134) 评论(0) 推荐(0) 编辑
摘要: https://www.liaoxuefeng.com/wiki/1016959663602400/1017316949097888 如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。 在Python中,迭代是通过fo 阅读全文
posted @ 2020-04-05 10:07 活捉火星人 阅读(216) 评论(0) 推荐(0) 编辑
摘要: https://www.liaoxuefeng.com/wiki/1016959663602400/1017269965565856 取一个list或tuple的部分元素是非常常见的操作。比如,一个list如下: >>> L = ['Michael', 'Sarah', 'Tracy', 'Bob' 阅读全文
posted @ 2020-04-05 09:47 活捉火星人 阅读(73) 评论(0) 推荐(0) 编辑