Python - 随笔分类 - 活捉火星人

Python中常见字符串去除空格的方法总结

摘要：1：strip()方法，去除字符串开头或者结尾的空格 >>> a = " a b c " >>> a.strip() 'a b c' 2：lstrip()方法，去除字符串开头的空格 >>> a = " a b c " >>> a.lstrip() 'a b c ' 3：rstrip()方法，去除字符阅读全文

posted @ 2020-04-22 23:20 活捉火星人阅读(213) 评论(0) 推荐(0)

PyPDF2 编码问题 PyPDF2.utils.PdfReadError Illegal character in Name Object

摘要：PyPDF2 编码问题 PyPDF2.utils.PdfReadError Illegal character in Name Object 参考资料：https://github.com/mstamy2/PyPDF2/issues/438 使用 PyPDF2 做合并 PDF 文件时报错如下： Tr 阅读全文

posted @ 2020-04-18 16:34 活捉火星人阅读(2087) 评论(0) 推荐(0)

使用PyPDF2结合pdfminer拆分PDF，并提取关键字重命名拆分出来的文件

摘要：需求：银行汇款回单PDF几十页，每一页包含两个回单。需把每一张回单拆分出来，并且以回单上交易附言处TPPXXXXXXXX格式的流水号重命名拆出来的文件。思路： 1.使用PyPDF2把每一页一分为二，输出PDF到一个目录A。 2.循环目录A，使用pdfminer提取TPPXXXXXXXX格式的流水号阅读全文

posted @ 2020-04-15 22:39 活捉火星人阅读(1693) 评论(0) 推荐(0)

最全面的常用正则表达式大全

摘要：一、校验数字的表达式 1 数字： ^[0-9]*$ 2 n位的数字： ^\d{n}$ 3 至少n位的数字： ^\d{n,}$ 4 m-n位的数字： ^\d{m,n}$ 5 零和非零开头的数字： ^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字： ^([1-9][0-9]*)+( 阅读全文

posted @ 2020-04-15 14:06 活捉火星人阅读(321) 评论(0) 推荐(0)

pdfminert提取PDF中文内容

摘要：由于PyPDF2提取中文乱码，无法识别。所以使用pdfminer pdfminer : https://github.com/euske/pdfminer from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument impor 阅读全文

posted @ 2020-04-15 13:43 活捉火星人阅读(1092) 评论(0) 推荐(0)

PyPDF2切割单页为两页

摘要：# -*- coding: UTF-8 -*- from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param 阅读全文

posted @ 2020-04-14 23:40 活捉火星人阅读(654) 评论(0) 推荐(0)

PyPDF2切割多页为单页

摘要：from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param out_path: 拆分成单页的pdf文件的存阅读全文

posted @ 2020-04-14 22:21 活捉火星人阅读(269) 评论(0) 推荐(0)

本地安装PyPDF2

摘要：由于在公司网络一直通过 pip install PyPDF2 或 pip3 insall PyPDF2 ,都提示连接失败，安装不成功PyPDF2 遂通过github下载安装文件：https://github.com/mstamy2/PyPDF2 解压，在解压目录按住Shift+右键，选择在此处打开P 阅读全文

posted @ 2020-04-14 16:31 活捉火星人阅读(1443) 评论(0) 推荐(0)

生成器

摘要：https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128 通过列表生成式，我们可以直接创建一个列表。但是，受到内存限制，列表容量肯定是有限的。而且，创建一个包含100万个元素的列表，不仅占用很大的存储空间，如果我们仅仅需要访阅读全文

posted @ 2020-04-05 10:13 活捉火星人阅读(86) 评论(0) 推荐(0)

列表生成式

摘要：https://www.liaoxuefeng.com/wiki/1016959663602400/1017317609699776 列表生成式即List Comprehensions，是Python内置的非常简单却强大的可以用来创建list的生成式。举个例子，要生成list [1, 2, 3, 阅读全文

posted @ 2020-04-05 10:10 活捉火星人阅读(153) 评论(0) 推荐(0)

迭代

摘要：https://www.liaoxuefeng.com/wiki/1016959663602400/1017316949097888 如果给定一个list或tuple，我们可以通过for循环来遍历这个list或tuple，这种遍历我们称为迭代（Iteration）。在Python中，迭代是通过fo 阅读全文

posted @ 2020-04-05 10:07 活捉火星人阅读(235) 评论(0) 推荐(0)

切片

摘要：https://www.liaoxuefeng.com/wiki/1016959663602400/1017269965565856 取一个list或tuple的部分元素是非常常见的操作。比如，一个list如下： >>> L = ['Michael', 'Sarah', 'Tracy', 'Bob' 阅读全文

posted @ 2020-04-05 09:47 活捉火星人阅读(84) 评论(0) 推荐(0)

随笔分类 - Python

公告