随笔分类 - Python
摘要:1:strip()方法,去除字符串开头或者结尾的空格 >>> a = " a b c " >>> a.strip() 'a b c' 2:lstrip()方法,去除字符串开头的空格 >>> a = " a b c " >>> a.lstrip() 'a b c ' 3:rstrip()方法,去除字符
阅读全文
摘要:PyPDF2 编码问题 PyPDF2.utils.PdfReadError Illegal character in Name Object 参考资料:https://github.com/mstamy2/PyPDF2/issues/438 使用 PyPDF2 做合并 PDF 文件时报错如下: Tr
阅读全文
摘要:需求:银行汇款回单PDF几十页,每一页包含两个回单。需把每一张回单拆分出来,并且以回单上交易附言处TPPXXXXXXXX格式的流水号重命名拆出来的文件。 思路: 1.使用PyPDF2把每一页一分为二,输出PDF到一个目录A。 2.循环目录A,使用pdfminer提取TPPXXXXXXXX格式的流水号
阅读全文
摘要:一、校验数字的表达式 1 数字: ^[0-9]*$ 2 n位的数字: ^\d{n}$ 3 至少n位的数字: ^\d{n,}$ 4 m-n位的数字: ^\d{m,n}$ 5 零和非零开头的数字: ^(0|[1-9][0-9]*)$ 6 非零开头的最多带两位小数的数字: ^([1-9][0-9]*)+(
阅读全文
摘要:由于PyPDF2提取中文乱码,无法识别。所以使用pdfminer pdfminer : https://github.com/euske/pdfminer from pdfminer.pdfparser import PDFParser from pdfminer.pdfdocument impor
阅读全文
摘要:# -*- coding: UTF-8 -*- from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param
阅读全文
摘要:from PyPDF2 import PdfFileReader, PdfFileWriter import os def split_pdf(infile, out_path): """ :param infile: 待拆分的pdf文件 :param out_path: 拆分成单页的pdf文件的存
阅读全文
摘要:由于在公司网络一直通过 pip install PyPDF2 或 pip3 insall PyPDF2 ,都提示连接失败,安装不成功PyPDF2 遂通过github下载安装文件:https://github.com/mstamy2/PyPDF2 解压,在解压目录按住Shift+右键,选择在此处打开P
阅读全文
摘要:https://www.liaoxuefeng.com/wiki/1016959663602400/1017318207388128 通过列表生成式,我们可以直接创建一个列表。但是,受到内存限制,列表容量肯定是有限的。而且,创建一个包含100万个元素的列表,不仅占用很大的存储空间,如果我们仅仅需要访
阅读全文
摘要:https://www.liaoxuefeng.com/wiki/1016959663602400/1017317609699776 列表生成式即List Comprehensions,是Python内置的非常简单却强大的可以用来创建list的生成式。 举个例子,要生成list [1, 2, 3,
阅读全文
摘要:https://www.liaoxuefeng.com/wiki/1016959663602400/1017316949097888 如果给定一个list或tuple,我们可以通过for循环来遍历这个list或tuple,这种遍历我们称为迭代(Iteration)。 在Python中,迭代是通过fo
阅读全文
摘要:https://www.liaoxuefeng.com/wiki/1016959663602400/1017269965565856 取一个list或tuple的部分元素是非常常见的操作。比如,一个list如下: >>> L = ['Michael', 'Sarah', 'Tracy', 'Bob'
阅读全文