将PDF文件中按页截取,并以流的形势返回给客户端

复制代码
#需要用到pyPdf库
from pyPdf import PdfFileWriter,PdfFileReader
from django.http import HttpResponse

try:
    from cStringIO import StringIO
except:
    from io import BytesIo as StringIo


def split_pdf(request):
    pdf_file = u'C:/Users/admin/Desktop/xxxx.pdf'
    page = 1 #返回的页码
    try:
        currentPage = int(page)
    except:pass

    pdfFile = file(pdf_file, 'rb')   #打开pdf

    pdf_input = PdfFileReader(pdfFile) #创建对象
    #获取当前PDF的总页数
    pageCount = pdf_input.getNumPages()

    if currentPage:
        if currentPage < 0 or currentPage >pageCount:
            currentPage = 1
        #获取指定PDF指定页面,以流的形式返回给客户端
        out = StringIO()  # 获取管道
        p = PdfFileWriter()  #创建写入对象
        p.addPage(pdf_input.getPage(currentPage))  #将当前页对象添加到创建的pdf最后面
        p.write(out) #将pdf写入流 

        out.seek(0) #移动文件指针到第0个位置
        response = HttpResponse(content_type='application/pdf')  
        response.write(out.read())
        return response
复制代码

 

posted @   村里汉子  阅读(754)  评论(0编辑  收藏  举报
编辑推荐:
· AI与.NET技术实操系列:使用Catalyst进行自然语言处理
· 分享一个我遇到过的“量子力学”级别的BUG。
· Linux系列:如何调试 malloc 的底层源码
· AI与.NET技术实操系列:基于图像分类模型对图像进行分类
· go语言实现终端里的倒计时
阅读排行:
· 几个技巧,教你去除文章的 AI 味!
· 系统高可用的 10 条军规
· 对象命名为何需要避免'-er'和'-or'后缀
· 关于普通程序员该如何参与AI学习的三个建议以及自己的实践
· AI与.NET技术实操系列(八):使用Catalyst进行自然语言处理
点击右上角即可分享
微信分享提示