摘要: 什么是爬虫? 请求网站并提取数据的自动化程序 爬虫基本流程 ▌发起请求 通过HTTP库向目标站点发起请求,即发起一个Request,请求可以包含额外的headers等信息,等待服务器响应; ▌获取响应内容 如果服务器能正常响应,会得到一个Response,Response的内容便是所要获取的页面内容 阅读全文
posted @ 2019-01-20 19:00 派森学python 阅读(306) 评论(0) 推荐(0) 编辑
摘要: 今天一个朋友问我:有个朋友要学习 python,她属于那种特别能啃书的,让我推荐。我学 python 都是无师自通的,没有看过什么书,因此无法给她推荐,问我有什么意见? 他那个朋友是零基础的,ctrl+c、ctrl+v用的贼溜。除此之外,计算机算是零基础了。对此我就感觉有点头疼了。很多朋友第一反应肯 阅读全文
posted @ 2019-01-20 18:53 派森学python 阅读(868) 评论(0) 推荐(0) 编辑
摘要: 加群923414804免费获取数十套PDF资料,助力python学习 turtle是python中绘制图形的库,还是挺方便的,需要的是耐心。 附上代码,网上也有很多。 #使用turtle画小猪佩琪 import turtle as t t.pensize(4) # 设置画笔的大小 t.colormo 阅读全文
posted @ 2019-01-20 18:49 派森学python 阅读(380) 评论(0) 推荐(0) 编辑
摘要: / 01 / Charles 用Charles来找视频的API接口,具体操作和之前当当网那个案例一样,不细说。 这里通过滑动抖音App,可以获取到视频的请求信息。 通过多次实验,发现链接的后面是会不停的改变,只有链接的前头始终不变,即「http://v1-dy」「http://v6-dy」「http 阅读全文
posted @ 2019-01-20 18:41 派森学python 阅读(480) 评论(0) 推荐(0) 编辑
摘要: 本次学习的内容主要是:从PDF读取文本内容和从已经有的文档生成新的PDF。 需要用到的模块是PyPDF2. 首先要在命令行中运行pip install PyPDF2. 一、从PDF读取文本 读取pdf文件的页数是: 获取第一页的内容: 内容是 二、解密PDF 某些文档有加密功能,为了防止别人阅读,只 阅读全文
posted @ 2019-01-20 18:39 派森学python 阅读(9193) 评论(0) 推荐(0) 编辑