摘要: 最近在学习爬虫,用的BeautifulSoup4这个库,设想是把优酷上面的电影的名字及链接爬到,然后存到一个文本文档中。比较简单的需求,第一次写爬虫。贴上代码供参考: 运行后的txt内的文本内容: 阅读全文
posted @ 2018-03-26 15:27 风楚颜 阅读(4146) 评论(2) 推荐(0) 编辑
摘要: 一个简单的跑接口流程:登录后发表带图片的博客。这里涉及到的知识点: 1、登录时通过cookies去保持登录状态,把cookies添加到一个session中,这样可以保持长时间登录状态; 2、我们通过爬虫获取页面的title标签的文本判断登录成功; 3、通过抓包找到上传图片的地址,通过post方式来上 阅读全文
posted @ 2018-03-26 15:22 风楚颜 阅读(1108) 评论(0) 推荐(0) 编辑