摘要:
最近在学习爬虫,用的BeautifulSoup4这个库,设想是把优酷上面的电影的名字及链接爬到,然后存到一个文本文档中。比较简单的需求,第一次写爬虫。贴上代码供参考: 运行后的txt内的文本内容: 阅读全文
摘要:
一个简单的跑接口流程:登录后发表带图片的博客。这里涉及到的知识点: 1、登录时通过cookies去保持登录状态,把cookies添加到一个session中,这样可以保持长时间登录状态; 2、我们通过爬虫获取页面的title标签的文本判断登录成功; 3、通过抓包找到上传图片的地址,通过post方式来上 阅读全文