会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
小田学Python
关注公众号:小田学Python,获取更多精彩内容
博客园
首页
新随笔
联系
订阅
管理
2018年10月27日
豆瓣读书爬虫(requests + re)
摘要: 前面整理了一些爬虫的内容,今天写一个小小的栗子,内容不深,大佬请忽略。内容包括对豆瓣读书网站中的书籍的基本信息进行爬取,并整理,便于我们快速了解每本书的中心。 一、爬取信息 每当爬取某个网页的信息时,首先就是要进入到网页中,看看有没有什么爬取过程中的限制,可以查看网站的robots协议。就是在原网址
阅读全文
posted @ 2018-10-27 22:53 小田学Python
阅读(2578)
评论(0)
推荐(0)
编辑
公告