随笔档案「2018年10月27日」：豆瓣读书爬虫（requests + re） ... - 小田学Python

2018年10月27日

摘要：前面整理了一些爬虫的内容，今天写一个小小的栗子，内容不深，大佬请忽略。内容包括对豆瓣读书网站中的书籍的基本信息进行爬取，并整理，便于我们快速了解每本书的中心。一、爬取信息每当爬取某个网页的信息时，首先就是要进入到网页中，看看有没有什么爬取过程中的限制，可以查看网站的robots协议。就是在原网址阅读全文

posted @ 2018-10-27 22:53 小田学Python 阅读(2761) 评论(0) 推荐(0)

BigDataLab

关注公众号：BigDataLab，获取更多精彩内容

公告