随笔分类 - 爬虫

爬虫爬取糗事百科热门板块的信息

摘要：分析： 1、先查看返回的内容是否与显示的内容一样 2、再看页数的变化，每次会加一，总共13页，因此可以一次性构造地址列表 3、因此可直接结合 chrome插件 xpath helper 与 elemetns显示的内容进行定位要爬取的内容用到的模块 requests+json+lxml+xpath 阅读全文

posted @ 2019-06-18 11:40 烛爻阅读(207) 评论(0) 推荐(0)

爬虫爬取豆瓣高分电影信息

摘要：主要对豆瓣高分电影，按热度排序进行电影信息的爬取分析按F12打开开发者工具，点击XHR标签，因为他是通过ajax加载获取更多的电影信息的。返回的信息是json格式的数据，包含了每部电影详情的链接信息，先获取这些信息页码每次最后的 page_start参数加20可以换到下一页下面是详细代码阅读全文

posted @ 2019-06-17 01:53 烛爻阅读(580) 评论(0) 推荐(0)

鳯一

鱼跃此时海，花开彼岸天

随笔分类 - 爬虫

公告