05 2018 档案
摘要:其实爬取某宝评论和上一篇爬取新浪微博是一个思路。这次把思路讲得更清楚,更全面一些。 我们需要爬取的评论界面是: 爬取之前需要知道的知识点:页面的部分内容是动态加载的,是通过ajax来进行异步加载的。比如说,首页有一个版块,它并不是一开始就包含在首页的文件里,而是之后随着浏览者的需要才加载进来的。 而
阅读全文
摘要:首语:开始准备认真学习爬虫了,先从基础的开始学起,比如先爬取微博的个人动态。 两个难点:获取动态加载的内容和翻页这两项操作。 对象:何炅的个人 分析过程: 首页url:https://weibo.com/hejiong?is_search=0&visible=0&is_all=1&is_tag=0&
阅读全文

浙公网安备 33010602011771号