05 2018 档案

摘要:其实爬取某宝评论和上一篇爬取新浪微博是一个思路。这次把思路讲得更清楚,更全面一些。 我们需要爬取的评论界面是: 爬取之前需要知道的知识点:页面的部分内容是动态加载的,是通过ajax来进行异步加载的。比如说,首页有一个版块,它并不是一开始就包含在首页的文件里,而是之后随着浏览者的需要才加载进来的。 而 阅读全文
posted @ 2018-05-04 15:58 cc成 阅读(1095) 评论(0) 推荐(0)
摘要:首语:开始准备认真学习爬虫了,先从基础的开始学起,比如先爬取微博的个人动态。 两个难点:获取动态加载的内容和翻页这两项操作。 对象:何炅的个人 分析过程: 首页url:https://weibo.com/hejiong?is_search=0&visible=0&is_all=1&is_tag=0& 阅读全文
posted @ 2018-05-01 23:11 cc成 阅读(5253) 评论(0) 推荐(0)