摘要: 在爬取网站时常遇到异步加载的情况,必须点击或者下拉滚动条才会加载出更多的图片或视频,在源码中却一片空白,我一开始遇到时候也有点懵,了解了就好,还是请求。学过一些前端知识的朋友都清楚其实就是ajax异步加载js,这是为了提高用户的体验,许多网站都使用这种方法。 究其根本,其实就是将这部分请求放在了后台 阅读全文
posted @ 2018-09-02 21:44 孤月残舞 阅读(2344) 评论(0) 推荐(0) 编辑
摘要: 八月入职新公司,发现公司的爬虫系统主要用Java实现的偶尔用一些python,为此又看了下Java爬虫,顺便用之前同事推荐我的美女图片网站练手(之前推荐时候python爬虫勉强算经验丰富,感觉难度太低没去爬,这次刚好拿来练手),附上网址http://www.mm131.com/,(对了,这个网站爬取 阅读全文
posted @ 2018-09-02 20:52 孤月残舞 阅读(1972) 评论(1) 推荐(0) 编辑