摘要:
这个案例主要是用于抓取妹子图片 推荐网址:http://jandan.net/ooxx 当我们切换图片的时候,会发现地址栏里面只有页码数在发生变化,其他的都没有改变 我们通过审查元素可以看到,最新的页码其实是保存在一个span标签里面的,我们可以通过它的class属性去获取最新的页面 图片都存在于i 阅读全文
摘要:
要使用python编写爬虫代码,我们需要解决第一个问题是: Python如何访问互联网? 回答这个问题不得不提到的就是urllib,它实际上是由两部分组成的:url+lib。 url:就是我们平时所说的网页地址 lib:library的意思 URL的一般格式为(带方括号[]的为可选项): proto 阅读全文