摘要: 对爬虫代码的测试过程中发现,当爬取的数据过多时会出现错误,然后发现是因为百度贴吧有反爬虫设定,这就导致了无法爬取到过多的内容,如果访问的次数过多就会出现反爬虫,因此再代码的测试上也会出现阻碍,但对与贴吧主页的爬取成功。 在爬取过程中出现的不是验证码,而是一种图片的旋转,通过将图片旋转正了实现验证,我 阅读全文
posted @ 2021-05-30 19:57 软工新人 阅读(14) 评论(0) 推荐(0) 编辑