摘要: 用爬取豆瓣网站上的信息作为实例 1. 不模拟浏览器访问,可能会出现 418 错误,这说明你要爬取的网站已经知道你是爬虫啦 很多网站有反爬虫机制,直接爬取会被拦截 如:直接访问时 url="http://www.douban.com" response=urllib.request.urlopen(u 阅读全文
posted @ 2021-04-11 16:12 CannedDream 阅读(313) 评论(0) 推荐(0) 编辑