会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
CannedDream
每一个梦想都应该被保护。
博客园
首页
新随笔
联系
订阅
管理
2021年4月11日
学习爬虫——test1——模拟浏览器去访问网站
摘要: 用爬取豆瓣网站上的信息作为实例 1. 不模拟浏览器访问,可能会出现 418 错误,这说明你要爬取的网站已经知道你是爬虫啦 很多网站有反爬虫机制,直接爬取会被拦截 如:直接访问时 url="http://www.douban.com" response=urllib.request.urlopen(u
阅读全文
posted @ 2021-04-11 16:12 CannedDream
阅读(313)
评论(0)
推荐(0)
编辑
公告