会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Treelight
博客园
首页
新随笔
联系
订阅
管理
2020年2月7日
爬虫
摘要: 爬虫 什么是爬虫?就是伪造浏览器,下载网页源代码,再从源代码获取需要的数据,一般分为两步: 1、伪造浏览器下载网页(requests模块) 2、对网页的内容进行结构化处理(BeautifulSoup模块) requests模块 安装:pip install requests 下面是这个模块常用到的方
阅读全文
posted @ 2020-02-07 01:00 Treelight
阅读(255)
评论(0)
推荐(0)
编辑