会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
saiminhou
2019年6月21日
python基础[12]——动态渲染页面爬取(selenium)
摘要: 动态渲染页面爬取 JavaScript动态渲染页面,他的分页部分有js生成,并非原始的HTML代码 如淘宝使用request只能请求到页面大致框架,无法拿到商品数据,或部分网站换页时url不发生变化。 或者使用Ajax开发的网站(如今日头条),他的接口有很多加密处理(搜索信息后信息URL经过加密处理
阅读全文
posted @ 2019-06-21 15:20 saiminhou
阅读(820)
评论(0)
推荐(0)
编辑
Python基础[13]——在python中使用MongoDB
摘要: MongoDB 使用PyMongo库中的MongoClient。一般情况下传入MongoDB的IP及端口号即可,其中一个参数为host第二个参数为prot,如果不传递参数,端口默认为27017 可以建立多个数据库,此处以test为例 每个数据库包含多个集合,类似于mysql中的表 如果插入多条数据,
阅读全文
posted @ 2019-06-21 10:48 saiminhou
阅读(125)
评论(0)
推荐(0)
编辑
公告
导航
博客园
首页
新随笔
新文章
联系
订阅
管理