会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
fuzzier
博客园
首页
新随笔
联系
订阅
管理
04 2018 档案
通过baidu搜索引擎采集需要的数据
摘要:1 原理 通过向 baidu.com 发送 GET 请求 和需要查询的 params 自动获取数据并提取需要的信息 2 代码 2.2 采集思路: 通过向baidu.com/s?wd=params 发送GET请求,获取了首次查询的内容和页码数并存储。 根据页码数进行遍历请求并储存内容。 3 注意 3.
阅读全文
posted @
2018-04-13 23:57
fuzzier
阅读(210)
评论(0)
推荐(0)
编辑
公告