简数采集器支持全网采集,只要输入对应关键词即可采集全网相关数据,类似搜索引擎。
简数采集器的按关键词泛采集功能,会对搜索结果采集并进行智能识别,不需要用户配置采集规则。
关键词全网采集可用于舆情监控、市场研究分析等。
使用方法如下:
1. 添加全网采集任务
在简数采集器的左侧菜单的【采集任务管理】列表中,点击【按关键词泛采集】即可创建任务。
或者在简数采集器上方,点击【+按关键词采集】按钮也可以创建任务。
2. 配置全网采集任务
关键词:填写要采集的关键词,支持多个关键词,多个用英文分号;隔开;
支持高级指令,例如要指定采集一个网站的相关关键词文章:
关键词 site:www.域名.com
或者
site:www.域名.com 关键词
采集页数:设置采集的页数,一页最多可采集10条数据,但由于一些是广告或网站首页等页面,实际采集的数据量不固定;
开始页数:设置采集的起始页,建议从第2页或者第3页开始采集,因为第一页较多是广告页没有什么用;
3. 数据处理高级配置
还可以对采集的数据进行数据处理,例如删除,过滤某些内容,采集前配置好,采集时就会自动执行已设置的数据处理。
点击任务下方的红色【配置处理】按钮进入数据处理配置页面,按需求配置即可。
如果不需要,可以忽略不设置的,一般使用默认设置即可!
简数采集器关键词泛采集任务设置完成后,记得点击下方保存,然后即可启动采集按钮,。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】博客园社区专享云产品让利特惠,阿里云新客6.5折上折
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 在鹅厂做java开发是什么体验
· 百万级群聊的设计实践
· WPF到Web的无缝过渡:英雄联盟客户端的OpenSilver迁移实战
· 永远不要相信用户的输入:从 SQL 注入攻防看输入验证的重要性
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析