火车头采集之采集规则编写

文章目录[隐藏]

前言

上一篇火车头采集系列主要给大家一个引导作用,让大家简单了解火车头采集器有什么功能,从次文起将教大家如何编写火车头采集规则。
今天以采集某资源网网站源码为例,其他举一反三。

目标网站分析

1.  网站 url 链接分析
进入目标采集栏目: 此处我进入网站源码栏目,点击下面分页,观察网址总规律。
通过查看网站我总结的规律是: 
第二页网址: xxxx.com/lists/wzym.html?page=2
第三页网址: xxxx.com/lists/wzym.html?page=3
第 n 页网址:  xxxx.com/lists/wzym.html?page=n

   
   
火车头采集之采集规则编写
2. 网站列表分析
通过 F12 查看源代码的方式,发现此网站列表是: ul+li 的模式

火车头采集之采集规则编写

火车头采集器使用(mip.chiyuba.com 可搜索下载)

单页面采集设置

火车头采集之采集规则编写
多页面采集设置

火车头采集之采集规则编写
多页面设置完成效果

火车头采集之采集规则编写
测试采集

火车头采集之采集规则编写
效果展示

如果出现列表页和内容页就对了。

火车头采集之采集规则编写

总结

到了此处你已学会了火车头采集规则编写的第一个步骤,尽请期待火车头采集的第二个步骤。如有不懂欢迎在下方评论区留言讨论。
posted @ 2020-05-18 07:31  不随。  阅读(33)  评论(0编辑  收藏  举报  来源