新华字典数据获取方法1

这种方法主要使用火车头采集工具来进行的。

 

准备:

火车头软件:LocoySpider_V8.6_Build20150323.rar(官方下载)

网站:http://xh.5156edu.com/

安装:安装火车头软件( 默认安装)


设置采集任务

1.分组任务树中添加自定义分组和任务:

2.在任务zidian3中进行设置(设置选项顺序排列)

3.设置和编译任务的网址:

4.设置采集网址规则:

5.测试采集网址:

6.测试该页面并进行编辑:

7.编辑采集字段:

8.开始采集并查看采集结果

9.数据采集完毕,保存到sqlite数据库里面

 

到了数据库里面之后就可以进行任意编辑和整理了。

 

*注:采集是智能的,但是也有不完美的地方,不对的地方需要手动修改。这里用到SQL语句不懂的地方可以去网上查查。

 

最后:感谢均均的大力支持和帮助

 

posted @ 2015-04-27 15:52  仙人球球  Views(938)  Comments(0Edit  收藏  举报