近日整理一些原来的代码,发现了这个东西,自己觉得也是个有趣的小东西,于是就放上来了.
本软件实现了自动将站点小说采集成txt格式的功能,目前软件功能如下:
1.自动根据目录全部采集整部小说
2.可扩充可修改的设计,系统采用xml配置文件作为系统采集的配置脚本,通过自定义正则表达式可理论针对任何非ajax小说站点采集.同时任何人都可以根据对方站点的系统修改重新修改xml配置文件.
3,可设定采集站点编码格式,是否采用GZip压缩,系统目前能支持所有编码格式以及GZip压缩站点.(通过配置xml文件)
4.比前一版本更加有好的界面,采集进度一目了然,随时可以停止系统工作.
系统发布说明:
1.请在网络比较好的时候使用本程序,否则可能出现网络连接错误提示.
2.如果系统提示"匹配xxx失败"的信息,请检查阅读服务器是否出现故障,比如某些站点请求页面出现错误也会出现该提示.如果能确保服务器没有问题,则是匹配脚本的问题,请按照正则表达式修改相应xml配置文件.
3.本系统仅为程序研究使用,任何人不得使用在商业用途,否则由此引发的法律问题本人概不负责.
4.URL输入框中请务必输入选中站点的小说目录页面所在地址,否则系统一定会报错.
5.如果您发现程序bug,请向作者提交,技术支持站点http://blog.leven.com.cn/.