ssbc 手撕包菜运行一段时间就停止的原因

原文: ssbc 手撕包菜运行一段时间就停止的原因

ssbc 运行一段时间后,大概半个小时,就莫名奇妙停止不爬了,通过错误提示可以看出,其实是ssbc与mysql(maridb)断开连接了,导致程序异常,当然就插入不了数据了。

所以解决办法很简单,有多种解决办法:

  • 一种是写个脚本,定时重启爬虫。这种方法比较笨,效率低下,因为不知道什么时候爬虫停止了。
  • 另一种是修改下代码,当mysql断开连接时,再次重连mysql就可以拉。

附上方法二修改后的爬虫源码(simdht_worker.py) 

附件下载见原文

============更新======

上面只是修复了爬虫的问题,它只是负责抓取数据。index_worker.py是用来建立索引,和simdht_worker.py问题一样,运行一会儿就停止,导致无法搜索到新数据。所以也需要修复下

附件下载见原文

posted @ 2016-07-24 00:08  King!  阅读(481)  评论(0编辑  收藏  举报
友情链接:百度云盘搜索引擎 | BT磁力搜索 | Github中文交流社区