http://www.cnblogs.com/Erma-king/p/5281967.html
https://github.com/iamyaojie/Spider
专门用来解决爬虫采集相关网站数据时模拟自动登录,验证码自动识别的问题 (java):https://gitee.com/liinux/ghost-login