摘要: 近来由于毕设需要,重新修改了新浪微博爬虫废了不少劲,希望下边的总结能够帮助后来的同学们。现行版的模拟登陆与以前相比,最大的改动在于cookie获取时候的模拟url的请求过程,其难点之一的密码加密并没有任何改动,因为此次的改动主要是重新理顺它的cookie获取过程中的几个url请求的节点。 一、url请求流 1、“http://www.weibo.com”,获取login_sid_t,uug等两个参数,在放入后续的请求cookie中。 2、“HttpGet hg = new HttpGet( "http://login.sina.com.cn/sso/prelogin.php?entr 阅读全文
posted @ 2014-02-24 14:56 风未馨 阅读(634) 评论(0) 推荐(0) 编辑