摘要: 第五章感觉是第四章的练习项目,无非就是多了一个模拟登录。 不分小节记录了,直接上知识点,可能比较乱。 1.常见的httpcode: 2.怎么找post参数? 先找到登录的页面,打开firebug,输入错误的账号和密码,观察post_url变换,从而确定参数。 3.读取本地的文件,生成cookies。 阅读全文
posted @ 2017-04-22 20:53 今孝 阅读(2672) 评论(0) 推荐(0) 编辑
摘要: 相关代码已经修改调试成功 2017 4 22 一、说明 1. 目标网址 :知乎登入后的首页 2. 实现 :如图字段的爬取 zhihu_question表: zhihu_answer表: 3. 数据 :存放在百度网盘,有需要的可以拿取 链接: "http://pan.baidu.com/s/1qYQ6 阅读全文
posted @ 2017-04-22 16:42 今孝 阅读(3312) 评论(1) 推荐(0) 编辑
//制作目录