摘要: Cookie 是指某些网站服务器为了辨别用户身份和进行Session跟踪,而储存在用户浏览器上的文本文件,Cookie可以保持登录信息到用户下次与服务器的会话。 Cookie原理 HTTP是无状态的面向连接的协议, 为了保持连接状态, 引入了Cookie机制 Cookie是http消息头中的一种属性 阅读全文
posted @ 2018-05-17 15:55 听海8 阅读(1402) 评论(0) 推荐(0) 编辑
摘要: python3下urllib.request库高级应用之ProxyHandler处理器_代理设置 使用代理IP,这是爬虫/反爬虫的第二大招,通常也是最好用的。 很多网站会检测某一段时间某个IP的访问次数(通过流量统计,系统日志等),如果访问次数多的不像正常人,它会禁止这个IP的访问。 所以我们可以设 阅读全文
posted @ 2018-05-17 15:50 听海8 阅读(16643) 评论(0) 推荐(2) 编辑