摘要:
爬不到此论坛的html源码,应该涉及到反爬技术,以后再来解决,代码如下 阅读全文
摘要:
一. 发送post请求 二. 内网认证 三. 代理 四. 第三方CA证书 由day1中https与http的区别知道,https是有第三方CA证书认证的,但有些网站虽然是https,但是它不是CA证书(可以是自己颁布的证书,如以前的12306),这样的话就访问不了该网站,报如下错 解决方法:告诉we 阅读全文
摘要:
来源:https://github.com/renaesop/blog/issues/4 RFC 6265 要点翻译 1.简介 本文档定义了HTTP Cookie以及HTTP头的Set-Cookie字段。通过使用Set-Cookie头,一个HTTP服务器可以传递name/value键值对以及相对应的 阅读全文
摘要:
一.获取登录后页面信息的两种方法 1.第一种方法: 人为把有效cookies加到请求头中,代码如下 2. 第二种方法 (1)代码登录(post请求),登录成功后得到有效cookie (2)自动带着cookie去请求 注 cookiejar能自动保存这个cookie 若不用此包的话则每次获取cooki 阅读全文
摘要:
一. 付费代理发送请求的两种方式 第一种方式: (1)代理ip,形式如下: money_proxy = {"http":"username:pwd@192.168.12.11:8080"} (2)代理的处理器 proxy_handler = urllib.request.ProxyHandler(m 阅读全文
摘要:
1. get传参 (1)url中包含中文报错解决方法 urllib.request.quote("包含中文的url", safe = "string.printtable") (2)字典传参 最终url由url和参数拼接而成,而参数(params)的类型为字典,所以拼接要将字典参数转化为字符串类型, 阅读全文
摘要:
day1 一. HTTP 1.介绍: https://www.cnblogs.com/vamei/archive/2013/05/11/3069788.html http://blog.csdn.net/guyuealian/article/details/52535294 2.当用户输入网址(如w 阅读全文
摘要:
大致思想是: (1)定义属性,如括号以及括号的配对关系 (2)从字符串(文本)中提取括号(此处以字符串为例),从而得到一个只包含括号的字符串 (3)利用栈存储开括号,遇到闭括号就与栈顶元素进行配对(此处直接将list当做栈使用),若配对就出栈 阅读全文
摘要:
具体见下面代码 输出结果为; 阅读全文
摘要:
常见算法效率比较: 一. 冒泡排序 冒泡排序是是一种简单的排序算法。它重复地遍历要排序的数列,一次比较两个元素,如果他们的顺序错误就把它们交换过来。遍历数列的工作是重复的进行直到没有再需要交换,也就是说该数列已经排序完成。这个算法的名字由来是因为越小的元素会经由交换慢慢“浮”到数列的顶端 1.冒泡排 阅读全文