随笔分类 - python
1
摘要:1.构造Requset 其实上面的urlopen参数可以传入一个request请求,它其实就是一个Request类的实例,构造时需要传入Url,Data等等的内容。比如上面的两行代码,我们可以这么改写 运行结果是完全一样的,只不过中间多了一个request对象,推荐大家这么写,因为在构建请求时还需要
阅读全文
摘要:摘要:本文将使用Python3.4爬网页、爬图片、自动登录。并对HTTP协议做了一个简单的介绍。在进行爬虫之前,先简单来进行一个HTTP协议的讲解,这样下面再来进行爬虫就是理解更加清楚。 一、HTTP协议 HTTP是Hyper Text Transfer Protocol(超文本传输协议)的缩写。它
阅读全文
摘要:socket通常也称作"套接字",用于描述IP地址和端口,是一个通信链的句柄,应用程序通常通过"套接字"向网络发出请求或者应答网络请求。socket起源于Unix,而Unix/Linux基本哲学之一就是“一切皆文件”,对于文件用【打开】【读写】【关闭】模式来操作。 socket就是该模式的一个实现,
阅读全文
摘要:Requests 是用Python语言编写,基于 urllib,采用 Apache2 Licensed 开源协议的 HTTP 库。它比 urllib 更加方便,可以节约我们大量的工作,完全满足 HTTP 测试需求。Requests 的哲学是以 PEP 20 的习语为中心开发的,所以它比 urllib
阅读全文
摘要:1.基本方法 urllib.request.urlopen(url, data=None, [timeout, ]*, cafile=None, capath=None, cadefault=False, context=None) - url: 需要打开的网址 - data:Post提交的数据 -
阅读全文
摘要:urllib and urllib2 区别 –博主提示:下面的是python2中的用法,python3需要做出相应修改。 urllib和urllib2模块都做与请求URL相关的操作,但他们提供不同的功能。 urllib2.urlopen accepts an instance of the Requ
阅读全文
摘要:[python] view plain copy print? [python] view plain copy print? 9.7 Regular Expressions and the re Module A regular expression is a string that repres
阅读全文
摘要:glob是Python自己带的一个文件操作相关模块,用它可以查找符合自己目的的文件,就类似于Windows下的文件搜索,支持通配符操作,*,?,[]这三个通配符,*代表0个或多个字符,?代表一个字符,[]匹配指定范围内的字符,如[0-9]匹配数字。 它的主要方法就是glob,该方法返回所有匹配的文件
阅读全文
摘要:这个模块只有几个函数, 一旦决定使用二分搜索时,立马要想到使用这个模块 [python] view plain copy print? import bisect L = [1,3,3,6,8,12,15] x = 3 x_insert_point = bisect.bisect_left(L,x)
阅读全文
摘要:Python中的random模块用于生成随机数。下面介绍一下random模块中最常用的几个函数。 random.random random.random()用于生成一个0到1的随机符点数: 0 <= n < 1.0 random.uniform random.uniform的函数原型为:random
阅读全文
摘要:深拷贝 1.对于数字、字符串而言,赋值、浅拷贝、深拷贝都无意义,因为永远都指向一个内存地址(pyrhon内部对数字和字符串优化) 2. 列表、字典 浅拷贝:只拷贝最外层 深拷贝:除了最内层的(数字、字符串)不拷贝外,全部拷贝 程序从上到下运行遇到关键字 (如def 名字XX()) 不继续执行 会把代
阅读全文
摘要:PyCharm是一种Python IDE,带有一整套可以帮助用户在使用Python语言开发时提高其效率的工具,比如调试、语法高亮、Project管理、代码跳转、智能提示、自动完成、单元测试、版本控制。此外,该IDE提供了一些高级功能,以用于支持Django框架下的专业Web开发。 Pycharm官网
阅读全文
摘要:reip = re.compile(r'(?<![\.\d])(?:\d{1,3}\.){3}\d{1,3}(?![\.\d])') for ip in reip.findall(line): print "ip>>>", ip 正则表达式匹配ip地址 print "ip>>>", ip 正则表达式
阅读全文
摘要:匹配中文字符的正则表达式: [u4e00-u9fa5] 评注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^x00-xff] 评注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:ns*r 评注:可以用来删除空白
阅读全文
摘要:一、 基本数据类型常用功能:1. 整数 int #int内部优化 n1=123 n2=n1 n1= 123 n2= 123 2份内存 if -5~257: n1= 123 n2 =123 else: n1= 123 n2= 123 》对象的内存地址 = ID(对象或对象的变量名)#Python 内容
阅读全文
摘要:import re # match_object = re.match('foo','foo') if match_object is not None: print type(match_object) print match_object.group() # match_object = re.
阅读全文
摘要:__future__模块 [回到目录] Python 3.x引入了一些与Python 2不兼容的关键字和特性,在Python 2中,可以通过内置的__future__模块导入这些新内容。如果你希望在Python 2环境下写的代码也可以在Python 3.x中运行,那么建议使用__future__模块
阅读全文
摘要:一、Python主要应用领域 相比较其他语言:非常完善的基础代码库,覆盖了网络、文件、GUI(图形用户界面:是指采用图形方式显示的计算机操作用户界面)、数据库、文本等大量内容等。许多功能不必从零编写,直接使用现成的即可。当然我们也可以写一些完善的程序插件供其他人使用! Web程序 Python经常被
阅读全文
摘要:在开发项目过程中,为了方便调试代码,经常会向stdout中输出一些日志,默认的这些日志就直接显示在了终端中。而一般的应用服务器,第三方库,甚至服务器的一些通告也会在终端中显示,这样就搅乱了我们想要的信息。 书写格式,和相关说明如下: 1 格式:\033[显示方式;前景色;背景色m 2 3 说明: 4
阅读全文
摘要:py2 temp = "理解" # utf- 8 #解码, 需要指定原来的是什么编码 temp_unicode = temp.decode("utf-8") #编码,需要指定要编写成什么编码 temp_gbk = temp_unicode.encode("gbk") # windows终端需要的GB
阅读全文
1