Python 重点知识整理(基于Python学习手册第四版)
字节型编译
如果Python在系统中有写的权限,当程序运行时Python会把源码编译成字节码(与系统环境无关)存在一个.pyc扩展名文件中,如果没有修改源码而重新运行程序时,不会进行编译的步骤而使用字节码,可以优化运行速度。
变量、对象和引用
变量与对象是分开的,它们通过引用来建立连接,变量名是对象的引用。变量是一个系统表的元素,拥有指向对象连接的空间;对象是分配的一块内存,有俩个头部信息,一个类型标志符去标识这个对象的类型,一个是引用的计数器(回收机制);引用是自动形成的从变量到对象的指针。
通常x,y指向不同的对象x is y应该是FALSE,但是Python内部会自动缓存小的数字和字符串,所以x,y都指向了缓存中的42的对象。
1 x = 42 2 y = 42 3 x == y 4 Out[15]: True 5 x is y 6 Out[16]: True
常用的内置类型
数字,字符串,列表,字典,元组,文件,集合,编程单元类型(函数、模块、类),与实现相关的类型(编译的代码堆跟踪),其他类型(类型、None、bool值)
不可变类型:数字,字符串,元组,bool(对于不可变类型和可变的类型进行修改时尽量使用 +=,节约一个对象的空间)
可变类型:字典,列表,集合(需要修改变量内容的方法则是直接在原来对象上修改)
函数是可变对象。类则是初始化时创建的一个命名空间,是独立的存储空间,实例化时会单独创建一存储空间给实例而函数不会。
函数帮助
dir()方法,列出可可调用的方法,包括双下划线的方法
help()方法,传达方法名,返回说明文档
列表解析
[]、{}是列表解析,()是生成生成器。
1 M = [[1,2,3], 2 [4,5,6], 3 [7,8,9]] 4 col = [row[1] for row in M]
{}也可以是列表解析。列表解析比直接用for效率高。
map:map(function, iterable, ...),对iterable逐一进行function,返回的是迭代器
1 >>> map(lambda x, y: x + y, [1, 3, 5, 7, 9], [2, 4, 6, 8, 10]) 2 <map at 0x3ebed04208>
filter:filter(function, iterable),filter() 函数用于过滤序列,过滤掉不符合条件的元素,返回由符合条件元素组成的迭代器。
1 def is_odd(n): 2 return n % 2 == 1 3 4 newlist = filter(is_odd, [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]) 5 print(newlist) 6 <filter object at 0x0000003EBED044E0>
zip:取得一个或多个序列为参数,然后返回元组的列表,将这些序列中的并排的元素配对。长度不同则以最短的为准。
1 list(zip([1,2,3],[4,5,6,7])) 2 Out[38]: [(1, 4), (2, 5), (3, 6)]
字典&集合
都是哈希映射。
字典:是一系列的键值对,key:value,键必须是不可变对象(数字、字符串等)。dict是一个可迭代对象,next返回的是他的键。key可以是任意的不可比对象。
dict.get(key,default)、dict.setdefault(key,default)、dict.updata():合并操作(会覆盖相同的元素)、dict.pop(key):删除指定元素、dict.(zip([1,2,3],[4,5,6])):把俩个列表组合成键值对
集合:&:交集 |:并集 a ^ b:a不在b和b不在a的元素 a - b:b不在a的元素 <、>:包含。set()只能接受一个参数,如果有多个参数则只能变成list等类型。集合只能包含不可变对象,因为集合的实现是哈希结构,是根据只来映射,所以集合不能是list等可变的对象。
1 x = set('123456') 2 x 3 Out[3]: {'1', '2', '3', '4', '5', '6'} 4 type({}) # x = {}初始化是一个字典,如果想初始化一个集合只能用set()函数 5 Out[6]: dict
列表
嵌套的数组结构。(插入、删除元素效率慢(尽量用append、extend、pop),查找效率快)
分片赋值是先删除所选择的分片的元素再进行插入操作。所以也会有效率的问题,所以尽量少用。如果是一个元素的替换则不属于分片赋值
1 ['xsa','sd'] * 3 # [0] * 100 进行初始化
2 Out[20]: ['xsa', 'sd', 'xsa', 'sd', 'xsa', 'sd'] 3 'xsa' * 3 4 Out[21]: 'xsaxsaxsa'
文件
1 with open() as f: 2 f.readlines() # 读取全部行,按行返回list 3 f.read() # 读取全部内容,返回字符串 4 f.readline() #返回一行的内容,字符串 5 for line in open(): # open是一个可迭代对象,一行一行的读取数据 6 pass
赋值
1 spam = 'Spam' 2 spam,ham = 'yum','YUM' # 自动转成元组,存储变量的值 3 [spam,ham] = ['yum','YUM'] 4 a,b,c,d = 'spam' 5 a,*b = 'spam' 6 spam = ham = 'lunch' 7 spam += 42
序列解包:带星号的名称可能只匹配单个或空的项,但是返回一个列表。只能有一个带星号的名称。
1 a,b,c,d,*e = 'spam' 2 a,b,c,d,e 3 Out[8]: ('s', 'p', 'a', 'm', []) 4 5 *a = 'spam' 6 SyntaxError: starred assignment target must be in a list or tuple 7 *a, = 'spam' 8 a 9 Out[11]: ['s', 'p', 'a', 'm']
print([object,...][,sep = ' '][,end = '\n'][,file = sys.stdout])
sep,end,file如果给出的话,必须作为关键字参数给定。file指定文本将要发送的文件,标准流或者类似文件的对象。带有一个类似文件的write(string)方法的任何对象都可以传递。
1 print(x,y) 2 等价于 3 import sys 4 sys.stdout.write(str(x) + str(y) + '\n') 5 6 # 重定向到指定文件(也可以直接指定file参数 -) 7 import sys 8 sys.stdout = open('file_path','w/a/..',encodeing = 'utf-8/....') 9 ... 10 print(x,y)
迭代器
单个迭代器:zip、map、filter不支持多个迭代器,生成器是单迭代器。
1 x = zip([1,2,3],[4,5,6]) 2 I1 = x 3 I2 = x 4 next(I1) 5 Out[52]: (1, 4) 6 next(I2) 7 Out[53]: (2, 5) 8 next(x) 9 Out[54]: (3, 6)
函数
函数与类相似也是一个命名空间,可以用fun.args来对函数里面的属性进行赋值(与原来函数内部的属性分开,存在__dict__变量里),但是不能查看或修改函数里面的属性。
作用域:当你在一个程序中使用变量名时,python创建、改变或查找变量名都是在所谓的命名空间(一个保存变量名的地方)中进行的。在哪里赋值决定了他的命名空间。
LEGB原则:本地作用域(L)、上层结构中def或lambda的本地作用域(E)、全局作用域(G)、内置作用域(B)。
工厂函数:能记住嵌套作用域的变量值的函数,尽管那个作用域已经不在了。(类更适合记住状态)
嵌套作用域中的变量在嵌套的函数被调用时才进行查找,所以实际记住的是相同的一个值(在最后一次循环迭代中循环变量的值)。可以使用默认参数来记住当前的状态,默认参数是记录在函数对象中的。
1 t = [lambda i:i * x for x in range(5)] # t = [lambda i,x = x:i * x for x in range(5)] 2 t[0](1) 3 Out[3]: 4 4 t[0](2) 5 Out[4]: 8
nonlocal:nonlocal应用于一个嵌套的函数的作用域中的一个名称,而不是所有def之外的全局模块作用域,声明时该变量必须已经定义,否则将产生错误。对变量名的查找从嵌套的def的作用域中开始,而不是从本地作用域开始,只限定在嵌套的def中。不会在全局作用域中查找。(global查找也是跳过本地作用域)
参数
传递参数:1.参数的传递时通过自动将对象赋值给本地变量名来实现的。2.在函数内部的参数名的赋值不会影响调用者。3.改变函数的可变对象参数的值也许会对调用者有影响。4.不可变参数通过值传递的,可变参数通过“指针”进行传递的。
在函数调用中,参数必须以此顺序出现:任何位置参数(value),后面跟着任何关键字参数(name = value)和*sequence形式的组合,后面跟着**dict形式。
在函数的头部,参数必须以此顺序出现:任意一般的参数(name),紧跟着任何的默认参数(name = value),如果有的话后面是*name或*的形式,后面跟着任何name或name = value keyword-only参数,后面跟着**name形式。
参数匹配:
1.通过位置分配非关键字参数。
2.通过匹配变量名分配关键字参数
3.其他额外的非关键字分配到*name元组中
4.其他额外的关键字参数分配到**name字典中。
5.用默认值分配给在头部未得到分配的参数。
1 def func(a,b,c,d): 2 print(a,b,c,d) 3 func(1,c = 3,*(2,),**{'d':4}) 4 1 2 3 4
1 def f(a,*b,c = 6,**d): 2 print(a,b,c,d) 3 f(1,*(2,3),**dict(x = 4,y = 5)) 4 1 (2, 3) 6 {'x': 4, 'y': 5}
import
流程:在第一次导入文件时执行以下三个步骤,如果导入相同的模块则只是提取内存中已加载的模块对象。Python把已加载的模块存储到sys,modules表中。如果需要再次导入要调用reload。
1.找到模块文件(sys.path)
2.编译成位码(需要时)
3.执行模块的代码来创建其所定义的对象
搜索路径:1.程序的主程序 2.PYTHONPATH目录 3.标准链接库目录 4.任何的.pth文件的内容(如果存在的话 )
模块文件选择:.py .pyc 目录 编译扩展模块(通常用C/C++)等不限于Python文件
from:除了会读取整个模块(运行),并把变量名赋值到另一个作用域的同名变量(可变对象是引用)
1 from module import name1,name2 2 # 等价于 3 import module 4 name1 = module.name1 5 name2 = module.name2 6 del module
包导入:以'.'相隔路径名。包导入语句的路径中的每一个目录内都必须有一个__init__.py(导入包会先运行此文件的代码但可以为空,用来标识此目录是包)文件,否则这个包导入失败。
包的相对导入(包内文件的导入原则):from语句现在可以使用前面的点号 "." 来指定,它们需要位于同一包中的模块(包的相对导入),而不是位于模块导入搜索路径的模块(绝对导入)。不会在sys.path中查找,只在包内查找。否则在sys.path中查找。(只适用于from语句,import默认绝对导入)
类
类:实例工厂。类的属性提供了行为(数据以及函数),所有从类产生的实例都继承该类的属性
实例:代表程序领域中具体的元素。实例属性记录数据,而每个特定对象的数据都不同。初始化一个实例都会分配单独的存储空间。不可以修改父类的数据,只能引用,如果进行赋值的操作会在实例空间初始化或引用赋值(father类有属性x,而children实例运行children.x += 1不会修改father的值,会在自己的命名空间上先引用父类的x在+1,然后存放在自己的实例空间上,children有x属性)
属性继承搜索:先搜索本地实例,然后是该对象之上的所有类,由下至上,由左到右。(广度优先)
self:self指向调用自己的实例对象。
__class__:显示实例链接到父类名称
__bases__:一个元组,显示继承的父类
__bese__:显示第一个父类名称
__dict__:显示模块的属性(dict形式)
__doc__:文档字符串(函数也有此属性),常放在类的开头,用'''.......'''
__slots__:这个属性一般是在class语句顶层内将字符串名顺序赋值给变量__slots__,只有__slots__列表内的这些变量名可赋值给实例属性(__slots__内的变量类不能再定义)。如果实例想赋值实例属性,则实例会搜索父类查看实例属性是否存在父类的__slots__中,如果任意一父类存在则可以赋值,否则失败。(如果父类的__slots__内有__dict__变量则都可以赋值,因为实例属性赋值是通过调用__dict__方法,把变量名存__dict__字典中)
运算符重载:当类的实例出现在内置操作中,Python会自动调用你的方法。
运算符重载让类拦截常规的Python运算 类可重载所有Python表达式运算符 重载使类实例的行为像内置类型 重载使通过提供特殊名称的类方法来实现是
__call__:当调用实例时使用__call__方法。把实例当做一个方法来调用。
__init__(构造函数):初始化实例时自动调用此方法。
__sub__:捕获减法表达式
__add__、__radd__:加法运算符,右侧+(只有当+右侧的对象是实例对象时才会调用__radd__,其他所有情况调用__add__)
__iadd__:X += Y
1 class Number: 2 def __init__(self,start): 3 self.data = start 4 def __sub__(self,other): 5 return Number(self.data - other)
__str__:打印、转换(__str__比__repr__的优先级高)
1 class Str(object): 2 def __str__(self): 3 return "__str__ called" 4 def __repr__(self): 5 return "__repr__ called"
__getitem__:索引运算
__setitem__:索引赋值语句
__delitem__:索引和分片的删除
1 class Indexer: 2 data = [5,6,7,8,9] 3 def __getitem__(self,index): 4 print('getitem:',index) 5 return self.data[index] 6 def __setitem__(self,index,value): 7 self.data[index] = value 8 x = Indexer() 9 x[2:4] 10 slice(2, 4, None) 11 Out[38]: [7, 8]
12 for item in x: # for语句的作用是从0到更大的索引值,每次循环都会调用类的__getitem__,可以支持所有的迭代环境(in、列表解析、map、iter)
13 print(item)
__iter__、__next__:迭代环境(Python中所有的迭代环境都会先尝试__iter__,在尝试__getitem__)
__contains__:in 方法,for i in range(5)调用__iter__
1 class Squares: 2 def __init__(self,start,stop): 3 self.value = start - 1 4 self.stop = stop 5 def __iter__(self): 6 return self 7 def __next__(self): 8 if self.value == self.stop: 9 raise StopIteration 10 self.value += 1 11 return self.value ** 2
__getattr__:属性引用(如果不能再类中找到属性,则调用此方法)
__setattr__:属性赋值(拦截所有属性赋值操作)
__delattr__:属性删除
__getattribute__:拦截所有属性,而不只那些未定义的属性。
1 class Empty: 2 def __getattr__(self,attrname): 3 if attrname == 'age': 4 return 40 5 else: 6 raise AttributeError 7 def __setattr__(self,attrname,value): 8 if attrname == 'age': 9 self.__dict__[attrname] = value 10 else: 11 raise AttributeError
__or__:or运算符
__lt__、 __gt__、 __le__、 __ge__、 __eq__、 __ne__:<、>、<=、>=、==、!=
__bool__、__len__:bool()、len()。进行布尔值的判断,如果没有定义__bool__则会找__len__(一个非0的长度为True)
__del__:析构函数,回收实例空间是自动运行
伪私有属性:用一个 _ 来编写内部名称(_X),但这只是让你知道此变量是一个不应该修改的名字,不是一个真正的私有变量。
变量名压缩:class语句内开头有俩个下划线但是结尾没有俩个下划线的变量名会自动扩张,从而包含了所在类的名称。例如:Spam类内__X的变量名会自动变成_Spam__X,原始变量名会在头部加入一个下划线,然后是所在类名称。(防止变量名的冲突)
装饰器
1 class D: 2 @staticmethod(A,B) 3 def meth(self): 4 pass 5 # 等价于 6 class D: 7 def meth(self): 8 pass 9 meth = staticmethod(A,B)(meth)
1 def decorator(F): 2 def wrapper(*args,**kargs): 3 ... 4 F(*args,**kargs) 5 ... 6 return wrapper