python学习笔记
1.
转义字符必须 ,’\n’,来和变量分开
2.
当Python解释器读取源代码时,为了让它按UTF-8编码读取,文件开头写上这两行:
#!/usr/bin/env python3
# -*- coding: utf-8 -*-
第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;
第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可 能会有乱码。
3.
tuple的陷阱:当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来,比如:
>>> t = (1, 2)
>>> t
(1, 2)
如果要定义一个空的tuple,可以写成():
>>> t = ()
>>> t
()
但是,要定义一个只有1个元素的tuple,如果你这么定义:
>>> t = (1)
>>> t
1
定义的不是tuple,是1这个数!这是因为括号()既可以表示tuple,又可以表示数学公式中的小括号,这就产生了歧义,因此,Python规定,这种情况下,按小括号进行计算,计算结果自然是1。
所以,只有1个元素的tuple定义时必须加一个逗号,,来消除歧义:
>>> t = (1,)
>>> t
(1,)
Python在显示只有1个元素的tuple时,也会加一个逗号,,以免你误解成数学计算意义上的括号。
4.
dict的key必须是不可变对象。
这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。
要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key:
>>> key = [1, 2, 3]
>>> d[key] = 'a list'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'
5.不可变对象
str是不变对象,而list是可变对象。
对于可变对象,比如list,对list进行操作,list内部的内容是会变化的,比如:
>>> a = ['c', 'b', 'a']
>>> a.sort()
>>> a
['a', 'b', 'c']
而对于不可变对象,比如str,对str进行操作呢:
>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'
虽然字符串有个replace()方法,也确实变出了’Abc’,但变量a最后仍是’abc’,应该怎么理解呢?
我们先把代码改成下面这样:
>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'
要始终牢记的是,a是变量,而’abc’才是字符串对象!有些时候,我们经常说,对象a的内容是’abc’,但其实是指,a本身是一个变量,它指向的对象的内容才是’abc’
6.
tuple虽然是不变对象,但试试把(1, 2, 3)和(1, [2, 3])放入dict或set中,并解释结果。
>>>a = ('james', 'jordan', 'kobe')
>>>b = ('james' , ['jordan', 'kobe'])
>>>dict1={a:'篮球运动员'}
>>>dict1[a]
>>>'篮球运动员'
>>>dict2={b:'篮球运动员'}
>>>Traceback (most recent call last):
>>> File "<stdin>", line 1, in <module>
>>>TypeError: unhashable type: 'list'
#tuple a 所指向的三个人是不可变的的 他们都是篮球运动员
#tuple b 所指向的只有james是不可变的的 还有两个人虽然是叫jordan kobe但不一定就是打篮球的 可能是踢足球的jordan和打乒乓球的kobe
7.
py内置的函数自带有参数类型检查,但是用户自己定义的函数并没有,这个时候需要自己利用isinstance()实现
def my_abs(x):
if not isinstance(x, (int, float)):
raise TypeError('bad operand type')
if x >= 0:
return x
else:
return -x
添加了参数检查后,如果传入错误的参数类型,函数就可以抛出一个错误:
>>> my_abs('A')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
File "<stdin>", line 3, in my_abs
TypeError: bad operand type
8.
默认参数很有用,但使用不当,也会掉坑里。默认参数有个最大的坑,演示如下:
先定义一个函数,传入一个list,添加一个END再返回:
def add_end(L=[]):
L.append('END')
return L
当你正常调用时,结果似乎不错:
>>> add_end([1, 2, 3])
[1, 2, 3, 'END']
>>> add_end(['x', 'y', 'z'])
['x', 'y', 'z', 'END']
当你使用默认参数调用时,一开始结果也是对的:
>>> add_end()
['END']
但是,再次调用add_end()时,结果就不对了:
>>> add_end()
['END', 'END']
>>> add_end()
['END', 'END', 'END']
很多初学者很疑惑,默认参数是[],但是函数似乎每次都“记住了”上次添加了’END’后的list。
原因解释如下:
Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。
所以,定义默认参数要牢记一点:默认参数必须指向不变对象!
要修改上面的例子,我们可以用None这个不变对象来实现:
def add_end(L=None):
if L is None:
L = []
L.append('END')
return L
现在,无论调用多少次,都不会有问题:
>>> add_end()
['END']
>>> add_end()
['END']
为什么要设计str、None这样的不变对象呢?因为不变对象一旦创建,对象内部的数据就不能修改,这样就减少了由于修改数据导致的错误。此外,由于对象不变,多任务环境下同时读取对象不需要加锁,同时读一点问题都没有。我们在编写程序时,如果可以设计一个不变对象,那就尽量设计成不变对象。
9.
Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:
>>> for i, value in enumerate(['A', 'B', 'C']):
... print(i, value)
...
0 A
1 B
2 C
(用逗号添加一个参数1可以使标号从1开始)
10.闭包
注意到返回的函数在其定义内部引用了局部变量args,所以,当一个函数返回了一个函数后,其内部的局部变量还被新函数引用,所以,闭包用起来简单,实现起来可不容易。
另一个需要注意的问题是,返回的函数并没有立刻执行,而是直到调用了f()才执行。我们来看一个例子:
def count():
fs = []
for i in range(1, 4):
def f():
return i*i
fs.append(f)
return fs
f1, f2, f3 = count()
在上面的例子中,每次循环,都创建了一个新的函数,然后,把创建的3个函数都返回了。
你可能认为调用f1(),f2()和f3()结果应该是1,4,9,但实际结果是:
>>> f1()
9
>>> f2()
9
>>> f3()
9
原因就在于返回的函数引用了变量i,但它并非立刻执行。等到3个函数都返回时,它们所引用的变量i已经变成了3,因此最终结果为9。返回的其实是通过for in 循环生成的[f,f,f]这个函数list,但是函数并没有执行,其实i已经变成3了
返回闭包时牢记的一点就是:返回函数不要引用任何循环变量,或者后续会发生变化的变量。
如果一定要引用循环变量怎么办?方法是再创建一个函数,用该函数的参数绑定循环变量当前的值,无论该循环变量后续如何更改,已绑定到函数参数的值不变:
def count():
def f(j):
def g():
return j*j
return g
fs = []
for i in range(1, 4):
fs.append(f(i)) # f(i)立刻被执行,因此i的当前值被传入f()
return fs
再看看结果:
>>> f1, f2, f3 = count()
>>> f1()
1
>>> f2()
4
>>> f3()
9
1.IO参数
r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。
rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。
r+ 打开一个文件用于读写。文件指针将会放在文件的开头。
rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。
w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。
a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。
a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。
2.IO
#P1 打开文件、读文件、关闭文件的典型方法
try:
f=open('D:/test.txt','r')
print(f.read())
finally:
if f:
f.close()
#P2 推荐的简洁写法,不必显示的关闭文件描述符
#open返回的对象在python中称作file-like 对象,可以是字节流、网络流、自定义流等
with open('D:/test.txt','r') as f:
#按行读取
for line in f.readlines():
print(line.strip())
#P3 直接读取二级制的图片、视频文件
with open(‘D:/banner.jpg’,’rb’) as f2:
for line in f2.readlines():
print(line.strip())
#P4 可以指定编码读取相应的数据,还可以忽略非法编码
with open('D:/test.txt','r',encoding='gbk',errors='ignore') as f3:
for line in f3.readlines():
print(line.strip())
#P5 写文件的流程和读文件是一样的 代开文件、写入内容、关闭文件
# ‘r’ open for reading (default)
# ‘w’ open for writing, truncating the file first
# ‘x’ open for exclusive creation, failing if the file already exists
# ‘a’ open for writing, appending to the end of the file if it exists
# ‘b’ binary mode
# ‘t’ text mode (default)
# ‘+’ open a disk file for updating (reading and writing)
# ‘U’ universal newlines mode (deprecated)*
with open('D:/test12.txt','a+') as f4:
for line in f4.readlines():
print(line.strip())
f4.write('a new line2!')
ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。
3.
python的一种赋值
a,b=b,a+b
可以拆成
a = b, b = a + b
也就是说等号左边的第一个位置的等于等号右边的第一个位置
等号左边第二个位置的等于等号右边第二个位置的。
(a, b) = (b, a + b)
要这样看才行
4.协程
yield
解释器在遇到这个语句时,先计算expression,然后将结果返回给上一个调用者。而在第二次调用next()时,会从yield的下个语句开始执行。而不是你所理解的。
而讲到send()和next()的区别:
1 def consumer():
2 r = 'here'
3 for i in xrange(3):
4 yield r
5 r = '200 OK'+ str(i)
6
7 c = consumer()
8 n1 = c.next ()
9 n2 = c.next ()
10 n3 = c.next ()
对于普通的生成器,第一个next 调用,相当于启动生成器,会从生成器的第一行代码开始执行,直到第一次执行完yield语句(第4行),然后跳出生成器函数。
然后第二个next 调用,从yield语句的下一句语句执行(第5行),然后重新运行到yield语句,执行后跳出,后面的以此类推。
1 def consumer():
2 r = 'here'
3 while True:
4 n1 = yield r
5 if not n1:
6 return
7 print('[CONSUMER] Consuming %s...' % n1)
8 r = '200 OK'+str(n1)
9
10 def produce(c):
11 aa = c.send(None)
12 n = 0
13 while n < 5:
14 n = n + 1
15 print('[PRODUCER] Producing %s...' % n)
16 r1 = c.send(n)
17 print('[PRODUCER] Consumer return: %s' % r1)
18 c.close()
19
20 c = consumer()
21 produce(c)
send(msg)和next ()在一定程度上是类似的,区别是send()可以传递yield表达式的值进去,而next ()不能,只能传递None进去。我们可以看做next ()和send(None)是一致的
注意:第一次调用时,使用next ()或send(None),不能使用send发送一个非None的值,否则会报错,因为没有python yield语句来接收这个值。
第一次执行send(None)(11行),启动生成器,第一行代码执行到yield后,跳出生成器函数,此时,n1一直没有定义。
下面运行到c.send(1),进入生成器函数,从第4行开始执行,先把1赋值给n1,但是并不执行yield语句部分。
下面继续从yield的下一语句继续执行,然后重新运行到yield语句,执行后,跳出生成器。
综上,send和next 相比,多了一次赋值的动作,其他的流程是相同的。