python学习笔记

1.

转义字符必须 ,’\n’,来和变量分开

2.

当Python解释器读取源代码时,为了让它按UTF-8编码读取,文件开头写上这两行:

 #!/usr/bin/env python3
 # -*- coding: utf-8 -*-

 

第一行注释是为了告诉Linux/OS X系统,这是一个Python可执行程序,Windows系统会忽略这个注释;

第二行注释是为了告诉Python解释器,按照UTF-8编码读取源代码,否则,你在源代码中写的中文输出可 能会有乱码。

3.

tuple的陷阱:当你定义一个tuple时,在定义的时候,tuple的元素就必须被确定下来,比如:

>>> t = (1, 2)
>>> t
(1, 2)

 

如果要定义一个空的tuple,可以写成():

>>> t = ()
>>> t
()

 

但是,要定义一个只有1个元素的tuple,如果你这么定义:

>>> t = (1)
>>> t
1

 

定义的不是tuple,是1这个数!这是因为括号()既可以表示tuple,又可以表示数学公式中的小括号,这就产生了歧义,因此,Python规定,这种情况下,按小括号进行计算,计算结果自然是1。

所以,只有1个元素的tuple定义时必须加一个逗号,,来消除歧义:

>>> t = (1,)
>>> t
(1,)

 

Python在显示只有1个元素的tuple时,也会加一个逗号,,以免你误解成数学计算意义上的括号。

4.

dict的key必须是不可变对象

这是因为dict根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。这个通过key计算位置的算法称为哈希算法(Hash)。

要保证hash的正确性,作为key的对象就不能变。在Python中,字符串、整数等都是不可变的,因此,可以放心地作为key。而list是可变的,就不能作为key:

>>> key = [1, 2, 3]
>>> d[key] = 'a list'
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'

 

5.不可变对象

str是不变对象,而list是可变对象。

对于可变对象,比如list,对list进行操作,list内部的内容是会变化的,比如:

>>> a = ['c', 'b', 'a']
>>> a.sort()
>>> a
['a', 'b', 'c']

 

而对于不可变对象,比如str,对str进行操作呢:

>>> a = 'abc'
>>> a.replace('a', 'A')
'Abc'
>>> a
'abc'

 

虽然字符串有个replace()方法,也确实变出了’Abc’,但变量a最后仍是’abc’,应该怎么理解呢?

我们先把代码改成下面这样:

>>> a = 'abc'
>>> b = a.replace('a', 'A')
>>> b
'Abc'
>>> a
'abc'

 

要始终牢记的是,a是变量,而’abc’才是字符串对象!有些时候,我们经常说,对象a的内容是’abc’,但其实是指,a本身是一个变量,它指向的对象的内容才是’abc’

6.

tuple虽然是不变对象,但试试把(1, 2, 3)和(1, [2, 3])放入dict或set中,并解释结果。

>>>a = ('james', 'jordan', 'kobe')
>>>b = ('james' , ['jordan', 'kobe'])
>>>dict1={a:'篮球运动员'}
>>>dict1[a]
>>>'篮球运动员'
>>>dict2={b:'篮球运动员'}
>>>Traceback (most recent call last):
>>> File "<stdin>", line 1, in <module>
>>>TypeError: unhashable type: 'list'
#tuple a 所指向的三个人是不可变的的 他们都是篮球运动员
#tuple b 所指向的只有james是不可变的的 还有两个人虽然是叫jordan kobe但不一定就是打篮球的 可能是踢足球的jordan和打乒乓球的kobe

 

7.

py内置的函数自带有参数类型检查,但是用户自己定义的函数并没有,这个时候需要自己利用isinstance()实现

def my_abs(x):
    if not isinstance(x, (int, float)):
        raise TypeError('bad operand type')
    if x >= 0:
        return x
    else:
        return -x

 

添加了参数检查后,如果传入错误的参数类型,函数就可以抛出一个错误:

>>> my_abs('A')
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 3, in my_abs
TypeError: bad operand type

 

8.

默认参数很有用,但使用不当,也会掉坑里。默认参数有个最大的坑,演示如下:

先定义一个函数,传入一个list,添加一个END再返回:

def add_end(L=[]):
    L.append('END')
    return L

 

当你正常调用时,结果似乎不错:

>>> add_end([1, 2, 3])
[1, 2, 3, 'END']
>>> add_end(['x', 'y', 'z'])
['x', 'y', 'z', 'END']

 

当你使用默认参数调用时,一开始结果也是对的:

>>> add_end()
['END']

 

但是,再次调用add_end()时,结果就不对了:

>>> add_end()
['END', 'END']
>>> add_end()
['END', 'END', 'END']

 

很多初学者很疑惑,默认参数是[],但是函数似乎每次都“记住了”上次添加了’END’后的list。

原因解释如下:

Python函数在定义的时候,默认参数L的值就被计算出来了,即[],因为默认参数L也是一个变量,它指向对象[],每次调用该函数,如果改变了L的内容,则下次调用时,默认参数的内容就变了,不再是函数定义时的[]了。

所以,定义默认参数要牢记一点:默认参数必须指向不变对象!

要修改上面的例子,我们可以用None这个不变对象来实现:

def add_end(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

 

现在,无论调用多少次,都不会有问题:

>>> add_end()
['END']
>>> add_end()
['END']

 

为什么要设计str、None这样的不变对象呢?因为不变对象一旦创建,对象内部的数据就不能修改,这样就减少了由于修改数据导致的错误。此外,由于对象不变,多任务环境下同时读取对象不需要加锁,同时读一点问题都没有。我们在编写程序时,如果可以设计一个不变对象,那就尽量设计成不变对象。

9.

Python内置的enumerate函数可以把一个list变成索引-元素对,这样就可以在for循环中同时迭代索引和元素本身:

>>> for i, value in enumerate(['A', 'B', 'C']):
...     print(i, value)
...
0 A
1 B
2 C

 

(用逗号添加一个参数1可以使标号从1开始)

10.闭包

注意到返回的函数在其定义内部引用了局部变量args,所以,当一个函数返回了一个函数后,其内部的局部变量还被新函数引用,所以,闭包用起来简单,实现起来可不容易。

另一个需要注意的问题是,返回的函数并没有立刻执行,而是直到调用了f()才执行。我们来看一个例子:

def count():
    fs = []
    for i in range(1, 4):
        def f():
             return i*i
        fs.append(f)
    return fs

f1, f2, f3 = count()

 

在上面的例子中,每次循环,都创建了一个新的函数,然后,把创建的3个函数都返回了。

你可能认为调用f1(),f2()和f3()结果应该是1,4,9,但实际结果是:

>>> f1()
9
>>> f2()
9
>>> f3()
9

 

原因就在于返回的函数引用了变量i,但它并非立刻执行。等到3个函数都返回时,它们所引用的变量i已经变成了3,因此最终结果为9。返回的其实是通过for in 循环生成的[f,f,f]这个函数list,但是函数并没有执行,其实i已经变成3了

返回闭包时牢记的一点就是:返回函数不要引用任何循环变量,或者后续会发生变化的变量。

如果一定要引用循环变量怎么办?方法是再创建一个函数,用该函数的参数绑定循环变量当前的值,无论该循环变量后续如何更改,已绑定到函数参数的值不变:

def count():
    def f(j):
        def g():
            return j*j
        return g
    fs = []
    for i in range(1, 4):
        fs.append(f(i)) # f(i)立刻被执行,因此i的当前值被传入f()
    return fs

 

再看看结果:

>>> f1, f2, f3 = count()
>>> f1()
1
>>> f2()
4
>>> f3()
9

1.IO参数

r 以只读方式打开文件。文件的指针将会放在文件的开头。这是默认模式。

rb 以二进制格式打开一个文件用于只读。文件指针将会放在文件的开头。这是默认模式。

r+ 打开一个文件用于读写。文件指针将会放在文件的开头。

rb+ 以二进制格式打开一个文件用于读写。文件指针将会放在文件的开头。

w 打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

wb 以二进制格式打开一个文件只用于写入。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

w+ 打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

wb+ 以二进制格式打开一个文件用于读写。如果该文件已存在则将其覆盖。如果该文件不存在,创建新文件。

a 打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

ab 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。也就是说,新的内容将会被写入到已有内容之后。如果该文件不存在,创建新文件进行写入。

a+ 打开一个文件用于读写。如果该文件已存在,文件指针将会放在文件的结尾。文件打开时会是追加模式。如果该文件不存在,创建新文件用于读写。

2.IO

#P1 打开文件、读文件、关闭文件的典型方法

try:
    f=open('D:/test.txt','r')
    print(f.read())

finally:
    if f:
        f.close()

 

#P2 推荐的简洁写法,不必显示的关闭文件描述符

#open返回的对象在python中称作file-like 对象,可以是字节流、网络流、自定义流等

with open('D:/test.txt','r') as f:
    #按行读取
    for line in f.readlines():
        print(line.strip())

 

#P3 直接读取二级制的图片、视频文件

with open(‘D:/banner.jpg’,’rb’) as f2: 
for line in f2.readlines(): 
print(line.strip())

#P4 可以指定编码读取相应的数据,还可以忽略非法编码

with open('D:/test.txt','r',encoding='gbk',errors='ignore') as f3:
    for line in f3.readlines():
        print(line.strip())

 

#P5 写文件的流程和读文件是一样的 代开文件、写入内容、关闭文件

 # ‘r’ open for reading (default) 
# ‘w’ open for writing, truncating the file first 
# ‘x’ open for exclusive creation, failing if the file already exists 
# ‘a’ open for writing, appending to the end of the file if it exists 
# ‘b’ binary mode 
# ‘t’ text mode (default) 
# ‘+’ open a disk file for updating (reading and writing) 
# ‘U’ universal newlines mode (deprecated)*

with open('D:/test12.txt','a+') as f4:
    for line in f4.readlines():
        print(line.strip())
    f4.write('a new line2!')

 

ab+ 以二进制格式打开一个文件用于追加。如果该文件已存在,文件指针将会放在文件的结尾。如果该文件不存在,创建新文件用于读写。

3.

python的一种赋值 
a,b=b,a+b 
可以拆成 
a = b, b = a + b 
也就是说等号左边的第一个位置的等于等号右边的第一个位置 
等号左边第二个位置的等于等号右边第二个位置的。 
(a, b) = (b, a + b) 
要这样看才行

4.协程

yield 
解释器在遇到这个语句时,先计算expression,然后将结果返回给上一个调用者。而在第二次调用next()时,会从yield的下个语句开始执行。而不是你所理解的。

而讲到send()和next()的区别:

1 def consumer():
2     r = 'here'
3     for i in xrange(3):
4         yield r
5         r = '200 OK'+ str(i)

6

7 c = consumer()
8 n1 = c.next ()
9 n2 = c.next ()
10 n3 = c.next ()

 

对于普通的生成器,第一个next 调用,相当于启动生成器,会从生成器的第一行代码开始执行,直到第一次执行完yield语句(第4行),然后跳出生成器函数。 
然后第二个next 调用,从yield语句的下一句语句执行(第5行),然后重新运行到yield语句,执行后跳出,后面的以此类推。

1 def consumer():
2     r = 'here'
3     while True:
4         n1 = yield r
5         if not n1:
6             return
7         print('[CONSUMER] Consuming %s...' % n1)
8         r = '200 OK'+str(n1)
9
10 def produce(c):
11     aa = c.send(None)
12     n = 0
13     while n < 5:
14         n = n + 1
15         print('[PRODUCER] Producing %s...' % n)
16         r1 = c.send(n)
17         print('[PRODUCER] Consumer return: %s' % r1)
18     c.close()
19
20 c = consumer()
21 produce(c)

 

send(msg)和next ()在一定程度上是类似的,区别是send()可以传递yield表达式的值进去,而next ()不能,只能传递None进去。我们可以看做next ()和send(None)是一致的 
注意:第一次调用时,使用next ()或send(None),不能使用send发送一个非None的值,否则会报错,因为没有python yield语句来接收这个值。 
第一次执行send(None)(11行),启动生成器,第一行代码执行到yield后,跳出生成器函数,此时,n1一直没有定义。 
下面运行到c.send(1),进入生成器函数,从第4行开始执行,先把1赋值给n1,但是并不执行yield语句部分。 
下面继续从yield的下一语句继续执行,然后重新运行到yield语句,执行后,跳出生成器。

综上,send和next 相比,多了一次赋值的动作,其他的流程是相同的。



posted @ 2017-11-26 09:54  Jerryi224  阅读(219)  评论(0编辑  收藏  举报