关于python的一些笔记

 

  Python源文件默认以UTF-8编码。在这种编码下,世界上大多数语言的字符可以在字符串,标识符和注释中同时使用 — 尽管标准库中的标识符只使用ASCII字符,它是可移植代码应该遵循的一个惯例。为了能够正确显示所有的这些字符,你的编辑器必须能够识别文件是UTF-8编码,且必须使用支持文件中所有字符的字体。

  当然,也可以给源文件指定一个不同的编码。方法是在 #! 行的后面再增加一行特殊的注释来定义源文件的编码:

# -*- coding: encoding -*-

 

  如果你只打印range,会出现奇怪的结果:

>>> print(range(10))
range(0, 10)

  range()返回的对象的行为在很多方面很像一个列表,但实际上它并不是列表。当你迭代它的时候它会依次返回期望序列的元素,但是它不会真正产生一个列表,因此可以节省空间。

  我们把这样的对象称为可迭代的,也就是说,它们适合作为期望连续获得元素直到穷尽的函数和构造器的目标。我们已经看到for语句是这样的一个迭代器。list()函数是另外一个;它从可迭代对象创建列表。可以想象,list()函数迫使可迭代对象将所有元素一次性生成为list型。

>>> list(range(5))
[0, 1, 2, 3, 4]

 

  循环语句while/for可以有一个 else 子句;当循环是因为迭代完整个列表( for 语句)或者循环条件不成立(while 语句)终止,即正常终止,而非由break 语句终止时,else子句将被执行。下面循环搜索质数的代码例示了这一点:

 1 >>> for n in range(2, 10):
 2 ...     for x in range(2, n):
 3 ...         if n % x == 0:
 4 ...             print(n, 'equals', x, '*', n//x)
 5 ...             break
 6 ...     else:
 7 ...         # loop fell through without finding a factor
 8 ...         print(n, 'is a prime number')
 9 ...
10 2 is a prime number
11 3 is a prime number
12 4 equals 2 * 2
13 5 is a prime number
14 6 equals 2 * 3
15 7 is a prime number
16 8 equals 2 * 4
17 9 equals 3 * 3

  是的,这是正确的代码。看仔细:else子句属于for 循环,属于 if 语句。

 

  函数体的第一行可以是一个可选的字符串文本,此字符串是该函数的文档字符串,或称为docstring。有工具能使用 docstrings 自动生成文档(如在线文档等),以方便查阅。以下是两种常见的写法:

1 >>> def fib(n):    # write Fibonacci series up to n
2 ...     """Print a Fibonacci series up to n."""
3 ...     a, b = 0, 1
4 ...     while a < n:
5 ...         print(a, end=' ')
6 ...         a, b = b, a+b
7 ...     print()

  如果在文档字符串中有更多的行,第二行应该是空白,余下的行应该是一段或多段描述对象的调用约定、 其副作用等。若docstring是多行的,则该串不会被自动去除行缩进,所以必要时文档字符串处理工具应自己作清除缩进工作。以下是一种“约定”,用函数体首行之后的第一个非空行字符串确定整个串的缩进的量(注:首行的缩进并不适合使用,因为它通常紧靠着字符串起始的引号,缩进格式不清晰)。剩下其他行的行首等于缩进量的空格都将被过滤掉。当然,这仅是一种约定。

 1 >>> def my_function():
 2 ...     """Do nothing, but document it.
 3 ...
 4 ...     No, really, it doesn't do anything.
 5 ...     """
 6 ...     pass
 7 ...
 8 >>> print(my_function.__doc__)
 9 Do nothing, but document it.
10 
11     No, really, it doesn't do anything.

  

 

  函数的执行会引入一个新的符号表,用于函数的局部变量。更确切地说,函数中的所有的赋值都是将值存储在局部符号表;而变量引用首先查找局部符号表,然后是上层函数的局部符号表,然后是全局符号表,最后是内置名字表。因此,在函数内部全局变量不能直接赋值 (除非用 global 语句命名),虽然可以引用它们。换句话说,在函数内所做的赋值操作仅在该函数内有效,而函数外的变量仍然不变

1 a=10086
2 def change():
3     a=10010
4     return a
5 print(change())    --打印10010
6 print(a)        --打印10086

 

 

  注释以字典的形式存储在函数的__annotations__属性中,对函数的其它任何部分都没有影响。参数注释用一个冒号在参数名后面定义 , 冒号后面紧跟着一个用于计算注释的表达式。返回值的注释使用 "->"来定义的,是紧跟着参数列表和 def 语句的末尾的冒号之间的一个表达式。下面的示例包含有位置参数,关键字参数和返回值的注释各1个: 

 1 >>> def f(bird: str, egg:str ='pain')->str:
 2 ...     print("注释是", f.__annotations__)
 3 ...     print("参数有", bird, egg)
 4 ...     return bird+' and '+egg
 5 ...
 6 >>> f('viki')
 7 
 8 注释是 {'bird': <class 'str'>, 'egg': <class 'str'>, 'return': <class 'str'>}
 9 参数有 viki pain
10 viki and pain

  仔细看这句 egg:str ='pain' ,其中的'pain'是egg的一个默认值,与str无关。没有注释时应该是这样的,def f(bird, egg='pain')。

 

  代码风格 --Style推荐:PEP 0008 -- Style Guide for Python Code 

 


  如果想同时获取dict中的某个key-value对怎么办?通常在循环迭代字典的时候,键和对应的值通过使用items()方法可以同时得到。 具体操作如下:

1 >>> knights = {'gallahad': 'the pure', 'robin': 'the brave'}
2 >>> for k, v in knights.items():
3 ...     print(k, v)
4 ...
5 gallahad the pure
6 robin the brave

  此外,在序列(list,tuple)中遍历时,使用 enumerate() 函数也可以同时得到索引和对应的值。

1 >>> for i, v in enumerate(['tic', 'tac', 'toe']):
2 ...     print(i, v)
3 ...
4 0 tic
5 1 tac
6 2 toe

   如果想同时遍历两个或多个序列,使用 zip() 函数可以成对读取元素,这样子可能会引发一些序列的问题,比如多个序列的长度不一,有的就会被裁剪。简单操作例子:

1 >>> questions = ['name', 'quest', 'favorite color']
2 >>> answers = ['lancelot', 'the holy grail', 'blue']
3 >>> for q, a in zip(questions, answers):
4 ...     print('What is your {0}?  It is {1}.'.format(q, a))
5 ...
6 What is your name?  It is lancelot.
7 What is your quest?  It is the holy grail.
8 What is your favorite color?  It is blue.

  其实zip()函数就是返回一个可迭代对象,每次将传进去的所有参数的同一列的元素给返回了,以至于能同时获取多个序列的同一列的元素。

  反向遍历,首先可以正向生成这个序列,然后调用 reversed() 函数来将序列反置,注意返回的是一个新的对象:

 1 >>> x=[1,2,3,4,6,8,10]
 2 >>> for i in reversed(x):
 3 ...     print(i)
 4 ...
 5 10
 6 8
 7 6
 8 4
 9 3
10 2
11 1
12 [1, 2, 3, 4, 6, 8, 10]

  有一点需要特别注意,若要在循环内部修改正在遍历的序列(例如删除某些元素),建议您首先制作副本,因为在序列上循环每次都会读取对象,并不会隐式地创建副本。切片表示法使这尤其方便:

1 >>> words = ['cat', 'window', 'defenestrate']
2 >>> for w in words[:]:  # 关键在这使用切片
3 ...     if len(w) > 6:
4 ...         words.insert(0, w)
5 ...
6 >>> words
7 ['defenestrate', 'cat', 'window', 'defenestrate']

 

 

 

序列和其它类型的比较

  序列对象可以与同序列类型的其他对象相比较。比较按照‘字典序’进行如果一个序列是另一个序列的初始子序列,较短的序列就小于另一个。字符串的排序按照Unicode编码点的数值排序单个字符。下面是同类型序列之间比较的一些例子:

 

(1, 2, 3)              < (1, 2, 4)
[1, 2, 3]              < [1, 2, 4]
'ABC' < 'C' < 'Pascal' < 'Python'
(1, 2, 3, 4)           < (1, 2, 4)
(1, 2)                 < (1, 2, -1)
(1, 2, 3)             == (1.0, 2.0, 3.0)
(1, 2, ('aa', 'ab'))   < (1, 2, ('abc', 'a'), 4)

 

  注意,使用< 或者 >比较不同类型的对象是合法的,只要这些对象具有合适的比较方法。例如,不同的数字类型按照它们的数值比较,所以 0 等于 0.0,等等。但也不是任何情况下都是合法的,比如list和tuple比较时,解释器将引发一个TypeError异常。

 

 

 

 

posted @ 2015-12-20 11:06  xcw0754  阅读(189)  评论(0编辑  收藏  举报