1.1、Python基础
基于Python3.10
本教程只是简单介绍了 Python 语言概念和功能。读者在阅读本教程时最好使用 Python 解释器以便随时动手练习。本教程中的所有示例都是相互独立的并可离线阅读。
标准库与模块的内容详见 Python 标准库。Python 语言参考手册 是更正规的语言定义。如要编写 C 或 C++ 扩展请参考 扩展和嵌入 Python 解释器 和 Python/C API 参考手册。此外,深入讲解 Python 的书籍也有很多。
本教程对每一个功能的介绍并不完整,甚至没有涉及全部常用功能,只是介绍了 Python 中最值得学习的功能,旨在让读者快速感受一下 Python 的特色。学完本教程的读者可以阅读和编写 Python 模块和程序,也可以继续学习 Python 标准库。
强烈推荐阅读 术语对照表。
一、Python 解释器
1.1. 调用解释器
Python 解释器在可用的机器上通常安装于 /usr/local/bin/python3.10 路径下;将 /usr/local/bin 加入你的 Unix 终端的搜索路径就可以通过键入以下命令来启动它:
python3.10
这样,就可以在 shell 中运行 Python 了 1 。因为可以选择安装目录,解释器也有可能安装在别的位置;如果还不明白,就去问问身边的 Python 大神或系统管理员。(例如,常见备选路径还有 /usr/local/python。)
在 Windows 机器上当你从 Microsoft Store 安装 Python 之后,python3.10 命令将可使用。 如果你安装了 py.exe 启动器,你将可以使用 py 命令。 请参阅 附录:设置环境变量 了解其他启动 Python 的方式。
在主提示符中,输入文件结束符(Unix 里是 Control-D,Windows 里是 Control-Z),就会退出解释器,退出状态码为 0。如果不能退出,还可以输入这个命令:quit()。
在支持 GNU Readline 库的系统中,解释器的行编辑功能包括交互式编辑、历史替换、代码补全等。检测是否支持命令行编辑最快速的方式是,在首次出现 Python 提示符时,输入 Control-P。听到“哔”提示音,说明支持行编辑;请参阅附录 交互式编辑和编辑历史,了解功能键。如果没有反应,或回显了 ^P,则说明不支持行编辑;只能用退格键删除当前行的字符。
解释器的操作方式类似 Unix Shell:用与 tty 设备关联的标准输入调用时,可以交互式地读取和执行命令;以文件名参数,或标准输入文件调用时,则读取并执行文件中的 脚本。
启动解释器的另一种方式是 python -c command [arg] ...,这与 shell 的 -c 选项类似,其中,command 需换成要执行的语句。由于 Python 语句经常包含空格等被 shell 特殊对待的字符,一般情况下,建议用单引号标注整个 command。
Python 模块也可以当作脚本使用。输入:python -m module [arg] ...,会执行 module 的源文件,这跟在命令行把路径写全了一样。
在交互模式下运行脚本文件,只要在脚本名称参数前,加上选项 -i 就可以了。
命令行的所有选项详见 命令行与环境。
1.2. 传入参数
解释器读取命令行参数,把脚本名与其他参数转化为字符串列表存到 sys 模块的 argv 变量里。执行 import sys,可以导入这个模块,并访问该列表。该列表最少有一个元素;未给定输入参数时,sys.argv[0] 是空字符串。给定脚本名是 '-' (标准输入)时,sys.argv[0] 是 '-'。使用 -c command 时,sys.argv[0] 是 '-c'。如果使用选项 -m module,sys.argv[0] 就是包含目录的模块全名。解释器不处理 -c command 或 -m module 之后的选项,而是直接留在 sys.argv 中由命令或模块来处理。
1.3. 交互模式
在终端(tty)输入并执行指令时,解释器在 交互模式(interactive mode) 中运行。在这种模式中,会显示 主提示符,提示输入下一条指令,主提示符通常用三个大于号(>>>)表示;输入连续行时,显示 次要提示符,默认是三个点(...)。进入解释器时,首先显示欢迎信息、版本信息、版权声明,然后才是提示符:
$ python3.10
Python 3.10 (default, June 4 2019, 09:25:04)
[GCC 4.8.2] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>
交互模式的内容详见 交互模式。
2. 解释器的运行环境
2.1. 源文件的字符编码
默认情况下,Python 源码文件的编码是 UTF-8。这种编码支持世界上大多数语言的字符,可以用于字符串字面值、变量、函数名及注释 —— 尽管标准库只用常规的 ASCII 字符作为变量名或函数名,可移植代码都应遵守此约定。要正确显示这些字符,编辑器必须能识别 UTF-8 编码,而且必须使用支持文件中所有字符的字体。
如果不使用默认编码,则要声明文件的编码,文件的 第一 行要写成特殊注释。句法如下:
# -*- coding: encoding -*-
其中,encoding 可以是 Python 支持的任意一种 codecs。
比如,声明使用 UTF-8 编码,源码文件要写成:
# -*- coding: UTF-8 -*-
第一行 的规则也有一种例外情况,源码以 UNIX "shebang" 行 开头。此时,编码声明要写在文件的第二行。例如:
#!/usr/bin/env python3
# -*- coding: UTF-8 -*-
二. Python 速览
1. Python 用作计算器
1.1数字
解释器像一个简单的计算器:输入表达式,就会给出答案。表达式的语法很直接:运算符 +、-、*、/ 的用法和其他大部分语言一样(比如,Pascal 或 C);括号 (()) 用来分组。例如:
>>> 2 + 2
4
>>> 50 - 5*6
20
>>> (50 - 5*6) / 4
5.0
>>> 8 / 5 # 除法总是返回浮点数
1.6
整数(如,2、4、20 )的类型是 int,带小数(如,5.0、1.6 )的类型是 float。
除法运算(/)返回浮点数。用 // 运算符执行的结果是整数(忽略小数);计算余数用 %:
>>> 17 / 3 # 除法返回浮点数
5.666666666666667
>>> 17 // 3 # 返回整数
5
>>> 17 % 3 # 取余
2
>>> 5 * 3 + 2 # 科学计算
17
Python 用 ** 运算符计算乘方
>>> 5 ** 2 # 5 的平方
25
>>> 2 ** 7 # 2的7次方
128
等号(=)用于给变量赋值。赋值后,下一个交互提示符的位置不显示任何结果:
>>> width = 20
>>> height = 5 * 9
>>> width * height
900
如果变量未定义(即,未赋值),使用该变量会提示错误:
>>> n # try to access an undefined variable
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
NameError: name 'n' is not defined
Python 全面支持浮点数;混合类型运算数的运算会把整数转换为浮点数:
>>> 4 * 3.75 - 1
14.0
1.2字符串
除了数字,Python 还可以操作字符串。字符串有多种表现形式,用单引号('……')或双引号("……")标注的结果相同
- 反斜杠 \ 用于转义:
>>> 'spam eggs' # 单引号
'spam eggs'
>>> 'doesn\'t' # 使用\‘转义单引号...
"doesn't"
>>> "doesn't" # ...或者改用双引号
"doesn't"
>>> '"Yes," they said.'
'"Yes," they said.'
如果不希望前置 \ 的字符转义成特殊字符,可以使用 原始字符串,在引号前添加 r 即可:
>>> print('C:\some\name') # here \n means newline!
C:\some
ame
>>> print(r'C:\some\name') # note the r before the quote
C:\some\name
字符串字面值可以包含多行。 一种实现方式是使用三重引号:"""...""" 或 '''...'''。 字符串中将自动包括行结束符,但也可以在换行的地方添加一个 \ 来避免此情况。 参见以下示例:
print("""\
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
""")
输出如下(请注意开始的换行符没有被包括在内):
Usage: thingy [OPTIONS]
-h Display this usage message
-H hostname Hostname to connect to
字符串可以用 + 合并(粘到一起),也可以用 * 重复:
>>> # 3 times 'un', followed by 'ium'
>>> 3 * 'un' + 'ium'
'unununium'
相邻的两个或多个 字符串字面值 (引号标注的字符)会自动合并:
>>> 'Py' 'thon'
'Python'
拆分长字符串时,这个功能特别实用:
>>> text = ('Put several strings within parentheses '
... 'to have them joined together.')
>>> text
'Put several strings within parentheses to have them joined together.'
这项功能只能用于两个字面值,不能用于变量或表达式:
>>> prefix = 'Py'
>>> prefix 'thon' # can't concatenate a variable and a string literal
File "<stdin>", line 1
prefix 'thon'
^
SyntaxError: invalid syntax
>>> ('un' * 3) 'ium'
File "<stdin>", line 1
('un' * 3) 'ium'
^
SyntaxError: invalid syntax
合并多个变量,或合并变量与字面值,要用 +:
>>> prefix + 'thon'
'Python'
字符串支持 索引 (下标访问),第一个字符的索引是 0。单字符没有专用的类型,就是长度为一的字符串:
>>> word = 'Python'
>>> word[0] # 位置0中的字符
'P'
>>> word[5] # 位置5中的字符
'n'
索引还支持负数,用负数索引时,从右边开始计数:
>>> word = 'Python'
>>> word[-1] # 最后一个字符
'n'
>>> word[-2] # 倒数第二个字符
'o'
>>> word[-6]
'P'
注意,-0 和 0 一样,因此,负数索引从 -1 开始。
除了索引,字符串还支持 切片。索引可以提取单个字符,切片 则提取子字符串:
>>> word[0:2] # 从位置0(包括)到2(不包括)的字符
'Py'
>>> word[2:5] # 从位置2(随附)到5(不包括)的字符
'tho'
切片索引的默认值很有用;省略开始索引时,默认值为 0,省略结束索引时,默认为到字符串的结尾:
>>> word = 'Python'
>>> word[:2] # 从开头到位置2的字符(不包括)
'Py'
>>> word[4:] # 从位置4(包括)到结尾的字符
'on'
>>> word[-2:] # 从倒数-2位置(包括)到结尾的字符
'on'
注意,输出结果包含切片开始,但不包含切片结束。因此,s[:i] + s[i:] 总是等于 s:
>>> word = 'Python'
>>> word[:2] + word[2:]
'Python'
>>> word[:4] + word[4:]
'Python'
还可以这样理解切片,索引指向的是字符 之间 ,第一个字符的左侧标为 0,最后一个字符的右侧标为 n ,n 是字符串长度。例如:
+---+---+---+---+---+---+
| P | y | t | h | o | n |
+---+---+---+---+---+---+
0 1 2 3 4 5
-6 -5 -4 -3 -2 -1
第一行数字是字符串中索引 0...5的位置,第二行数字是对应的负数索引位置。i 到 j 的切片由 i 和 j 之间所有对应的字符组成。
对于使用非负索引的切片,如果两个索引都不越界,切片长度就是起止索引之差。例如, word[1:3] 的长度是 2。
索引越界会报错:
>>> word[42] # the word only has 6 characters
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
IndexError: string index out of range
但是,切片会自动处理越界索引:
>>> word[4:42]
'on'
>>> word[42:]
''
Python 字符串不能修改,是 immutable 的。因此,为字符串中某个索引位置赋值会报错:
>>> word[0] = 'J'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
>>> word[2:] = 'py'
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: 'str' object does not support item assignment
immutable -- 不可变
具有固定值的对象。不可变对象包括数字、字符串和元组。这样的对象不能被改变。如果必须存储一个不同的值,则必须创建新的对象。它们在需要常量哈希值的地方起着重要作用,例如作为字典中的键。
要生成不同的字符串,应新建一个字符串:
>>> 'J' + word[1:]
'Jython'
>>> word[:2] + 'py'
'Pypy'
内置函数 len() 返回字符串的长度:
>>> s = 'supercalifragilisticexpialidocious'
>>> len(s)
34