简明python教程 --C++程序员的视角(三):模块
模块和包
1 python程序由包(package)、模块(module)和函数组成。包是由一系列模块组成的集合。模块是处理某一类问题的函数和类的集合。函数是一段可以重复多次调用的代码。
2 python的程序是由一个个模块组成的。模块把一组相关的函数或代码组织到一个文件中,一个文件即是一个模块。模块由代码、函数和类组成。每个模块文件是一个独立完备的命名空间,一个模块文件不能看到其他文件定义的变量名,除非它明确地导入了那个文件,模块文件起到了最小化命名冲突的作用。
3 导入模块使用import和from语句(都是隐性的赋值语句),以及reload函数。陷阱:使用from导入变量,而那些变量碰巧和作用域中现有的变量同名,本地变量就会被悄悄地覆盖掉;使用import则没这个问题。
4 包就是一个完成特定任务的工具箱,包的作用是实现程序的重用。包必须含有一个__init__.py文件,它用于标识当前文件夹是一个包。根据功能把文件组织成子目录,包导入会让模块扮演的角色更为明显,也使代码更具有可读性。
5 可以导入模块名,还可以指定目录路径(Python代码的目录就称为包),包导入就是把计算机上的目录变成另一个Python命名空间,包的属性就是该目录包含的子目录和模块文件。
6 当多个同名程序文件安装在某机器上时,包导入可以偶尔用来解决导入的不确定性。导入包也使用import和from语句。
使用sys模块
想要在其他程序中重用很多函数,就要使用模块。模块基本上就是一个包含了所有你定义的函数和变量的文件。为了在其他程序中重用模块,模块的文件名必须以.py
为扩展名。
模块可以从其他程序 输入以便利用它的功能。模块的用处在于它能为你在别的程序中重用它提供的服务和功能。Python附带的标准库就是这样一组模块的例子。首先,我们将学习如何使用标准库模块。
- 首先,我们利用
import
语句 输入sys
模块。sys是"system”的缩写sys
模块包含了与Python解释器和它的环境有关的函数。当Python执行import sys
语句的时候,它在sys.path
变量中所列目录中寻找sys.py
模块。如果找到了这个文件,这个模块的主块中的语句将被运行,然后这个模块将能够被你 使用 。注意,初始化过程仅在我们 第一次 输入模块的时候进行。 sys
模块中的argv
变量通过使用点号指明——sys.argv
——这种方法的一个优势是这个名称不会与任何在你的程序中使用的argv
变量冲突。另外,它也清晰地表明了这个名称是sys
模块的一部分。sys.argv变量是一个
包含了 命令行参数 的字符串的列表,即使用命令行传递给你的程序的参数。如果你使用IDE编写运行这些程序,请在菜单里寻找一个指定程序的命令行参数的方法。(在Spyder下按F6)
- 这里,当我们执行
python using_sys.py we are arguments
的时候,我们使用python命令运行using_sys.py
模块,后面跟着的内容被作为参数传递给程序。Python为我们把它存储在sys.argv
变量中。记住,脚本的名称总是sys.argv
列表的第一个参数。所以,在这里,'using_sys.py'
是sys.argv[0]
、'we'
是sys.argv[1]
、'are'
是sys.argv[2]
以及'arguments'
是sys.argv[3]
。注意,Python从0开始计数,而非从1开始。 sys.path
包含输入模块的目录名列表。我们可以观察到sys.path
的第一个字符串是空的——这个空的字符串表示当前目录也是sys.path
的一部分,这与PYTHONPATH
环境变量是相同的。这意味着你可以直接输入位于当前目录的模块。否则,你得把你的模块放在sys.path
所列的目录之一。
字节编译的.pyc文件
输入一个模块相对来说是一个比较费时的事情,所以Python做了一些技巧,以便使输入模块更加快一些。
一种方法是创建 字节编译的文件 ,这些文件以.pyc
作为扩展名。字节编译的文件与Python变换程序的中间状态有关(是否还记得Python如何工作的介绍?)。当你在下次从别的程序输入这个模块的时候,.pyc
文件是十分有用的——它会快得多,因为一部分输入模块所需的处理已经完成了。另外,这些字节编译的文件也是与平台无关的。
from..import语句
如果你想要直接输入argv
变量到你的程序中(避免在每次使用它时打sys.
),那么你可以使用from sys import argv
语句。如果你想要输入所有sys
模块使用的名字,那么你可以使用from sys import *
语句。这对于所有模块都适用。
一般说来,应该避免使用from..import
而使用import
语句,因为这样可以使你的程序更加易读,也可以避免名称的冲突。
模块的__name__
当一个模块被第一次输入import的时候,这个模块的主块将被运行。假如我们只想在程序本身被使用的时候运行主块,而在它被别的模块输入的时候不运行主块,这可以通过模块的__name__属性完成。
每个Python模块都有它的__name__
,如果它是'__main__'
,这说明这个模块被用户单独运行,我们可以进行相应的恰当操作。
制造你自己的模块
每个Python程序也是一个模块。你已经确保它具有.py
扩展名了。记住这个模块应该被放置在我们输入它的程序的同一个目录中,或者在sys.path
所列目录之一。
文件dir/untitled0.py:
文件dir/untitled1.py
下面是一个使用from..import
语法的版本。
结果是一样的:
dir()函数
当你为dir()
提供一个模块名的时候,它返回模块定义的名称列表(函数、类和变量)。如果不提供参数,它返回当前模块中定义的名称列表。
首先,我们来看一下在输入的sys
模块上使用dir
。我们看到它包含一个庞大的属性列表。
接下来,我们不给dir
函数传递参数而使用它——默认地,它返回当前模块的属性列表。注意,输入的模块同样是列表的一部分。
为了观察dir
的作用,我们定义一个新的变量a
并且给它赋一个值,然后检验dir
,我们观察到在列表中增加了以上相同的值。我们使用del
语句删除当前模块中的变量/属性,这个变化再一次反映在dir
的输出中。
关于del
的一点注释——这个语句在运行后被用来 删除 一个变量/名称。在这个例子中,del a
,你将无法再使用变量a
——它就好像从来没有存在过一样。结果: