Python 2.7 学习笔记 模块和包

我们来考虑下如下几种场景:

1、编写一个python程序,如果程序比较简单,则可以把代码放到一个python文件中。但如果程序功能比较多,可能需要多个python文件来组织源代码。而这些文件之间的代码肯定有关联,比如一个文件中的python代码调用另一个python文件中定义的函数。

2、我们编写程序,肯定不会所有的东西都自己写,不会全部重造轮子,我们肯定会用到Python提供的一些标准库。那怎么使用呢?其实前面的文章中已经看到了,用import语句。 如同java中用import,c#中用using语句。

3、我们自想编写一个公共代码,或从外部找到一个第三方的公共代码,如何放入到整个python系统中,如何被自己编写的代码使用。

上面这些场景,都是在编写程序时常见的事情。

这些问题,python是通过模块和包的机制来解决的。

简单的说,一个模块就是一个python文件,一个包是包含一组模块。下面我们通过实际的例子来说明。

一、案例1:一个最简单例子

编写 test1.py文件,代码如下 

#coding=utf-8
import test2
print "hello"
test2.fun("world")

编写test2.py文件,代码如下

#coding=utf-8
def fun(para):
    print para

这两个python文件位于同一目录,但不一定要在python的相关系统目录下,可以是任意的合法目录。

这时我们执行 test1.py,可以成功运行。
可以看出,test1.py中的代码 调用了 test2.py中的 fun方法,这能够调用的关键是在test1.py中 import test2这个语句,表示将test2.py这个模块引入进来,

同时调用时是通过  模块名.函数名 调用的。

 

二、案例2: 如何放置模块

上面的例子,是两个python文件位于同一目录下。如果test2.py想放在其它目录下怎么办呢?

这里关键是让python解释器能找到 test2.py。

这种情况很常见,比如 test2.py是个通用的模块,可以被多个程序使用,那它就不能与使用它的程序放在一起,否则就要拷贝多份了。

将test2.py 放在其它地方,有多种方法,下面分别介绍。

方法一:放在python已有的系统目录下

把模块(python文件)放在python的系统目录下,引入模块时,python解释器就能找到。

可以通过如下的代码查看当前有哪些系统目录:

>>> import sys,pprint
>>> pprint.pprint(sys.path)
['',
 'C:\\Python27\\lib\\site-packages\\pip-7.1.2-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\paramiko-1.15.2-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\robotframework_sshlibrary-2.1.1-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\ecdsa-0.13-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\selenium-2.47.1-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\decorator-4.0.2-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\easyprocess-0.1.9-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\webtest-2.0.20-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\beautifulsoup4-4.4.1-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\waitress-0.8.10-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\webob-1.5.1-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\six-1.10.0-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\jsonpointer-1.10-py2.7.egg',
 'C:\\Python27\\lib\\site-packages\\jsonpatch-1.12-py2.7.egg',
 'C:\\Windows\\system32\\python27.zip',
 'C:\\Python27\\DLLs',
 'C:\\Python27\\lib',
 'C:\\Python27\\lib\\plat-win',
 'C:\\Python27\\lib\\lib-tk',
 'C:\\Python27',
 'C:\\Python27\\lib\\site-packages',
 'C:\\Python27\\lib\\site-packages\\win32',
 'C:\\Python27\\lib\\site-packages\\win32\\lib',
 'C:\\Python27\\lib\\site-packages\\Pythonwin']

python的 标准库 sys模块中的path对象包含了所有的系统路径,利用 pprint模块中的pprint方法可以格式化的显示数据,如果用内置语句print则只能在一行显示所有内容,查看不方便。
我们只要把python文件(如本文例子中的test2.py)放在上述任何目录下,python解释器就能找到。

注意:必须直接放在上述目录下,不能建立子目录,放在子目录下。要想能放到子目录下,就是包的概念,下面会介绍。

方法二:新增系统目录

除了python自己默认的一些系统目录外,应用程序也可以通过代码添加系统目录。

因为系统路径是存在 sys.path对象下的,path对象是个列表,就可以自己通过代码往其中插入目录,如

sys.path.append("D:/demo/python/dir")

但很显然,插入的这个目录作为系统目录只能对当前程序生效,因为这只是在内存中生效。

方法三:设置环境变量

如果我们不想把代码放在python的系统目录下,以免和python的目录混在一起,增加管理的复杂性。

甚至有的时候,因为权限的原因,还不能在python的系统目录下加文件。

而希望放在自己规划的目录下。 这时就可以操作系统的 PYTHONPATH 环境变量,该环境变量包含一系列的目录。

该环境变量下的所有目录都能被python解释器搜到。

这样我们就可以将代码放到PYTHONPATH 环境变量包含的目录下(注意不能是子目录,除非是包),就可以被别的程序import了。

设置PYTHONPATH 环境变量是相对比较好的方式,推荐使用。

 

案例三:路径的优先级

根据上面的介绍,一个模块要能别的程序引用(import)到,可以和程序放在一个目录,可以放到python系统目录下,可以放到PYTHONPATH 环境变量包含的目录下,那哪个优先级最高。

这时我们可以测试下,写三个同名文件,文件中定义同名的函数,函数只有一个print语句,但三个文件中的函数的print语句内容不同。

再编写另外一个程序import上面这个文件,并调用定义的函数,看看输出,就知道优先级了。

经过测试,发现优先级从高到底分别是:

1)当前目录

2)环境变量PYTHONPATH包含的路径

3)python系统目录

这个其实也很好理解,正常情况,越是用户的设置优先级越高。

 

案例四:包

我们上面的介绍,每个模块都是独立的一个python文件。为了让python能发现他们,必须放在相应的目录下。

没有分层,容易造成命名冲突和管理上的混乱。

特别在实际情况下,一个功能往往由多个模块(文件)组成,一般我们希望把这些代码放在一个目录下,便于管理。

这就要用到python的包的机制了。

python的包,物理上是一个目录,它实际上也是一个模块,只是比较特殊的模块,就是它还能包含其它模块。

下面我们举例来说明:

我们创建一个目录,如 testpackage

要想这个目录成为一个python包,而不是一个普通的目录,关键是在该目录下创建一个文件 __init__.py , init的前后分别是两个连续的下划线。

__init__.py文件名是固定的,但其中内容是任意的,就如同编写一个模块一样,可以放置任意的代码。如:

#coding=utf-8
print "hello,i am package"
def hello():
    print "good"

我们再在testpackage目录 所在的目录下建立一个test.py文件,内容如下

#coding=utf-8
import testpackage
testpackage.hello()

test.py中就导入了testpackage,这时我们执行test.py,发现输出:
hello,i am package
good

可以看出,testpackage就是一个特殊的模块,但因为它本身不是一个python文件,而是一个目录,那么它下面的__init__.py 就是模块的内容,导入包,其实就是导入__init__.py文件。 而普通模块对应的是python文件,要求模块名和文件名一致。

我们再在 testpackage 下建立两个文件,module1.py , module2.py ,内容分别是:

#coding=utf-8
def fun1():
    print "module1"
#coding=utf-8
def fun2():
    print "module2"

下面我们来使用这两个模块,修改test.py文件。修改后的test.py的内容如下:

#coding=utf-8
import testpackage
import testpackage.module1
from testpackage import module2
testpackage.hello()
testpackage.module1.fun1()
module2.fun2()

执行test.py的输出如下:
hello,i am package
good
module1
module2

下面我们来分析下test.py中的内容

可以看出,我们用两种不同的方式导入了module1模块和 module2模块。

采用import testpackage.module1 方式,则要求在使用module1中的函数等时,需要全路径引用,如testpackage.module1.fun1()。

采用from testpackage import module2方式,则要求在使用module2中的函数等时,可以省略包名引用,如module2.fun2()。

一般情况下,我们采用from导入的方式。

还有一点需要说明的是,导入包中的模块,这时就不再需要导入包,因为会自动先导入模块所在的包,也就是说会自动导入包的__init__.py文件。

另外一点,既然包是一个特殊的模块,它的存放和普通模块一样,可以和用它的程序在一个目录下,可以在python系统目录下,也可以放到环境变量PYTHONPATH包含的目录下。

有了包这个功能,对于复杂的程序,就可以更好的组织源代码。

 

案例五:模块中能放什么呢?

在前面的例子中,已经涉及到了一些内容,下面我们再来更为详细的介绍下模块中能放什么,怎么用的问题。

第一,模块中能放什么,理论上说,跟普通的python代码文件一样,可以放 变量、函数定义、类定义,甚至直接的语句调用等内容。

第二,用的问题。首先就要被导入。

被导入时,模块中直接写的语句,如 print就会被立即执行,变量等也会被定义和初始化(如果有的话)。

 

第三,一个python文件,既可以作为作为主程序直接被执行,也可以作为一个模块被其它程序(或模块)导入。

那有的时候,我们希望有些直接写在文件最顶层的代码(不是函数或类)在作为程序直接执行 和 作为模块导入时是有差别的,那该怎么办?

我们还是看例子。

假设有 test1.py文件,其内容:

if __name__=="__main__":
    print "hello,i am run self"
else:
    print "hello,i am import by other"    

如果我们执行运行test1.py,如在命令行下执行: python test1.py,我们发现打印的是 hello,i am run self 。

如果我们在别的程序中导入test1.py,如 import test1。我们发现打印的是 hello,i am import by other。

__name__是一个系统变量,当其值是__main__时,表示它是作为主程序被执行的。

通过这种方式,我们就可以将一个py文件 作为主程序 和 模块导入时 的差异化同时实现。

 

posted @ 2016-03-31 11:18  51kata  阅读(2586)  评论(0编辑  收藏  举报