Python学习笔记4（函数与模块）

1.Python程序的结构

Python的程序由包(package)、模块(module)和函数组成。

模块是处理一类问题的集合，由函数和类组成。

包是由一系列模块组成的集合。包是一个完成特定任务的工具箱。

2.函数

2.1函数的定义

def sayHello(): 
   print 'Hello World!'        # block belonging to the function 
sayHello()

2.2函数的参数
Python中任何东西都是对象，所以参数只支持引用传递的方式。Python通过名称绑定的机制，把实际参数的值和形式参数的名称绑在一起。即形参与实参指向内存中同一个储存空间。

def arithmetic (x = 1, y =  1, operator = "+"):
    result = {
        "+" : x + y,
        "-" : x - y,
        "*" : x * y,
        "/" : x / y
    }
    return result.get(operator)

print (arithmetic(1,2))
print (arithmetic(y = 2, operator = "-")
print (arithmetic(y = 3, x = 1, operator = "*")       #  使用赋值表达式传递参数，可以颠倒参数列表的顺序

# 列表作为参数
def arithmetic (args = [], operator = "+"):
    x = args[0]
    y = args[1]         
    result = {
        "+" : x + y,
        "-" : x - y,
        "*" : x * y,
        "/" : x / y
    }
    return result.get(operator)

print (arithmetic([1,2]))

#  使用默认参数出现预期外结果
def append(args = []):
    args.append(0)
    print (args)

append()                        # [0]
append([1])                   # [1,0]
append()                        # [0,0] , 使用的仍是第一次调用的args

# 避免重复问题
def append(args = []):
    if len(args) <= 0                 # 若args中没有元素，将其列表置空
        args = []
    args.append(0)
    print(args)

append()                        # [0]
append([1])                   # [1,0]
append()                        # [0]

#  传递可变参数
def func(*args):                  #  传入的实参被“打包”到一个args元组中
    print args
func(1,2,3)

 1 # 传递可变参数——字典
 2 def search (*t, **d):             #  在形参前加"**"，可以引用一个字典
 3     keys = d.keys()
 4     values = d.values()
 5     print (keys)
 6     print (values)
 7     for args in t:
 8         for key in keys:
 9             if args == key:
10                 print ("find：", d[key])
11 
12 search("one", "three", one = "1", two = "2", three = "3")

2.3函数的返回值
返回值用return语句，其后可为变量或表达式。Python中即使函数无返回值，依旧可以获得返回值None。或者return不带任何参数时，也返回None。

# return返回多个值，打包到元组内
def func(x,y,z):
    l = [x,y,z]
    l.reverse()
    numbers = tuple(l)                 # a,b,c = tuple(l)
    return numbers                      # return a,b,c

x,y,z = func(0,1,2)
print (x,y,z)

2.4函数的嵌套
Python不仅支持函数体内嵌套，还支持函数定义的嵌套。

#  在函数体内部定义函数
def func():
    x=1
    y=2
    m=3
    n=4
    def sun(a,b): 
        return a+b
    def sub(a,b):;
        return a-b
    return sum(x,y) * sub(m,n)

print(func())

#  嵌套函数，直接使用外层函数的变量
def func():
    x=1
    y=2
    m=3
    n=4
    def sun(): 
        return x+y
    def sub():;
        return m-n
    return sum() * sub()

print(func())

PS:尽量不要在函数内部定义函数，不便于程序维护
2.5递归函数

#  计算阶乘
def refunc(n):
    i=1
    if n > 1:
        i = n
        n = n * refunc(n-1)
    print ("%d! =" %i,n)
    return n

refunc(5)

# output:
1! = 1
2! = 2
3! = 6
4! = 24
5! = 120

#  使用reduce计算阶乘
From functools import reduce
print ("5! =", reduce(lambda x, y: x * y, range(1,6)))

2.6lambda函数
用于创建一个匿名函数，函数名未和标识符进行绑定。使用lambda函数可以返回一些简单的运算结果。通常把lambda赋值给一个变量，该变量就可以作为函数使用。

func = lambda 变量1,变量2,... : 表达式

func()

# lambda
def func():
    x=1
    y=2
    m=3
    n=4
    sum = lambda x, y : x + y 
    print (sum)
    sub() = lambda m, n : m - n 
    print (sub)
    return sum(x,y) * sub(m,n)

print(func())

# lambda的函数用法
print ( (lambda x : -x) (-2))        #给x赋值-2

PS：lambda中只能使用表达式，不能使用判断、循环等多重语句。
2.7Generator函数

生成器（Generator）的作用是一次产生一个数据项，并把数据项输出。Generator函数可以用在for循环中遍历。Generator函数每次返回一个数据项的特性，使得迭代器的性能更佳。

# 定义Generator函数
def func(n):
    for i in range(n):
        yield i
# 在for循环中输出
for i in func(3):             
    print (i)                                           # 0 1 2
# 使用next()输出
r = func(3)
print (r.next())                                    # 0
print (r.next())                                    # 1
print (r.next())                                    # 2
print (r.next())                                    # 已无数据生成，抛出异常StopIteration

# yield 与 return的区别
def func(n):
    for i in range(n):
        return i                                          # return 函数运行到此为止
def func2(n):
    for i in range(n):
        yield i                                            # 循环生成n个数，不会被终止

print (func(3))                                        # 0
f = func2(3)
print (f)                                                  #  返回函数func2的地址
print (f.next())                                        # 0
print (f.next())                                        # 1

Generator函数依次只赶回一个数据项，占用更少的内存。每次生成数据都要记录当前的状态，便于生成下一次数据。数据的访问通过next()实现。当访问越界时，抛出异常StopIteration。

2.8global语句

如果你想要为一个定义在函数外的变量赋值，那么你就得告诉Python这个变量名不是局部的，而是全局的。我们使用global语句完成这一功能。没有global语句，是不可能为定义在函数外的变量赋值的。

def func():
    global x
    print 'x is', x                                     # 50
    x = 2
    print 'Changed local x to', x                # 2
x = 50 
func()
 print 'Value of x is', x                             # 2

3.模块

3.1使用sys模块

import sys                                  # from sys import argv
print 'The command line arguments are:' 
for i in sys.argv:
    print i 
print '\n\nThe PYTHONPATH is', sys.path,  '\n' 

# output
The command line arguments are: 
using_sys.py 
we 
are 
arguments

The PYTHONPATH is ['/home/swaroop/byte/code',
 '/usr/lib/python23.zip', '/usr/lib/python2.3', 
'/usr/lib/python2.3/plat-linux2', '/usr/lib/python2.3/lib-tk', '/usr/lib/python2.3/libdynload', '/usr/lib/python2.3/site-
packages', '/usr/lib/python2.3/site-packages/gtk-2.0']

Python中的import语句可以置于程序的任何位置。
sys模块包含了与Python解释器和它的环境有关的函数。

sys.argv变量是一个字符串的列表。特别地，sys.argv包含了命令行参数的列表，即使用命令行传递给你的程序的参数。

这里，当我们执行python using_sys.py we are arguments的时候，我们使用python命令运行using_sys.py模块，后面跟着的内容被作为参数传递给程序。Python为我们把它存储在sys.argv变量中。

脚本的名称总是sys.argv列表的第一个参数。所以，在这里，'using_sys.py'是sys.argv[0]、'we'是sys.argv[1]、'are'是sys.argv[2]以及'arguments'是sys.argv[3]。

sys.path包含输入模块的目录名列表。我们可以观察到sys.path的第一个字符串是空的——这个空的字符串表示当前目录也是sys.path的一部分，这与PYTHONPATH环境变量是相同的。这意味着你可以直接输入位于当前目录的模块。否则，你得把你的模块放在sys.path所列的目录之一。

3.2.pyc文件

使输入模块更加快的方法：

创建字节编译的文件，这些文件以.pyc作为扩展名。字节编译的文件与Python变换程序的中间状态有关。当你在下次从别的程序输入这个模块的时候，.pyc文件是十分有用的——它会快得多，因为一部分输入模块所需的处理已经完成了。另外，这些字节编译的文件也是与平台无关的。

3.3模块的__name__

当一个模块被第一次输入的时候，这个模块的主块将被运行。假如我们只想在程序本身被使用的时候运行主块，而在它被别的模块输入的时候不运行主块，这可以通过模块的 __name__属性完成。

_name_用于判断当前模块是否是程序的入口，如果当前程序正在被使用，_name_的值为"_main_"。

if __name__ == '__main__':
    print 'This program is being run by itself'
 else:
    print 'I am being imported from another module'

# output
This program is being run by itself 
$ python 
>>> import using_name
 I am being imported from another module

每个Python模块都有它的__name__，如果它是'__main__'，这说明这个模块被用户单独运行，我们可以进行相应的恰当操作。

3.4模块的创建

模块把一组相关的函数或代码组织到一个文件中。一个文件即是一个模块。模块由代码、函数或类组成。创建一个名为myModule.py的文件，即定义了一个名为myModule的模块。

#  自定义模块
def func():
    print ("MyModule.func()" )

class MyClass:
    def myFunc(self):
        print ("MyModule.MyClass.myFunc()")

#  在myModule.py所在目录下创建一个call_myModule.py的文件。在该文件中调用myModule模块的函数和类

import myModule
myModule.func()
myClass = myModule.MyClass()
myClass.myFunc()

另一个例子：

# Filename: mymodule.py 
def sayhi():
    print 'Hi, this is mymodule speaking.' 

version = '0.1' 

#  调用mymodule模板
import mymodule                                             #  from mymodule import sayhi, version 
mymodule.sayhi()
print 'Version', mymodule.version 

# output
$ python mymodule_demo.py 
Hi, this is mymodule speaking. 
Version 0.1

3.5模块的内置函数

Python提供了一个内联模板buildin。内联模板定义了一些开发中经常使用的函数，利用这些函数可以实现数据类型的转换、数据的计算、序列的处理等功能。

filter()

对某个序列做过滤处理，判断自定义函数的参数返回的结果是否为真来过滤，并一次性返回处理结果。

# 声明
class filter(object)
    filter(function or None, iterable)  --> filter object

# 功能
def func(x):
    if x > 0:
        return x

#  使用range()生成待处理的列表，然后把该列表的值依次传入func(),func()返回结果给filter()，最后将结果yield成一个iterable对象返回，依次遍历
#  output <filter object at 0x1022b2750>
#  直接打印出filter对象。最后一行将其转换为列表
print ( filter (func,range(-9,10)) )                   # 调用filter函数，返回filter对象
print ( list(filter(func,range(-9,10)))               # 将filter对象转换为列表

filter()中的过滤函数func()的参数不能为空。否则，没有可以存储sequence元素的变量，func()也不能处理过滤

reduce()

实现连续处理的功能，存在于functools模块中。

#  声明
reduce(func,sequence[, initial])  -> value

# func()是自定义函数，在其中实现对参数sequence即待处理序列的连续操作
# 参数initial可以省略，若不为空，则initial的值首先传入func()进行计算。若sequence为空，则对initial的值进行处理
# reduce()返回值为func()计算后的结果

#  功能
def sun(x,y):
    return x+y
from functools import reduce
print  (reduce(sum,range(0,10)))               # 0加到9，结果45
print  (reduce(sum,range(0,10),10))          # 10加0加到9，结果55
print  (reduce(sum,range(0,0),10))            # 结果10

如果用reduce()进行累计计算，必须在sum中定义两个参数，分别对应加法运算符两侧的操作数。

map()

可对多个序列的每个元素都执行相同的操作，并返回一个map对象。

#  声明
class map(object)
    map(func, *iterables)  --> map object

# func自定义函数，实现对每个元素的操作
# iterables是待处理序列，其个数可以是多个
# map返回值为处理后的列表

若map中提供多个序列，则每个序列中元素一一对应计算。若长度不等，短的后补None
3.6dir()函数

你可以使用内建的dir函数来列出模块定义的标识符。标识符有函数、类和变量。

当你为dir()提供一个模块名的时候，它返回模块定义的名称列表。如果不提供参数，它返回当前模块中定义的名称列表。

import sys 
 dir(sys)             # 输出sys模块上的属性列表。 ['__displayhook__', '__doc__', '__excepthook__', '__name__',
 '__stderr__', '__stdin__', '__stdout__', '_getframe', 'api_version',
 'argv', 'builtin_module_names', 'byteorder', 'call_tracing', 'callstats', 
'copyright', 'displayhook', 'exc_clear', 'exc_info', 'exc_type', 'excepthook', 
'exec_prefix', 'executable', 'exit', 'getcheckinterval', 'getdefaultencoding',
 'getdlopenflags', 'getfilesystemencoding', 'getrecursionlimit', 'getrefcount',
 'hexversion', 'maxint', 'maxunicode', 'meta_path','modules', 'path', 
'path_hooks', 'path_importer_cache', 'platform', 'prefix', 'ps1', 'ps2', 
'setcheckinterval', 'setdlopenflags', 'setprofile', 'setrecursionlimit', 'settrace', 
'stderr', 'stdin', 'stdout', 'version', 'version_info', 'warnoptions'] 

 dir()                 # 返回当前模块的属性列表，输入的模块同样是列表的一部分。 ['__builtins__', '__doc__', '__name__', 'sys'] 
a = 5            # create a new variable 'a' 
 dir()
 ['__builtins__', '__doc__', '__name__', 'a', 'sys'] 
del a           # delete/remove a name 
dir()
 ['__builtins__', '__doc__', '__name__', 'sys']

为了观察dir的作用，定义一个新的变量a并且给它赋一个值，检验dir，在列表中增加了以上相同的值。

我们使用del语句删除当前模块中的变量/属性，这个变化再一次反映在dir的输出中。

PS:del语句在运行后被用来删除一个变量/名称。在这个例子中，del a，你将无法再使用变量a——它就好像从来没有存在过一样。

3.7自定义包

包就是一个至少包含_init_.py文件的文件夹。包为了实现程序的重用，把实现一个常用功能的代码组合到一个包中，调用包提供的服务从而实现重用。

# 包的_init_.py程序
if _name_ == '_main_':
    print ('作为主程序运行')
else:
    print ('pack初始化')

# 包的myModule模块
def func():
    print ("pack.myModule.func()")

if _name_ == '_main_':
    print ('myModule作为主程序运行')
else:
    print ('pack被另一模块调用)

#  main模板调用pack中的函数
from pack import myModule                              

myModule.func()

# output:
pack初始化
myModule被另一个模板调用

pack.myModule.func()

_init_.py也可用于提供当前包的模块列表。eg.在pack包的_init_.py文件前添加一行代码

_all_ = ["myModule"]

_all_用于记录当前pack包所含的模板。其中方括号中的内容是模板名的列表，如果模块数量超过2个，使用逗号分开。

这样就可以在main模板中一次导入pack包中的所有模块。

from pack import *   

myModule.func()

# 首先执行pack包的_init_.py文件，然后在属性中查找pack包含有的模块。如果pack包的_init_.py文件不适用_all_属性记录模块名，main模块调用时将不能识别myModule模块。Python将提示如下错误：
NameError:name 'myModule' is not defend

posted @ 2016-09-13 00:13 Not-Bad 阅读(2130) 评论(0) 编辑收藏举报

刷新页面返回顶部

Not-Bad

我爱工作！

Python学习笔记4（函数与模块）

公告