代码改变世界

Python中的args和kwargs

2019-09-08 19:11  abce  阅读(11312)  评论(1编辑  收藏  举报

有时,你会看到python中定义函数的时候带有两个奇怪的参数:*args、**kwargs。如果你曾经想知道它们是干什么的,或者想知道你的IDE为什么在main()函数中定义它们,那么本文可以帮助到你。本文会告诉你在python中如何使用args和kwargs,来增加函数的灵活性。

 

1.传递多个参数给函数
*args和*kwargs允许你给一个参数传递多个参数或者keyword参数。考虑下面的例子。这是一个简单的函数,需要获取两个参数并返回它们之和:

def my_sum(a, b):
    return a + b

这个函数可以正常工作,但它仅限于两个参数。如果需要对不同数量的参数求和,如果传递的特定参数数量仅在运行时确定,该怎么办?创建一个可以对传递给它的所有整数求和的函数,不管是多少个参数,是不是很好?

 

2.在python函数定义中使用变量args
有多种方法可以给一个函数传递不同数量的参数。
对于有经验的人来说,第一种最直观的方法是使用集合。简单地传递一个list或者set作为函数的参数。因此,对于my_sum(),你可以将你所有要相加的所有整数以一个list的形式传入:

# sum_integers_list.py
def my_sum(my_integers):
    result = 0
    for x in my_integers:
        result += x
    return result

list_of_integers = [1, 2, 3]
print(my_sum(list_of_integers))

可以这样实现,但是每当你要调用这个函数的时候,你就需要创建一个list作为参数传入。这样可能并不方便,尤其是你实现并不知道要加入list的所有值的时候。

 

这就是*args的作用之处了,它可以让你传递可变数量的位置参数。以下为示例:

# sum_integers_args.py
def my_sum(*args):
    result = 0
    # Iterating over the Python args tuple
    for x in args:
        result += x
    return result

print(my_sum(1, 2, 3))

这个例子中,你不再需要向my_sum()函数传递一个list。而是传递三个不同的位置参数。my_sum()会获取所有输入的参数,并将它们打包成一个可迭代的简单对象,命名为args。
注意,args只是一个名字。你可以不用args这个名字。你可以选择任何你喜欢的名字,比如integers:

# sum_integers_args_2.py
def my_sum(*integers):
    result = 0
    for x in integers:
        result += x
    return result

print(my_sum(1, 2, 3))

这个函数仍然正常工作,即使你传递的可迭代对象是integers而不是args。这里最重要的是你使用的解包(unpacking)操作符(*)。

 

请记住,你使用解包(unpacking)操作符*获得的可迭代对象不是一个list,而是一个元组(tuple)。
一个元组(tuple)类似一个list,它们都支持切片和迭代。然而,元组(tuple)又是和list不同的,至少在一个方面:lists是可变的、tuple是不可变的。
为了测试这点,可以运行以下的代码。这个脚本尝试去修改一个list的值:

# change_list.py
my_list = [1, 2, 3]
my_list[0] = 9
print(my_list)

list中,第一个元素的值就被更新成了9。如果你执行这个脚本,你会看到list的值的确被修改了

$ python change_list.py
[9, 2, 3]

第一个元素的值不再是0,而是被更新成了9。现在,尝试对一个元组(tuple)做相同的操作:

# change_tuple.py
my_tuple = (1, 2, 3)
my_tuple[0] = 9
print(my_tuple)

这里,你可以看到相同的值,除了它们被作为一个元组被放在一起。如果你尝试执行脚本,你会看到python解释器返回了一个error:

$ python change_tuple.py
Traceback (most recent call last):
  File "change_tuple.py", line 3, in <module>
    my_tuple[0] = 9
TypeError: 'tuple' object does not support item assignment

这是因为元组(tuple)是不可变对象,它的值不能在指定后就不能被更改。请牢记这一点,当你使用tuple和*args的时候。

 

3.在python函数定义中使用变量kwargs

到这里,你已经知道*args的用途了,但是**kwargs呢?**kwargs工作原理和*args有点类似,但不是接收位置参数,而是接收关键字(keyword)参数(也叫被命名的参数)。以下为例:

# concatenate.py
def concatenate(**kwargs):
    result = ""
    # Iterating over the Python kwargs dictionary
    for arg in kwargs.values():
        result += arg
    return result

print(concatenate(a="Real", b="Python", c="Is", d="Great", e="!"))

执行上面的脚本,concatenate()会通过python的kwargs字典进行迭代并将找到的所有值连接起来:

$ python concatenate.py
RealPythonIsGreat!

和args类似,kwargs只是一个名字,可以修改成任何你想要的名字。最重要的是解包(unpacking operator)操作符(**)的用途。

因此,上面的例子可以写成这样:

# concatenate_2.py
def concatenate(**words):
    result = ""
    for arg in words.values():
        result += arg
    return result

print(concatenate(a="Real", b="Python", c="Is", d="Great", e="!"))

在上面例子中,可迭代对象是标准的字典(dict)。如果你迭代字典并想返回值,你就必须使用.values(),就像例子中那样所示。

事实上,如果你忘记了这个方法,你会发现你的迭代是通过你的python的kwargs字典的键实现的,就下下面的例子所示:

# concatenate_keys.py
def concatenate(**kwargs):
    result = ""
    # Iterating over the keys of the Python kwargs dictionary
    for arg in kwargs:
        result += arg
    return result

print(concatenate(a="Real", b="Python", c="Is", d="Great", e="!"))

现在,你再执行示例,你会发现以下结果输出:

$ python concatenate_keys.py
abcde

可以看到,如果你不指定.values(),你的函数会通过键进行迭代你的python的kwargs字典,返回错误的结果。

 

4.函数中参数的顺序

既然你已经学习了*args和**kwargs是干什么的,你可以开始编写获取不同数量的参数的函数了。但是,如果你想创建一个函数,该函数接受可变数量的位置参数和命名参数,该怎么办?
这时,你就需要记住顺序很重要。非默认参数必须在默认参数之前处理,因此*args在**kwargs的前面。

总结一下,参数的正确顺序是:
(1)位置参数
(2)*args参数
(3)**kwargs参数

例如,以下函数的定义是正确的:

# correct_function_definition.py
def my_function(a, b, *args, **kwargs):
    pass

*args变量在**kwargs的前面。但是,如果你想修改参数的顺序呢?例如,考虑下面的函数:

现在,函数定义中**kwargs在*args的前面。如果你想运行这个例子,你会接收到来自解释器一个错误:

$ python wrong_function_definition.py
  File "wrong_function_definition.py", line 2
    def my_function(a, b, **kwargs, *args):
                                    ^
SyntaxError: invalid syntax

这种情况下,因为*args在**kwargs的后面,python解释器抛出SyntaxError。

 

这里还可以分场景继续细化出其它场景:

(1)如果只有位置参数、默认参数、*args。顺序是:(位置参数,默认参数,*args)或者(位置参数,*args,默认参数)

(位置参数,默认参数,*args)
def foo(x,y=1,*args):
    pass
foo (1,2,3,4,5) // 其中的x为1,y=1的值被2替换,3,4,5都给args,即args=(3,4,5)

(位置参数,*args,默认参数)
def foo(x,*args,y=1):
     pass
foo (1,2,3,4,5) // 其中的x为1,2,3,4,5都给args,即args=(2,3,4,5),y始终为1

(2)位置参数、默认参数、*args*和*kwargs同时出现。顺序是:(位置参数,*args*,默认参数,*kwargs)

def foo1(x, y, *args, a=8, b=9, **kwargs):
	pass
foo1(1,2,3,4,a=5,b=6,y=7) 
#其中的x为1,y为2 
#3,4都给args,即args=(3,4) 
#a,b分别被替换成5,6 
#y=7以字典形式传给kwargs

 

如果不带默认参数:

def foo2(x, y, *args,**kwargs):
	pass
foo2(1,2,3,4,a=5,b=6,y=7) 
#其中的x为1,y为2 
#3,4都给args,即args=(3,4) 
#a=5,b=6,y=7以字典形式传给kwargs

  

5.解包(unpacking)星号操作符:*和**

现在你可以使用*args和**kwargs来定义获取变化的输入参数的python函数了。让我们再深入地理解解包(unpacking)操作符。

单个星号(*)和两个星号(**)解包操作符是在Python2中引入的。在3.5版本中,它们变得更强大。简而言之,解包(unpacking)操作符是将python中可迭代对象的值解包的操作符。单个星号操作符可以用在任意python提供的可迭代对象上,两个星号操作符只能用于字典。

我们从下面这个例子开始:

# print_list.py
my_list = [1, 2, 3]
print(my_list)

代码定义了一个list,然后将其打印输出到标准输出:

$ python print_list.py
[1, 2, 3]

注意列表是如何打印的,以及相应的括号和逗号。

现在,试着把解包操作符*添加到列表中:

# print_unpacked_list.py
my_list = [1, 2, 3]
print(*my_list)

这里,*操作符告诉print()首先将list解包。

在这个例子中,输出不再是list本身,而是list的内容:

$ python print_unpacked_list.py
1 2 3

你能看出这个例子执行结果和print_list.py有什么不同么?print()已经将三个不同的参数作为输入,而不是以一个list作为输入。

另外你可能看到,在print_unpacked_list.py中,你使用了解包操作符(*)来调用函数,而不是用在函数定义中。在这里,print()将list中的单个item作为一个个参数。

你也可以使用这个方法调用自己的函数,但是如果你的函数需要特定数量的参数,那么你解包的iterable必须具有相同数量的参数。

为了测试这个行为,考虑以下的脚本:

# unpacking_call.py
def my_sum(a, b, c):
    print(a + b + c)

my_list = [1, 2, 3]
my_sum(*my_list)

这里,my_sum()显式声明a,b,c是需要的参数。

如果你运行这个脚本,你会获得my_list中三个数的和:

$ python unpacking_call.py
6

my_list中的三个元素完美地匹配了my_sum()需要的参数。

现在,看一下下面的脚本,my_list有四个参数而不是三个:

# wrong_unpacking_call.py
def my_sum(a, b, c):
    print(a + b + c)

my_list = [1, 2, 3, 4]
my_sum(*my_list)

在这个例子中,my_sum()仍然期待三个参数,但是*操作符从list中获得了四个。如果你尝试执行这个脚本,你会发现python解释器仍然可以运行它:

$ python wrong_unpacking_call.py
Traceback (most recent call last):
  File "wrong_unpacking_call.py", line 6, in <module>
    my_sum(*my_list)
TypeError: my_sum() takes 3 positional arguments but 4 were given

当你用*操作符去解包一个list并传递给函数作为参数,就好像你在传递每一个单独的参数。
这表示你可以使用多个解包(unpacking)操作符,从多个lists中获取值并作为参数传递个一个函数。

可以用以下的示例来测试:

# sum_integers_args_3.py
def my_sum(*args):
    result = 0
    for x in args:
        result += x
    return result

list1 = [1, 2, 3]
list2 = [4, 5]
list3 = [6, 7, 8, 9]

print(my_sum(*list1, *list2, *list3))

如果你运行这个例子,所有的lists都被解包。每个单独的项被传递给my_sum(),结果如下:

$ python sum_integers_args_3.py
45

解包操作符还有其他方便的用途。例如,假设你需要将列表分成三个不同的部分。输出应该显示第一个值、最后一个值和中间的所有值。使用解包操作符,你可以用一行代码完成:

# extract_list_body.py
my_list = [1, 2, 3, 4, 5, 6]

a, *b, c = my_list

print(a)
print(b)
print(c)

在这个例子中,my_list包含6个项。第一个变量被分配给a,最后一个被分配给c,其它的值都被打包成一个list b。如果你运行一下,print()会显示三个变量的值:

$ python extract_list_body.py
1
[2, 3, 4, 5]
6

另一个有趣的事是,你可以使用解包操作符(*)来对任何可迭代对象进行分片。如果你需要将两个list进行合并,就会非常有用:

# merging_lists.py
my_first_list = [1, 2, 3]
my_second_list = [4, 5, 6]
my_merged_list = [*my_first_list, *my_second_list]

print(my_merged_list)

解包操作符(*)作为my_first和my_second的前缀。

如果你运行脚本,你会看到一个合并的list:

$ python merging_lists.py
[1, 2, 3, 4, 5, 6]

你可以合并两个不同的字典,通过解包操作符(**):

# merging_dicts.py
my_first_dict = {"A": 1, "B": 2}
my_second_dict = {"C": 3, "D": 4}
my_merged_dict = {**my_first_dict, **my_second_dict}

print(my_merged_dict)

这里,迭代合并了my_first_dict和my_second_dict。

执行这个代码,输出一个合并后的字典:

$ python merging_dicts.py
{'A': 1, 'B': 2, 'C': 3, 'D': 4}

请牢记,*操作可以对任意可迭代对象起作用。可以对一个字符串进行解包操作:

# string_to_list.py
a = [*"RealPython"]
print(a)

在python中,字符串是可迭代对象,因此*会解包字符串并将单个值放入list a中:

$ python string_to_list.py
['R', 'e', 'a', 'l', 'P', 'y', 't', 'h', 'o', 'n']

在使用这些操作符的时候,要记住代码的可读性很重要。

考虑以下的代码:

# mysterious_statement.py
*a, = "RealPython"
print(a)

这里的解包操作符*,后面跟了一个变量,一个逗号和一个赋值。一行中打包了很多东西,这个代码和上面的代码没有什么区别。只是将字符串RealPyhton中所有的项指定到一个新的list a。

a后面的逗号就可以了。当使用带有变量赋值的解包操作符时,Python要求得到的变量要么是列表,要么是元组。使用后面的逗号,实际上已经定义了一个只有一个命名变量a的元组。
虽然这是一个巧妙的技巧,但许多Pythonistas并不认为这段代码可读性很强。因此,最好少用这类结构。

 

6.结论
现在,在你的python函数中,可以使用*args和**kwargs来接收可变数量的参数了。你也了解了解包操作符。

你已经学会:
(1)*args和**kwargs的含义。*args:非关键字参数、**kwargs:关键字参数
(2)如何使用*args和**kwargs来定义函数
(3)如何使用单个星号(*)来解包可迭代对象
(4)如何使用两个星号(**)来解包字典对象

 

7.python小技巧

# How to merge two dicts
# in Python 3.5+
>>> x = {'a':1,'b':2}
>>> y = {'b':3,'c':4}
>>> z = {**x,**y}
>>> z
{'c':4,'a':1,'b':3}