Python集合详解
集合介绍:
集合(set)是一个无序的不重复元素序列。
可以使用大括号 { } 或者 set() 函数创建集合,注意:创建一个空集合必须用 set() 而不是 { },因为 { } 是用来创建一个空字典。
创建格式:
parame = {value01,value02,...}
或者
set(value)
在{}内用逗号分隔开多个元素,多个元素满足以下三个条件 # 1. 集合内元素必须为不可变类型 # 2. 集合内元素无序 # 3. 集合内元素没有重复
//集合的用途:
去重和关系运算
关系运算
实例(Python 3.0+) >>>basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'} >>> print(basket) # 这里演示的是去重功能 {'orange', 'banana', 'pear', 'apple'} >>> 'orange' in basket # 快速判断元素是否在集合内 True >>> 'crabgrass' in basket False >>> # 下面展示两个集合间的运算. ... >>> a = set('abracadabra') >>> b = set('alacazam') >>> a {'a', 'r', 'b', 'c', 'd'} >>> a - b # 求差集(只有a中拥有的而b集合没有的元素) {'r', 'd', 'b'} >>> a | b # 并集(集合a或b中包含的所有元素) {'a', 'c', 'r', 'd', 'b', 'm', 'z', 'l'} >>> a & b # a和b的交集(集合a和b中都包含了的元素) {'a', 'c'} >>> a ^ b # 元素在a或b中,但不会同时出现在a和b的集合之中(对称差集) {'r', 'd', 'b', 'm', 'z', 'l'}
去重:
示例如下 >>> l=['a','b',1,'a','a'] >>> s=set(l) >>> s # 将列表转成了集合 {'b', 'a', 1} >>> l_new=list(s) # 再将集合转回列表 >>> l_new ['b', 'a', 1] # 去除了重复,但是打乱了顺序 # 针对不可变类型,并且保证顺序则需要我们自己写代码实现,例如 l=[ {'name':'lili','age':18,'sex':'male'}, {'name':'jack','age':73,'sex':'male'}, {'name':'tom','age':20,'sex':'female'}, {'name':'lili','age':18,'sex':'male'}, {'name':'lili','age':18,'sex':'male'}, ] new_l=[] for dic in l: if dic not in new_l: new_l.append(dic) print(new_l) # 结果:既去除了重复,又保证了顺序,而且是针对不可变类型的去重 [ {'age': 18, 'sex': 'male', 'name': 'lili'}, {'age': 73, 'sex': 'male', 'name': 'jack'}, {'age': 20, 'sex': 'female', 'name': 'tom'} ]
类似列表推导式,同样集合支持集合推导式(Set comprehension):
实例(Python 3.0+) //代码 a = {x for x in 'abracadabra' if x not in 'abc'} print(a) //执行结果 {'r', 'd'} //解释 a = {x for x in 'abracadabra' if x not in 'abc'} 从'abracadabra'中用for循环,取出,如果x不在其中则x存到a集合中
将列表转换为集合(但凡能被for循环的遍历的数据类型(强调:遍历出的每一个值都必须为不可变类型)都可以传给set()转换成集合类型)
list1=['1','2','3','3'] b=set(list1) print(b,type(b)) //执行结果 {'2', '3', '1'} <class 'set'>
集合的基本操作
1:添加元素
语法格式如下:
s.add( x ) #添加一项
将元素 x 添加到集合 s 中,如果元素已存在,则不进行任何操作。
实例(Python 3.0+) >>>thisset = set(("Google", "Runoob", "Taobao")) >>> thisset.add("Facebook") >>> print(thisset) {'Taobao', 'Facebook', 'Google', 'Runoob'}
还有一个方法,也可以添加元素,且参数可以是列表,元组,字典等,语法格式如下:
s.update( x ) #添加多项
x 可以有多个,用逗号分开。
实例(Python 3.0+) >>>thisset = set(("Google", "Runoob", "Taobao")) >>> thisset.update({1,3}) >>> print(thisset) {1, 3, 'Google', 'Taobao', 'Runoob'} >>> thisset.update([1,4],[5,6]) >>> print(thisset) {1, 3, 4, 5, 6, 'Google', 'Taobao', 'Runoob'} >>>
2:移除元素
//语法格式如下:
s.remove( x )
将元素 x 从集合 s 中移除,如果元素不存在,则会发生错误。
//实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.remove("Taobao")
>>> print(thisset)
{'Google', 'Runoob'}
>>> thisset.remove("Facebook") # 不存在会发生错误
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'Facebook'
>>>
此外还有一个方法也是移除集合中的元素,且如果元素不存在,不会发生错误。格式如下所示:
s.discard( x )
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.discard("Facebook") # 不存在不会发生错误
>>> print(thisset)
{'Taobao', 'Google', 'Runoob'}
我们也可以设置随机删除集合中的一个元素,语法格式如下:
s.pop()
脚本模式实例(Python 3.0+)
thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
x = thisset.pop()
print(x)
输出结果:
Runoob
多次执行测试结果都不一样。
然而在交互模式,pop 是删除集合的第一个元素(排序后的集合的第一个元素)。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao", "Facebook"))
>>> thisset.pop()
'Facebook'
>>> print(thisset)
{'Google', 'Taobao', 'Runoob'}
>>>
3:计算集合元素个数
语法格式如下:
len(s)
计算集合 s 元素个数。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> len(thisset)
3
4:清空集合
语法格式如下:
s.clear()
清空集合 s。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> thisset.clear()
>>> print(thisset)
set()
5:判断元素是否在集合中存在
语法格式如下:
x in s
判断元素 x 是否在集合 s 中,存在返回 True,不存在返回 False。
实例(Python 3.0+)
>>>thisset = set(("Google", "Runoob", "Taobao"))
>>> "Runoob" in thisset
True
>>> "Facebook" in thisset
False
>>>
集合内置方法完整列表
add() 为集合添加元素
//描述
add() 方法用于给集合添加元素,如果添加的元素在集合中已存在,则不执行任何操作。
//语法
add()方法语法:
set.add(elmnt)
//参数
elmnt -- 必需,要添加的元素。
//返回值
无。
//实例
以下实例展示了 add() 方法的使用:
//实例 1 fruits = {"apple", "banana", "cherry"} fruits.add("orange") print(fruits) 输出结果为: {'apple', 'banana', 'orange', 'cherry'} 已存在的元素,则不执行添加操作: //实例 2 fruits = {"apple", "banana", "cherry"} fruits.add("apple") print(fruits) 输出结果为: {'apple', 'banana', 'cherry'}
clear() 移除集合中的所有元素
//描述
clear() 方法用于移除集合中的所有元素。
//语法
clear()方法语法:
set.clear()
//参数
无。
//返回值
无。
//实例
移除 fruits 集合中的所有元素:
//实例 1 fruits = {"apple", "banana", "cherry"} fruits.clear() print(fruits) 输出结果为: set()
copy() 拷贝一个集合
//描述
copy() 方法用于拷贝一个集合。
//语法
copy() 方法语法:
set.copy()
//参数
无。
//返回值
无。
//实例
拷贝 fruits 集合:
//实例 1 fruits = {"apple", "banana", "cherry"} x = fruits.copy() print(x) 输出结果为: {'cherry', 'banana', 'apple'}
difference() 返回集合间的差集
//描述
difference() 方法用于返回集合的差集,即返回的集合元素包含在第一个集合中,但不包含在第二个集合(方法的参数)中。
//语法
difference() 方法语法:
set.difference(set)
//参数
set -- 必需,用于计算差集的集合
//返回值
返回一个新的集合。
//实例
返回一个集合,元素包含在集合 x ,但不在集合 y :
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "microsoft", "apple"} z = x.difference(y) print(z) 输出结果为: {'cherry', 'banana'}
difference_update() 移除集合中的元素,该元素在指定的集合也存在。
//描述
difference_update() 方法用于移除两个集合中都存在的元素。
difference_update() 方法与 difference() 方法的区别在于 difference() 方法返回一个移除相同元素的新集合,而 difference_update() 方法是直接在原来的集合中移除元素,没有返回值。
//语法
difference_update() 方法语法:
set.difference_update(set)
//参数
set -- 必需,用于计算差集的集合
//返回值
无。
//实例
移除两个集合都包含的元素:
实例 1 x = {"apple", "banana", "cherry"} y = {"google", "microsoft", "apple"} x.difference_update(y) print(x) 输出结果为: {'cherry', 'banana'}
discard() 删除集合中指定的元素
//描述
discard() 方法用于移除指定的集合元素。
该方法不同于 remove() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
//语法
discard() 方法语法:
set.discard(value)
//参数
value -- 必需,要移除的元素
//返回值(如果要移除的元素不存在,则返回None)
None。
//实例
移除集合中的元素 banana:
实例 1 fruits = {"apple", "banana", "cherry"} print(fruits.discard("name")) 输出结果为: None
intersection() 返回集合的交集
//描述
intersection() 方法用于返回两个或更多集合中都包含的元素,即交集。
//语法
intersection() 方法语法:
set.intersection(set1, set2 ... etc)
//参数
set1 -- 必需,要查找相同元素的集合
set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
//返回值
返回一个新的集合。
//实例
返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:
实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} z = x.intersection(y) print(z) 输出结果为: {'apple'}
计算多个集合:
//实例 2 x = {"a", "b", "c"} y = {"c", "d", "e"} z = {"f", "g", "c"} result = x.intersection(y, z) print(result) 输出结果为: {'c'}
intersection_update() 删除集合中的元素,该元素在指定的集合中不存在。
//描述
intersection_update() 方法用于移除两个或更多集合中都不重叠的元素,即计算交集。
intersection_update() 方法不用于 intersection() 方法,因为 intersection() 方法是返回一个新的集合,而 intersection_update() 方法是在原始的集合上移除不重叠的元素(两个集合间除去不是交集的部分,也就是只留下交集的元素)。
//语法
intersection_update() 方法语法:
set.intersection_update(set1, set2 ... etc)
//参数
set1 -- 必需,要查找相同元素的集合
set2 -- 可选,其他要查找相同元素的集合,可以多个,多个使用逗号 , 隔开
//返回值
无。
//实例
返回一个新集合,该集合的元素既包含在集合 x 又包含在集合 y 中:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} x.intersection_update(y) print(x) 输出结果为: {'apple'}
计算多个集合的交集:
//实例 2 x = {"a", "b", "c"} y = {"c", "d", "e"} z = {"f", "g", "c"} x.intersection_update(y, z) print(x) 输出结果为: {'c'}
isdisjoint() 判断两个集合是否包含相同的元素(是否有交集),如果没有返回 True,否则返回 False。
//描述
isdisjoint() 方法用于判断两个集合是否包含相同的元素,如果没有返回 True,否则返回 False。。
//语法
isdisjoint() 方法语法:
set.isdisjoint(set)
//参数
set -- 必需,要比较的集合
//返回值
返回布尔值,如果不包含返回 True,否则返回 False。
//实例
判断集合 y 中是否有包含 集合 x 的元素:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "facebook"} z = x.isdisjoint(y) print(z) 输出结果为: True
如果包含返回 False:
//实例 2 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} z = x.isdisjoint(y) print(z) 输出结果为: False
issubset() 判断指定集合是否为该方法参数集合的子集。
//描述
issubset() 方法用于判断集合的所有元素是否都包含在指定集合中,如果是则返回 True,否则返回 False。
//语法
issubset() 方法语法:
set.issubset(set)
//参数
set -- 必需,要比查找的集合
//返回值
返回布尔值,如果都包含返回 True,否则返回 False。
//实例
判断集合 x 的所有元素是否都包含在集合 y 中:
//实例 1 x = {"a", "b", "c"} y = {"f", "e", "d", "c", "b", "a"} z = x.issubset(y) print(z) 输出结果为: True
如果没有全部包含返回 False:
//实例 2 x = {"a", "b", "c"} y = {"f", "e", "d", "c", "b"} z = x.issubset(y) print(z) 输出结果为: False
issuperset() 判断该方法的参数集合是否为指定集合的子集(也就是指定集合是否是方法参数集合的父集)
//描述
issuperset() 方法用于判断指定集合的所有元素是否都包含在原始的集合中,如果是则返回 True,否则返回 False。
//语法
issuperset() 方法语法:
set.issuperset(set)
//参数
set -- 必需,要比查找的集合
//返回值
返回布尔值,如果都包含返回 True,否则返回 False。
//实例
判断集合 y 的所有元素是否都包含在集合 x 中(x是否是y的父集)
//实例 1 x = {"f", "e", "d", "c", "b", "a"} y = {"a", "b", "c"} z = x.issuperset(y) print(z) 输出结果为: True
如果没有全部包含返回 False:
//实例 2 x = {"f", "e", "d", "c", "b"} y = {"a", "b", "c"} z = x.issuperset(y) print(z) 输出结果为: False
pop() 随机移除元素
//描述
pop() 方法用于随机移除一个元素。
//语法
pop() 方法语法:
set.pop()
//参数
无
//返回值
返回移除的元素。
//实例
随机移除一个元素:
//实例 1 fruits = {"apple", "banana", "cherry"} fruits.pop() print(fruits) 输出结果为: {'apple', 'banana'}
输出返回值:
//实例 2 fruits = {"apple", "banana", "cherry"} x = fruits.pop() print(x) 输出结果为: banana
remove() 移除指定元素
//描述
remove() 方法用于移除集合中的指定元素。
该方法不同于 discard() 方法,因为 remove() 方法在移除一个不存在的元素时会发生错误,而 discard() 方法不会。
//语法
remove() 方法语法:
set.remove(item)
//参数
item -- 要移除的元素
//返回值
返回移除的元素。
//实例
移除元素 banana:
//实例 1 fruits = {"apple", "banana", "cherry"} fruits.remove("banana") print(fruits) 输出结果为: {'cherry', 'apple'}
symmetric_difference() 返回两个集合中不重复的元素集合。(对称差集)
//描述
symmetric_difference() 方法返回两个集合中不重复的元素集合,即会移除两个集合中都存在的元素。(除去交集的部分)
//语法
symmetric_difference() 方法语法:
set.symmetric_difference(set)
//参数
set -- 集合
//返回值
返回一个新的集合。
//实例
返回两个集合组成的新集合,但会移除两个集合的重复元素:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} z = x.symmetric_difference(y) print(z) 输出结果为: {'google', 'cherry', 'banana', 'runoob'}
symmetric_difference_update()移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
//描述
symmetric_difference_update() 方法移除当前集合中在另外一个指定集合相同的元素,并将另外一个指定集合中不同的元素插入到当前集合中。
//语法
symmetric_difference_update() 方法语法:
set.symmetric_difference_update(set)
//参数
set -- 要检测的集合
//返回值
无。
//实例
在原始集合 x 中移除与 y 集合中的重复元素,并将不重复的元素插入到集合 x 中:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} x.symmetric_difference_update(y) print(x) 输出结果为: {'google', 'cherry', 'banana', 'runoob'}
union()返回两个集合的并集
//描述
union() 方法返回两个集合的并集,即包含了所有集合的元素,重复的元素只会出现一次。
//语法
union() 方法语法:
set.union(set1, set2...)
//参数
set1 -- 必需,合并的目标集合
set2 -- 可选,其他要合并的集合,可以多个,多个使用逗号 , 隔开。
//返回值
返回一个新集合。
//实例
合并两个集合,重复元素只会出现一次:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} z = x.union(y) print(z) 输出结果为: {'cherry', 'runoob', 'google', 'banana', 'apple'}
合并多个集合:
//实例 2 x = {"a", "b", "c"} y = {"f", "d", "a"} z = {"c", "d", "e"} result = x.union(y, z) print(result) 输出结果为: {'c', 'd', 'f', 'e', 'b', 'a'}
update()给集合添加元素
//描述
update() 方法用于修改当前集合,可以添加新的集合到当前集合中(括号中是集合)
//语法
update() 方法语法:
set.update(set)
//参数
set -- 必需,可以是元素或集合
//返回值
无。
//实例
合并两个集合,重复元素只会出现一次:
//实例 1 x = {"apple", "banana", "cherry"} y = {"google", "runoob", "apple"} x.update(y) print(x) 输出结果为: {'banana', 'apple', 'google', 'runoob', 'cherry'}