集合类型
python中集合(set)类型与数学中的集合类型概念类似,用来表示无序不重复元素的集合。
集合的定义
集合使用一对大括号{}
进行定义,元素之间使用逗号隔开。
注意:集合中的元素必须是不可变数据类型。
>>> a = {1, 2, 3, 4, 5, 6}
>>> print(type(a))
< class 'set'>
>>> b = {1, 2, 'a', ('a'), 1.5}
>>> print(type(b))
< class 'set'>
>>> {[1,2],2}
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
TypeError: unhashable type: 'list'
空集合的定义
>>> a = set()
>>> print(type(a))
< class 'set' >
# a = {} 是空字典的定义
集合的常用操作
因为集合是无序的,所以没有索引的操作。
添加元素
和列表一样,添加元素也是通过方法。
.add(el)
向集合中添加元素,如果集合中不存在则添加。
>>> s = {1,2}
>>> s.add(1) # 因为已经有元素1所以不会添加
>>> print(s)
{1, 2}
>>> s.add(3)
>>> print(s)
{1,2,3}
.update(iterable)
向集合中添加多个元素,如果集合中不存在则添加
>>> s = {1,2}
>>> s.update({2,3,4})
>>> print(s)
{1,2,3,4}
删除元素
.pop()
随机删除并返回集合中的一个元素,如果集合中元素为空,则抛出异常
>>> s = {'a', 'b', 'c'}
>>> s.pop()
'a'
>>> print(s)
{'b', 'c'}
.remove(el)
从集合中删除元素el
,如果不存在则抛出异常
>>> s = {'a', 'b', 'c'}
>>> s.remove('b')
>>> print(s)
{'a','c'}
>>> s.remove('d')
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
KeyError: 'd'
.discard(el)
从集合中删除元素ele
,如果不存在不做任何操作
>>> s = {'a', 'b', 'c'}
>>> s.discard('b')
>>> print(s)
{'a','c'}
>>> s.discard('d')
.clear()
清空集合
>>> s = {1,2,3}
>>> s.clear()
>>> print(s)
set()
集合运算
集合的运算与数学集合的运算规则基本一致。
交集
取既属于A又属于B的项组成的集合叫做AB的交集
>>> s1 = {1,2,3}
>>> s2 = {2,3,4}
>>> s = s1 & s2 # 交集的运算符为 $
>>> print(s)
{2, 3}
并集
集合A和集合B的所有元素组成的集合称为集合A与集合B的并集
>>> s1 = {1,2,3}
>>> s2 = {2,3,4}
>>> s = s1 | s2 # 并集的运算符为 |
>>> print(s)
{1, 2, 3, 4}
补集
取集合A中不在集合B中的项组成的集合称为A相对B的补集
>>> s1 = {1,2,3}
>>> s2 = {2,3,4}
>>> s = s1-s2 # 补集的运算符为 -
>>> print(s)
{1}
对称差集
取不在集合AB交集里的元素组成的集合称为对称差集,也叫反交集
>>> s1 = {1,2,3}
>>> s2 = {2,3,4}
>>> s = s1^s2 # 对称差集的运算符为 ^
>>> print(s)
{1, 4}
集合去重
集合具有天生去重的性质,因此可以利用它来去除序列中的重复元素
>>> ls = [1,1,2,3,4,4,3,2,5]
>>> ls = set(ls) # 先用set(ls)转换为集合去重
>>> print(ls)
{1,2,3,4,5}
>>> ls = list(ls) # 再转换为列表
>>> print(ls)
[1,2,3,4,5]
>>> set('aabbcc')
{'a', 'b', 'c'}