python-集合(set)
集合
集合是无序的,不重复的数据集合,它里面的元素是可哈希的(不可变类型),但是集合本身是不可哈希(所以集合做不了字典的键)的。以下是集合最重要的两点:
去重,把一个列表变成集合,就自动去重了。
关系测试,测试两组数据之前的交集、差集、并集等关系。
# 集合里面的元素是可哈希的
# set1 = {'1','alex',2,True,[1,2,3]} #报错 # set2 = {'1','alex',2,True,{1:2}} #报错 # set3 = {'1','alex',2,True,(1,2,[2,3,4])} #报错
去重
# l= [1,1,2,2,3,4,5,5] # set1 = set(l) # print(set1,type(set1)) # l = list(set1) # print(l,type(l))
集合的创建
# set1 = set({1,2,3,'barry'}) # set2 = {1,2,'barry'} # print(set1,type(set1)) # print(set2,type(set2))
增
# set1 = {'alex','wusir','ritian','egon','barry'} # set1.add('文文') # print(set1) # update:迭代着增加 # set1.update('A') # print(set1) # set1.update('老师') # print(set1) # set1.update([1,2,3]) # print(set1)
删
# set = {'alex','wusir','ritian','egon','barry'} # set.remove('alex') #删除一个元素 # print(set) # pop随机的删除 # set.pop() #随机删除一个元素 # print(set) # clear清空 # set.clear() #清空集合 # print(set) # del # del set #删除集合 # print(set)
集合的其他操作
# 1.交集(& 或者 intersection) # set1 = {1,2,3,4,5} # set2 = {4,5,6,7,8} # print(set1&set2) #-->{4, 5} # print(set1.intersection(set2)) # 2.并集(| 或者 union) # set1 = {1,2,3,4,5} # set2 = {4,5,6,7,8} # print(set1 | set2) #-->{1, 2, 3, 4, 5, 6, 7, 8} # print(set1.union(set2))#-->{1, 2, 3, 4, 5, 6, 7, 8} # 3.差集(- 或者 difference) # set1 = {1,2,3,4,5} # set2 = {4,5,6,7,8} # print(set1 - set2) # print(set1.difference(set2)) #-->{1, 2, 3} # 4.反交集(^ 或者 symmetric_difference) # set1 = {1,2,3,4,5} # set2 = {4,5,6,7,8} # print(set1 ^ set2) #-->{1, 2, 3, 6, 7, 8} # print(set1.symmetric_difference(set2)) # 5子集与超集 # set1 = {1,2,3} # set2 = {1,2,3,4,5,6} # print(set1 < set2) # print(set1.issubset(set2)) # 这两个相同,都是说明set1是set2子集 # print(set2 > set1) # print(set2.issuperset(set1)) # 这两个相同,都是说明set2是set1超集。
frozenset不可变集合,让集合变成不可变类型。
# s = frozenset('barry') # print(s,type(s)) # frozenset({'a', 'y', 'b', 'r'}) <class 'frozenset'>
浅copy
# l1 = [1,2,3,['barry','alex']] # l2 = l1 # # l1[0] = 111 # print(l1) # [111, 2, 3, ['barry', 'alex']] # print(l2) # [111, 2, 3, ['barry', 'alex']] # l1[3][0] = 'wusir' # print(l1) # [111, 2, 3, ['wusir', 'alex']] # print(l2) # [111, 2, 3, ['wusir', 'alex']] # print(id(l1),id(l2)) #--->对于赋值运算来说,l1与l2指向的是同一个内存地址,所以他们是完全一样的。
# 对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,
# 所以,对于第二层以及更深的层数来说,保持一致性
l = [1,2,3,4,['a','b']] # 赋值操作两个列表是完全一样的,他们指向的是同一个内存空间 l2 = l print(id(l2)) # 2513341654728 print(id(l)) # 2513341654728 # 对于浅copy来说,第一层创建的是新的内存地址,而从第二层开始,指向的都是同一个内存地址,所以,对于第二层以及更深的层数来说,保持一致性 # list函数转换的也是浅copy l1=list(l) l[4][0] = 'wenwen' #在这里将l中的二级列表中的元素重新赋值了 print(l,id(l)) # [1, 2, 3, 4, ['wenwen', 'b']] 2513341654728 print(l1,id(l1)) # [1, 2, 3, 4, ['wenwen', 'b']] 2513340188104 # 切片也是浅copy print(l,id(l)) #[1, 2, 3, 4, ['wenwen', 'b']] 2513341654728 print(l[:],id(l[:])) #[1, 2, 3, 4, ['wenwen', 'b']] 2513341654664
# 深拷贝deepcopy
# import copy # li = [1,2,3,['barry','alex']] # l2 = copy.deepcopy(li) # print(li,id(li)) # print(l2,id(l2)) # # li[1] = 222 # print(li,id(li)) # print(l2,id(l2)) # # li[3][0] = 'wusir' # print(li,id(li[3])) # print(l2,id(l2[3])) # 对于深copy来说,两个是完全对立的,改变 任意一个的任何元素(无论多少层),另一个绝对不改变