Python 集合、字典、运算符

先区分一下序列类型和散列类型:

序列类型:list、string、tuple,他们中的元素是有序的。

散列类型:set、dict,他们中的元素无序的。(注意:python3.7.0开始字典变成"有序"了)

序列类型有序,可以用索引。而散列类型中的元素是无序的,所以不能索引。

 

一、集合

(一).集合的特性:无序、唯一、可变。集合中的元素需要可哈希的,元素不可以是可变对象。

定义一个集合:

(1).工厂方法:se = set()

注意不要写成 se = () 这样变成元组了。

(2).直接定义:se = {1,2,3} 用大括号括起来。

大括号中要写入元素,不写元素就是一个空字典了。

(3).案例分析:

# 分析这两种定义,哪一个会报错?
s1 = {1, ['a', 'b', 'c']} 
s2 = {1, ('a', 'b', 'c')}

第一种会报错。TypeError: unhashable type: 'list'

因为集合中的元素要符合不可变这个规则, 列表可变,不符合规则,报错了。

第二种,元组不可变,符合规则,所以解释器不会跟你叫劲。

至于什么是可哈希?往下翻……

(二).集合的运算

(1).检查成员:in / not in

语法:item in set_object -> bool

例:

not in 就是取反

(2).交集:&

两个集合共同有的元素,取两个集合重复的元素。

例:

# 1.有两个列表 x = [1,2,3,'a','b','c']  y = ['a','b','c'] 找出x,y列表中,共有元素

x = [1, 2, 3, 'a', 'b', 'c']
y = ['a', 'b', 'c']

print(set(x) & set(y))
"""
列表没有交集"&"的功能,但是集合有。
那么先工厂一下,然后再交集。

运行结果:
{'c', 'b', 'a'}  # 集合无序,所以元素输出的顺序未必如自己预想的
"""
View Code

为什么运行结果的顺序是乱的?因为集合无序的!

(3).并集:|(shift+回车上面那个)

取出不重复的值。字面意思理解,并集,并在一起了(相当于变成一个集合了,集合的特性之一:元素唯一)。

例:

(4).差集:-

剪掉两个集合中的重复部分。

本人数学最烂,就这么死记硬背着,第二个集合后面的元素都会砍掉。

(5).与非集:^(脱字符:shift+6)

取两个集合各自独有的元素。

(6).小技巧:如何去重元素?

利用集合的特性之一:唯一性

a = [1, 2, 2, 3, "a", "b", "c", "a", "b", "a", 3]
# 工厂一下,set()
print(set(a)) # {1, 2, 3, 'c', 'b', 'a'}

(三).集合的常用方法

(1).set.add() 添加单个元素

(2).set.update(iterable) 批量更新,会去重。

 

二、字典

(一).字典的特性

1.key唯一

2.无序(散列类型,Python3.7.0之前)

3.可变

key是唯一的,需要的是不可变对象,且要符合变量命名规则。key重名的话,值会被后者所覆盖。

注意版本之间的区别,在Python3.7.0之前:字典是无序的(散列类型);从Python3.7.0开始:字典不再是散列类型了,是按照键的插入顺序进行排列!

4.可以嵌套到任意深度(仅受可用内存约束)

(二).定义一个字典

(1).直接大括号:di = {} 是一个空字典

type(di)之后:<class 'dict'>

注意要与集合的定义区别开来!定义空集合是:s1 = set()

一般是直接把值写进去,语法:di = {key1:value,key2:value,...} 键值对是冒号的形式

例:

(2).工厂方式:di = dict(key1=value,key2=value,...) 键值对用等号"="等起来,工厂方式的key不要加引号

例:

(3).案例分析:

# 分析这两种定义,哪一个会报错?
di1 = {'a': 'test', ('a', 'b'): 'test'}
di2 = {'a': 'test', {'a', 'b'}: 'test'}

di2会报错,TypeError: unhashable type: 'set'

key需要是不可变对象。第二种里有一个集合,集合的特性之一是可变,不符合key的规则,解释器跟你急了。

而第一种里是一个元组,元组不可变,没问题了。

另外,内建函数也可以作为字典的key:

d1 = {len: 1, str: "aaa"}

print(d1[len])  # 1
print(d1[str])  # 'aaa'
View Code

(三).往字典里插入值

di = {}

# 直接赋值一样
di["name"] = "quanquan616"

"""
get(key) 如果key不存在,不会报错。取到了会返回原有值。
get(key,value) 当key不存在的时候,会返回value的值,常用来提示。
"""
di.get("sex", "没有这个键")
"""
如果要插入值,可以这么做:
di["name"] = di.get("name","")+"zyb"
di["sex"] = di.get("sex","male")
di["age"] = di.get("age",0)+30
di -> {'name': 'zyb', 'sex': 'male', 'age': 30}
"""

"""
setdefault(key,value) 字面理解,设置默认。
key有的话会返回原有值,无此key才会设置。
如果此key已有,不会改变原有值,不会被更新
"""
di.setdefault("name", "zyb")

"""
update(dict_object) 参数需要是一个字典对象。
有就改变,没有就添加进去。
"""
di.update({"age": 35, "read": 15})

# fromkeys(iterable,value) 批量设置,所有的值都是一样的。不会改变原有字典
di.fromkeys("abc", 30)

print(di)
# {'name': 'quanquan616', 'age': 35, 'read': 15}
View Code

(四).对字典进行取值

# 直接用键进行取值,Dict[key]
print(di["name"])  # quanquan616

# get(key) 取到了就返回值,没有取到不会报错
print(di.get("name"))  # quanquan616

# get()的另一种用法
di = {}
di["name"] = di.get("name", "") + "zyb"
print(di)  # {'name': 'zyb'}

# setdefault(key) 有就返回这个键的值。如果没有这个键,会创建,不指定值的话,会是None。不会因为指定了值而改变原有数据。
print(di.setdefault("name"))  # quanquan616

# values() 取出所有的值,返回一个迭代器
print(di.values())  # dict_values(['quanquan616', 35, 15])
View Code

(五).changed in python3.7.0

官方文档对python3.7.0中字典的描述:

Dictionary order is guaranteed to be insertion order.Dictionaries preserve insertion order.

Note that updating a key does not affect the order.Keys added after deletion are inserted at the end.

大意:字典保留的顺序是键插入的顺序,更新值不会影响原有的顺序,但删除后添加的键将在末尾插入。

演示如下:

(六).字典小技巧(以下代码均在python3.7.0中运行)

(1).对字典中的元素进行排序

di = {"in": 123, "to": 511, "she": 255, "i": 111}

print(sorted(di.items(), key=lambda item: item[1], reverse=True))
# 运行结果:[('to', 511), ('she', 255), ('in', 123), ('i', 111)]

"""
di.items() 将字典转化为可迭代对象。Dict.items()将字典中的key-value元素,转化为了元组
# [('in', 123), ('to', 511), ('she', 255), ('i', 111)]

key=lambda item: item[1] 取元素中的第二个元素作为比较的参数
"""

key是用来指定做排序的每项元素的那个部分。匿名函数的item,就是指代每项元素,item[1]就是元素的第二项的意思。

注意此方法中,value的值只能是数值,如果出现字符串就会报错。(字符串和数值能直接做比较吗?)

(2).对列表中的多个字典排序

# 按age从大到小排序
alist = [{"name": "a", "age": 20}, {"name": "b", "age": 30}, {"name": "c", "age": 25}]
alist.sort(key=lambda item: -item.get("age"))
"""
key中的lambda表达,等价于下面这种方式。
获得字典中"age"的值,key的意思是以哪个函数为关键字。
"""

# def get_sort(li):
#     return li.get("age")
# alist.sort(key=get_sort, reverse=True)

print(alist)
# [{'name': 'b', 'age': 30}, {'name': 'c', 'age': 25}, {'name': 'a', 'age': 20}]
View Code

(3).合并字典(键相同则覆盖)

x = {"a": 1, "b": 2}
y = {"b": 3, "c": 3, "d": 4}

z = {**x, **y}
print(z)
# {'a': 1, 'b': 3, 'c': 3, 'd': 4}
View Code

(4).字典代替多个if...elif

如下这段if...elif...else语句:

def fun(x):
    if x == "a":
        return 1
    elif x == "b":
        return 2
    else:
        return None
View Code

可以写成更加简洁更加pythonic的代码:

def fun(x):
    return {"a": 1, "b": 2}.get(x)

dict.get() 如果get不到值会返回None

(5).dict.pop()方法从字典中删除条目。但是,传递给pop()中的参数,必须是字典中存在的键,而不是值。

 

三、运算符(部分简单的运算符之前已有摘录,不在这里重复了,遇到实际情况不会了直接google it)

(一).身份运算符:is / is not

两个对象,是否指向同一个id。(id和内存地址还是有区别的)

注意区分"=="和"is":

==用来判断两个值是否相等,is是判断两个对象的id是否相同。

(二).逻辑运算符 not > and > or

 

四、哈希

hash(object)生成一个唯一的哈希值。

小技巧:这个内置函数,可以来判断一个对象是否是可变的。能生成哈希值的就是不可变对象。

 

posted @ 2018-01-14 21:33  root01_barry  阅读(715)  评论(0编辑  收藏  举报