复合数据类型,英文词频统计
一:
排序:
cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.sort()
print(cm)
插入:
cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.insert(2,'zhanghuanm')
print(cm)
统计数量:
cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.count('tom'),cm.index('tom')
print(cm.count('tom'))
末端+1:
末端—1:
删除指定序号:
cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.pop(1)
print(cm)
二.
总结列表:
list1 = list((1, 2))
list2 = [1, 3, 'lijijaije', 3.5]
print(list1[1])
print(list2[1:3])
1.可以用list()函数或者方括号[]创建,元素之间用逗号’,‘’分隔。
2.列表的元素不需要具有相同的类型
3.使用索引来访问元素
4.可切片
元组:
tuple1 = tuple([1, 2])
tuple2 = (1, 3, 'lijijaie', 3.5)
print(tuple1[1])
print(tuple2[1:3])
tuple1[1] = 10
1.可以用tuple()函数或者方括号()创建,元素之间用逗号’,‘’分隔。
2.元组的元素不需要具有相同的类型
3.使用索引来访问元素
4.可切片
5.元素的值一旦创建就不可修改!!!!!(这是区别与列表的一个特征)
字典:
dict1 = dict([('name', 'kyda'), ('e', 10)])
dict2 = {'name': 'lin', 'age': 21}
print(dict1)
print(dict2['name'])
dict2['age'] = 23
print(dict2)
1.元素由键(key)和值(value)组成
2.可以用dict()函数或者方括号()创建,元素之间用逗号’,‘’分隔,键与值之间用冒号”:”隔开
3.键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组
4.使用键(key)来访问元素
集合:
set1 = set('bbbbaa')
set2 = {'abc', 'jaja', 'abc', 'kyda'}
print(set1)
print(set2)
1.可以用set()函数或者方括号{}创建,元素之间用逗号”,”分隔。
2.与字典相比少了键
3.不可索引,不可切片
4.不可以有重复元素
三.词频统计
代码:
exclude={'a','the','and','i','you','in'}
def gettxt():
txt=open("big.txt","r").read()
txt=txt.lower()
for ch in "~!@#$%^&*()_+'{}[]|?.:;,":
txt=txt.replace(ch,"")
return txt
bigList=gettxt().split()
print(bigList)
print('big;',bigList.count('big'))
bigSet=set(bigList)
print(bigSet)
bigDict={}
for word in bigSet:
bigDict[word]=bigList.count(word)
print(bigDict)
print(bigDict.items())
word=list(bigDict.items())
word.sort()
print(word)