复合数据类型，英文词频统计

一：

排序：

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.sort()
print(cm)

插入：

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.insert(2,'zhanghuanm')
print(cm)

统计数量：

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.count('tom'),cm.index('tom')
print(cm.count('tom'))

末端+1：

末端—1：

删除指定序号：

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.pop(1)
print(cm)

二．

总结列表：

list1 = list((1, 2))

list2 = [1, 3, 'lijijaije', 3.5]
print(list1[1])
print(list2[1:3])

1.可以用list()函数或者方括号[]创建，元素之间用逗号’,‘’分隔。
2.列表的元素不需要具有相同的类型
3.使用索引来访问元素
4.可切片

元组：

tuple1 = tuple([1, 2])

tuple2 = (1, 3, 'lijijaie', 3.5)

print(tuple1[1])

print(tuple2[1:3])

tuple1[1] = 10

1.可以用tuple()函数或者方括号()创建，元素之间用逗号’,‘’分隔。
2.元组的元素不需要具有相同的类型
3.使用索引来访问元素
4.可切片
5.元素的值一旦创建就不可修改!!!!!(这是区别与列表的一个特征）

字典：

dict1 = dict([('name', 'kyda'), ('e', 10)])

dict2 = {'name': 'lin', 'age': 21}
print(dict1)

print(dict2['name'])

dict2['age'] = 23
print(dict2)

1.元素由键（key）和值（value）组成
2.可以用dict()函数或者方括号()创建，元素之间用逗号’,‘’分隔，键与值之间用冒号”:”隔开
3.键必须是唯一的，但值则不必。值可以取任何数据类型，但键必须是不可变的，如字符串，数字或元组
4.使用键（key）来访问元素

集合：

set1 = set('bbbbaa')
set2 = {'abc', 'jaja', 'abc', 'kyda'}
print(set1)
print(set2)

1.可以用set()函数或者方括号{}创建，元素之间用逗号”,”分隔。
2.与字典相比少了键
3.不可索引，不可切片
4.不可以有重复元素

三.词频统计

代码：

exclude={'a','the','and','i','you','in'}

def gettxt():
    txt=open("big.txt","r").read()
    txt=txt.lower()
    for ch in "~!@#$%^&*()_+'{}[]|?.:;,":

        txt=txt.replace(ch,"")
    return txt

bigList=gettxt().split()
print(bigList)
print('big;',bigList.count('big'))
bigSet=set(bigList)
print(bigSet)
bigDict={}
for word in bigSet:
    bigDict[word]=bigList.count(word)
    print(bigDict)
    print(bigDict.items())
    word=list(bigDict.items())
    word.sort()
    print(word)

posted @ 2019-03-14 14:39 李嘉杰阅读(160) 评论(0) 编辑收藏举报

刷新页面返回顶部

李嘉杰

复合数据类型，英文词频统计

公告