复合数据类型,英文词频统计

一:

排序:

 

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.sort()
print(cm)

 

插入:

 

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.insert(2,'zhanghuanm')
print(cm)

 

 

统计数量:

 

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.count('tom'),cm.index('tom')
print(cm.count('tom'))

 

 

末端+1

 

末端1

 

删除指定序号:

 

cm=['Michael','Bob','tom','李嘉杰','Tay']
cm.pop(1)
print(cm)

 

二.

总结列表

 


list1 = list((1, 2))

list2 = [1, 3, 'lijijaije', 3.5]
print(list1[1])
print(list2[1:3])

1.可以用list()函数或者方括号[]创建,元素之间用逗号’,‘’分隔。 
2.列表的元素不需要具有相同的类型 
3.使用索引来访问元素 
4.可切片

 

元组

 

tuple1 = tuple([1, 2])

tuple2 = (1, 3, 'lijijaie', 3.5)

print(tuple1[1])

print(tuple2[1:3])

tuple1[1] = 10

1.可以用tuple()函数或者方括号()创建,元素之间用逗号’,‘’分隔。 
2.元组的元素不需要具有相同的类型 
3.使用索引来访问元素 
4.可切片 
5.元素的值一旦创建就不可修改!!!!!(这是区别与列表的一个特征)

 

字典:

 


dict1 = dict([('name', 'kyda'), ('e', 10)])

dict2 = {'name': 'lin', 'age': 21}
print(dict1)

print(dict2['name'])

dict2['age'] = 23
print(dict2)

1.元素由键(key)和值(value)组成 
2.可以用dict()函数或者方括号()创建,元素之间用逗号’,‘’分隔,键与值之间用冒号”:”隔开 
3.键必须是唯一的,但值则不必。值可以取任何数据类型,但键必须是不可变的,如字符串,数字或元组 
4.使用键(key)来访问元素

 

集合:

 

set1 = set('bbbbaa')
set2 = {'abc', 'jaja', 'abc', 'kyda'}
print(set1)
print(set2)

1.可以用set()函数或者方括号{}创建,元素之间用逗号”,”分隔。 
2.与字典相比少了键 
3.不可索引,不可切片 
4.不可以有重复元素

 

 

.词频统计

 

 

代码:

exclude={'a','the','and','i','you','in'}


def gettxt():
    txt=open("big.txt","r").read()
    txt=txt.lower()
    for ch in "~!@#$%^&*()_+'{}[]|?.:;,":

        txt=txt.replace(ch,"")
    return txt



bigList=gettxt().split()
print(bigList)
print('big;',bigList.count('big'))
bigSet=set(bigList)
print(bigSet)
bigDict={}
for word in bigSet:
    bigDict[word]=bigList.count(word)
    print(bigDict)
    print(bigDict.items())
    word=list(bigDict.items())
    word.sort()
    print(word)

 

 

posted @ 2019-03-14 14:39  李嘉杰  阅读(160)  评论(0编辑  收藏  举报