第二次作业

一、安装Spark

hadoop,jdk基础坏境的检查

 

spark的使用

 

 

 二、Python编程练习:英文文本的词频统计

复制代码
import string
list=[] 
dict={}
txt=open('text.txt','r').read().lower() #读取文件
for ch in string.punctuation:    #替换标点符号
    txt=txt.replace(ch,"")
list=txt.split() #分割文章
for i in list:    #统计词频
    if i in dict:
        dict[i]+=1
    else:
        dict[i]=1
dict= sorted(dict.items(),key=lambda d:d[1],reverse= True) #词频排序
f = open('result.txt','w')    #格式化将结果写入文件
for items in dict:
    f.writelines('{}--{}'.format(items[0],items[1]) + '\n')
复制代码

运行结果:

 

posted @   啊bin  阅读(31)  评论(0编辑  收藏  举报
相关博文:
阅读排行:
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通
点击右上角即可分享
微信分享提示