第二次作业
一、安装Spark
hadoop,jdk基础坏境的检查
spark的使用
二、Python编程练习:英文文本的词频统计
import string list=[] dict={} txt=open('text.txt','r').read().lower() #读取文件 for ch in string.punctuation: #替换标点符号 txt=txt.replace(ch,"") list=txt.split() #分割文章 for i in list: #统计词频 if i in dict: dict[i]+=1 else: dict[i]=1 dict= sorted(dict.items(),key=lambda d:d[1],reverse= True) #词频排序 f = open('result.txt','w') #格式化将结果写入文件 for items in dict: f.writelines('{}--{}'.format(items[0],items[1]) + '\n')
运行结果:
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 无需6万激活码!GitHub神秘组织3小时极速复刻Manus,手把手教你使用OpenManus搭建本
· Manus爆火,是硬核还是营销?
· 终于写完轮子一部分:tcp代理 了,记录一下
· 别再用vector<bool>了!Google高级工程师:这可能是STL最大的设计失误
· 单元测试从入门到精通