会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Polvem
博客园
首页
新随笔
联系
订阅
管理
Hadoop综合大作业
在hadoop上对英文小说《教父II·西西里人》进行词频统计;
开启所有的服务,并将txt文件放在wc文件夹里:
将txt文件上传至hdfs,启动hive:
将导入文件导入到新建的表novel里:
进行词频统计并放入表note_count表中:
查询前20:
用Hive对爬虫大作业产生的csv文件进行数据分析:
进入文件路径并查看数据前5:
查看上传成功的文件的前20个数据:
查看数据总条数:
posted @
2018-05-25 12:04
Polvem
阅读(
121
) 评论(
0
)
编辑
收藏
举报
会员力量,点亮园子希望
刷新页面
返回顶部
公告