摘要: 使用3台CentOS虚拟机,搭建1主2从的Hadoop集群+Python3的大数据开发环境。同时下载10部英文小说,使用Python编写一组MapReduce程序,实现一个词频统计的小Demo,并使用Sqoop将统计数据从Hive导出到MySQL中,最后使用matplotlib展示统计的数据。 阅读全文
posted @ 2019-04-07 18:29 varlemon 阅读(2802) 评论(0) 推荐(0) 编辑