摘要: 大数据实践(八)--Hive、Pig安装及基本操作 mysql-connector-java-8.0.16.jar hadoop 2.7.3 hive 2.7.3 pig 0.12.0 一、简介 Hive 是一个构建在 Hadoop 之上的数据仓库,它可以将结构化的数据文件映射成表,并提供类 SQL 阅读全文
posted @ 2020-11-10 10:41 cgl_dong 阅读(360) 评论(0) 推荐(0) 编辑
摘要: 大数据实验(七)Spark单机安装及WordCount(TopKey) 前置环境 Ubuntu 16.04 hadoop 2.7.3 Spark 3.0.0-preview2 scala 2.12.10 (对应Spark版本) maven 3+ spark-core_2.12 (maven中开发Sp 阅读全文
posted @ 2020-11-10 10:40 cgl_dong 阅读(136) 评论(0) 推荐(0) 编辑