摘要: 1、Sqoop概述 简介 Sqoop 是一款开源的工具,主要用于在 Hadoop(Hive)与传统的数据库(mysql、postgresql...) 间进行数据的传递,可以将一个关系型数据库(例如 : MySQL ,Oracle ,Postgres 等)中的 数据导进到 Hadoop 的 HDFS 阅读全文
posted @ 2021-10-12 23:17 Norni 阅读(65) 评论(0) 推荐(0) 编辑
摘要: 问题描述 使用Sqoop从mysql导入数据到hive报错:Could not load org.apache.hadoop.hive.conf.HiveConf. Make sure HIVE_CONF_DIR is set correctly 分析 对于HiveConf.class类是存在的 措 阅读全文
posted @ 2021-10-12 22:41 Norni 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 1、概述 1.1 定义 Kafka是一个分布式的基于 发布/订阅模式的消息队列(Message Queue),主要应用于大数据实时处理领域。 1.2 消息队列 1.2.1 使用消息队列的好处 解耦 在确保遵循同样的接口约束时,可以独立的扩展或修改对数据的处理过程 可恢复性 系统的一部分组件失效时,不 阅读全文
posted @ 2021-10-12 00:02 Norni 阅读(273) 评论(0) 推荐(0) 编辑