2018年6月7日

摘要: hbase是hadoop的数据库,能够对大数据提供随机实时的读写访问功能,具有开源,分布式,可扩展行,面向列存储的特点。hbase的目标是存储并处理大量的数据。 它可以直接使用本地文件系统,也可以使用hdfs文件存储系统。使用 hdfs更加稳妥。 hbase存储的是松散数据。存储的数据可以理解为ke 阅读全文

posted @ 2018-06-07 17:41 打杂滴 阅读(119) 评论(0) 推荐(0) 编辑

摘要: 将查询结果写入到本地指定目录(也可以写入hdfs) insert overwrite local directory '/root/tmpdata/queryout_20180607' select * from gamedw.t_name where id=1 一个源可以同时插入到多个目标表或目标 阅读全文

posted @ 2018-06-07 15:14 打杂滴 阅读(198) 评论(0) 推荐(0) 编辑

摘要: hive是hadoop的一个重要子项目,利于mapreduce编程技术,实现部分sql语句,提供类SQL的编程接口。 hive是一个基于hadoop文件系统的数据仓库架构,它为数据仓库管理提供了许多功能:数据ETL,数据存储管理,大数据集的查询和分析能力。 由于hadoop是批处理系统,任务是高延迟 阅读全文

posted @ 2018-06-07 14:06 打杂滴 阅读(338) 评论(0) 推荐(0) 编辑


Copyright © 2024 打杂滴
Powered by .NET 8.0 on Kubernetes