会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
纯捡垃圾吃的
张瑞153169
博客园
首页
新随笔
联系
订阅
管理
2019年8月22日
Hive去除重复数据操作
摘要: Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能 hive的元数据存储:通常是存储在关系数据库如 mysql(推荐) , derby(内嵌数据库)中 hive的组成部分 :解释器、编译器、优化器、执行器 hive具有sql数据库的外表,但
阅读全文
posted @ 2019-08-22 17:34 纯捡垃圾吃的
阅读(13831)
评论(0)
推荐(0)
编辑
公告
返回顶部