会员
周边
新闻
博问
闪存
众包
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
心随你动
博客园
首页
新随笔
联系
订阅
管理
2024年5月27日
Hive文档
摘要: Hive知识体系保姆级教程 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce/Spark的任务进行运算,底层由HDFS来提供数据的存储,说白了hive
阅读全文
posted @ 2024-05-27 11:32 柒小韩
阅读(358)
评论(0)
推荐(0)
2024年5月24日
Griffin编译安装
摘要: Apache Griffin 编译安装 1. 环境准备 Maven(Apache Maven 3.6.3) Mysql 数据库 (可以是 PostgreSQL,mysql版本5.7 ) npm(版本6.14.6)(version 6.0.0+,用于编译ui模块)(推荐此版本) Scala (版本2.
阅读全文
posted @ 2024-05-24 18:02 柒小韩
阅读(93)
评论(0)
推荐(0)
Apache Superset 安装
摘要: Apache Superset 安装 一、版本选择 软件名称 版本 Anaconda3 Anaconda3-5.3.0-Linux-x86_64.sh Python python3.9 Superset 2.1.1 二、软件安装 Anaconda3 # 下载链接:https://mirrors.tu
阅读全文
posted @ 2024-05-24 18:02 柒小韩
阅读(540)
评论(0)
推荐(0)
Apache DorisDB 线上部署
摘要: Apache DorisDB 线上部署 一、机器资源(初始) 机器IP Hostname 内存 CPU 磁盘 172.16.203.151 dorisdb203-151 16g 4核 500G 172.16.203.152 dorisdb203-152 16g 4核 500G 172.16.203.
阅读全文
posted @ 2024-05-24 18:02 柒小韩
阅读(140)
评论(0)
推荐(0)
2021年8月13日
Hive数据压缩与存储格式
摘要: 一、Hive的数据压缩 (一) 数据压缩的优缺点 优点: 减少存储磁盘空间,降低单节点的磁盘IO。 减少网络传输带宽 ,因此可以加快数据在Hadoop集群流动的速度。 缺点: 需要花费额外的时间/CPU做压缩和解压缩计算。 (二)MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否
阅读全文
posted @ 2021-08-13 16:12 柒小韩
阅读(806)
评论(0)
推荐(0)
2021年8月10日
Hive基本使用
摘要: 一、Hive基本使用 (一) 基本操作 1. 数据库相关 (1) 创建数据库 create database tm; create database if not exists tm; (2) 切换数据库 use tm; (3) 查看数据库信息 -- 查看数据库信息 desc database tm
阅读全文
posted @ 2021-08-10 13:14 柒小韩
阅读(363)
评论(0)
推荐(0)
2021年5月25日
dolphinscheduler文档
摘要: 集群模式 一、基础软件安装(必装项请自行安装) 1、MySQL需要JDBC Driver 5.1.47+ 2、JDK (1.8+) 3、ZooKeeper (3.4.6+) 4、Hadoop (2.6+) 二、下载二进制tar.gz包 下载地址: https://dolphinscheduler.a
阅读全文
posted @ 2021-05-25 21:39 柒小韩
阅读(964)
评论(0)
推荐(0)
公告