Hive文档
摘要:
Hive知识体系保姆级教程 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce/Spark的任务进行运算,底层由HDFS来提供数据的存储,说白了hive
Griffin编译安装
摘要:
Apache Griffin 编译安装 1. 环境准备 Maven(Apache Maven 3.6.3) Mysql 数据库 (可以是 PostgreSQL,mysql版本5.7 ) npm(版本6.14.6)(version 6.0.0+,用于编译ui模块)(推荐此版本) Scala (版本2.
Apache Superset 安装
摘要:
Apache Superset 安装 一、版本选择 软件名称 版本 Anaconda3 Anaconda3-5.3.0-Linux-x86_64.sh Python python3.9 Superset 2.1.1 二、软件安装 Anaconda3 # 下载链接:https://mirrors.tu
Apache DorisDB 线上部署
摘要:
Apache DorisDB 线上部署 一、机器资源(初始) 机器IP Hostname 内存 CPU 磁盘 172.16.203.151 dorisdb203-151 16g 4核 500G 172.16.203.152 dorisdb203-152 16g 4核 500G 172.16.203.
Hive数据压缩与存储格式
摘要:
一、Hive的数据压缩 (一) 数据压缩的优缺点 优点: 减少存储磁盘空间,降低单节点的磁盘IO。 减少网络传输带宽 ,因此可以加快数据在Hadoop集群流动的速度。 缺点: 需要花费额外的时间/CPU做压缩和解压缩计算。 (二)MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否
Hive基本使用
摘要:
一、Hive基本使用 (一) 基本操作 1. 数据库相关 (1) 创建数据库 create database tm; create database if not exists tm; (2) 切换数据库 use tm; (3) 查看数据库信息 -- 查看数据库信息 desc database tm
dolphinscheduler文档
摘要:
集群模式 一、基础软件安装(必装项请自行安装) 1、MySQL需要JDBC Driver 5.1.47+ 2、JDK (1.8+) 3、ZooKeeper (3.4.6+) 4、Hadoop (2.6+) 二、下载二进制tar.gz包 下载地址: https://dolphinscheduler.a