一生太短暂,遇到喜欢的人就要认真喜欢!|

柒小韩

园龄:5年11个月粉丝:1关注:3

Hive文档
摘要: Hive知识体系保姆级教程 一. Hive概览 1.1 hive的简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 其本质是将SQL转换为MapReduce/Spark的任务进行运算,底层由HDFS来提供数据的存储,说白了hive
173
0
0
Griffin编译安装
摘要: Apache Griffin 编译安装 1. 环境准备 Maven(Apache Maven 3.6.3) Mysql 数据库 (可以是 PostgreSQL,mysql版本5.7 ) npm(版本6.14.6)(version 6.0.0+,用于编译ui模块)(推荐此版本) Scala (版本2.
38
0
0
Apache Superset 安装
摘要: Apache Superset 安装 一、版本选择 软件名称 版本 Anaconda3 Anaconda3-5.3.0-Linux-x86_64.sh Python python3.9 Superset 2.1.1 二、软件安装 Anaconda3 # 下载链接:https://mirrors.tu
284
0
0
Apache DorisDB 线上部署
摘要: Apache DorisDB 线上部署 一、机器资源(初始) 机器IP Hostname 内存 CPU 磁盘 172.16.203.151 dorisdb203-151 16g 4核 500G 172.16.203.152 dorisdb203-152 16g 4核 500G 172.16.203.
88
0
0
Hive数据压缩与存储格式
摘要: 一、Hive的数据压缩 (一) 数据压缩的优缺点 优点: ​ 减少存储磁盘空间,降低单节点的磁盘IO。 ​ 减少网络传输带宽 ,因此可以加快数据在Hadoop集群流动的速度。 缺点: ​ 需要花费额外的时间/CPU做压缩和解压缩计算。 (二)MR支持的压缩编码 压缩格式 工具 算法 文件扩展名 是否
748
0
0
Hive基本使用
摘要: 一、Hive基本使用 (一) 基本操作 1. 数据库相关 (1) 创建数据库 create database tm; create database if not exists tm; (2) 切换数据库 use tm; (3) 查看数据库信息 -- 查看数据库信息 desc database tm
321
0
0
dolphinscheduler文档
摘要: 集群模式 一、基础软件安装(必装项请自行安装) 1、MySQL需要JDBC Driver 5.1.47+ 2、JDK (1.8+) 3、ZooKeeper (3.4.6+) 4、Hadoop (2.6+) 二、下载二进制tar.gz包 下载地址: https://dolphinscheduler.a
897
0
0
深色
回顶
收起
点击右上角即可分享
微信分享提示