摘要:
本章分享的目录: 1:执行 第一节:运行方式 2:优化 第二节:hive优化 第一节:hive运行方式 (1):命令行:cli:不是特别常用 与hdfs交互(执行执行dfs命令): 例:dfs –ls / 与Linux交互(!开头): 例: !pwd (2):脚本运行:应用做多的 hive -e " 阅读全文
摘要:
本章分享的目录: 1:表操作之插入、查询 第一节:hive DML (1) 插入数据 (2) 查询数据 1、内置运算符 2、内置函数 3、自定义函数 4、Lateral view 第一节:hive DML 一:插入数据 (1):从表查数据插入到hive表(A表中id,name插入B表) from A 阅读全文
摘要:
本章分享的目录: 1:表操作之表创建 第一节:hive DDL (1) 建表方式 (2) 普通建表 (3) 动态分区表 (4) 视图 (5) 索引 第一节:hive DDL(数据库/表的创建) 一:建表方式 (1) 第一种 creat: CREATE TABLE person( id INT, na 阅读全文
摘要:
本章分享的目录: 1:基础 第一节:简介与原理 2:设置用户及权限赋予 第二节:角色权限 3:安装 ,配置,连接 第三节:部署hive 4:参数动态设置 第四节:hive参数设置 第一节:简介与原理 简介: 数据仓库,对海量数据的离线处理(以HiveQL的形式,生成MR任务); 核心组件: 解释器, 阅读全文
摘要:
前言:随着数据量的不断增大,传统数据库的存储查询出现瓶颈,比如mysql采用分库分表的形式。 一:简介 1. 概念:分布式的列式数据库。 2. 基本概念: 2.1 RowKey:一行数据的唯一标识(主键)。 2.2 Column Family(列族):在定义表时候就定义完成,代表一个文件夹下的数据( 阅读全文