2019 年 11月 4 日随笔档案 - tunan96

2019年11月4日

摘要：重命名表 1．语法 ALTER TABLE table_name RENAME TO new_table_name 2．实操案例 hive (default)> alter table dept_partition2 rename to dept_partition3; 增加、修改和删除表分区详见阅读全文

posted @ 2019-11-04 23:47 tunan96 阅读(216) 评论(0) 推荐(0) 编辑

Hive_删除表

摘要： hive (default)> drop table dept_partition; 阅读全文

posted @ 2019-11-04 23:47 tunan96 阅读(167) 评论(0) 推荐(0) 编辑

Hive_分区表

摘要：分区表实际上就是对应一个HDFS文件系统上的独立的文件夹，该文件夹下是该分区所有的数据文件。Hive中的分区就是分目录，把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择查询所需要的指定的分区，这样的查询效率会提高很多。分区表基本操作 1．引入分区表（需要根据日阅读全文

posted @ 2019-11-04 23:36 tunan96 阅读(190) 评论(0) 推荐(0) 编辑

Hive_创建表

摘要： 1．建表语法 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_name data_type [COMMENT col_comment], ...)] [COMMENT table_comment] [PARTITIONED BY (c 阅读全文

posted @ 2019-11-04 23:33 tunan96 阅读(1217) 评论(0) 推荐(0) 编辑

Hive_修改数据库

摘要：用户可以使用ALTER DATABASE命令为某个数据库的DBPROPERTIES设置键-值对属性值，来描述这个数据库的属性信息。数据库的其他元数据信息都是不可更改的，包括数据库名和数据库所在的目录位置。 hive (default)> alter database db_hive set dbpr 阅读全文

posted @ 2019-11-04 23:26 tunan96 阅读(943) 评论(0) 推荐(0) 编辑

Hive_删除数据库

摘要： 1．删除空数据库 hive>drop database db_hive2; 2．如果删除的数据库不存在，最好采用 if exists判断数据库是否存在 hive> drop database db_hive; FAILED: SemanticException [Error 10072]: Data 阅读全文

posted @ 2019-11-04 23:26 tunan96 阅读(8238) 评论(0) 推荐(1) 编辑

Hive_查询数据库

摘要：显示数据库 1．显示数据库 hive> show databases; 2．过滤显示查询的数据库 hive> show databases like 'db_hive*'; OK db_hive db_hive_1 查看数据库详情 1．显示数据库信息 hive> desc database db_h 阅读全文

posted @ 2019-11-04 23:25 tunan96 阅读(380) 评论(0) 推荐(0) 编辑

Hive_创建数据库

摘要： CREATE DATABASE [IF NOT EXISTS] database_name [COMMENT database_comment] [LOCATION hdfs_path] [WITH DBPROPERTIES (property_name=property_value, ...)]; 阅读全文

posted @ 2019-11-04 23:23 tunan96 阅读(2340) 评论(0) 推荐(0) 编辑

Hive_数据类型

摘要：基本数据类型 Hive数据类型 Java数据类型长度例子 TINYINT byte 1byte有符号整数 20 SMALINT short 2byte有符号整数 20 INT int 4byte有符号整数 20 BIGINT long 8byte有符号整数 20 BOOLEAN boolean 阅读全文

posted @ 2019-11-04 23:22 tunan96 阅读(189) 评论(0) 推荐(0) 编辑

Hive_其他命令操作

摘要： 1．退出hive窗口： hive(default)>exit; hive(default)>quit; 在新版的hive中没区别了，在以前的版本是有的： exit:先隐性提交数据，再退出； quit:不提交数据，退出； 2．在hive cli命令窗口中如何查看hdfs文件系统 hive(defaul 阅读全文

posted @ 2019-11-04 23:13 tunan96 阅读(172) 评论(0) 推荐(0) 编辑

Hive_常见属性配置

摘要： Hive数据仓库位置配置 1）Default数据仓库的最原始位置是在hdfs上的：/user/hive/warehouse路径下。 2）在仓库目录下，没有对默认的数据库default创建文件夹。如果某张表属于default数据库，直接在数据仓库目录下创建一个文件夹。 3）修改default数据仓库原阅读全文

posted @ 2019-11-04 23:13 tunan96 阅读(142) 评论(0) 推荐(0) 编辑

Hive_常用交互命令

摘要： [atguigu@hadoop102 hive]$ bin/hive -help usage: hive -d,--define <key=value> Variable subsitution to apply to hive commands. e.g. -d A=B or --define A 阅读全文

posted @ 2019-11-04 23:12 tunan96 阅读(236) 评论(0) 推荐(0) 编辑

Hive_ JDBC访问

摘要：启动hiveserver2服务 [atguigu@hadoop102 hive]$ bin/hiveserver2 启动beeline [atguigu@hadoop102 hive]$ bin/beeline Beeline version 1.2.1 by Apache Hive beeline 阅读全文

posted @ 2019-11-04 23:11 tunan96 阅读(307) 评论(0) 推荐(0) 编辑

Hive_元数据配置到MySQL

摘要：驱动拷贝 1．在/opt/software/mysql-libs目录下解压mysql-connector-java-5.1.27.tar.gz驱动包 [root@hadoop102 mysql-libs]# tar -zxvf mysql-connector-java-5.1.27.tar.gz 2 阅读全文

posted @ 2019-11-04 23:10 tunan96 阅读(157) 评论(0) 推荐(0) 编辑

Hive_MySQL安装

摘要：安装包准备 1．查看mysql是否安装，如果安装了，卸载mysql （1）查看 [root@hadoop102 桌面]# rpm -qa|grep mysql mysql-libs-5.1.73-7.el6.x86_64 （2）卸载 [root@hadoop102 桌面]# rpm -e --nod 阅读全文

posted @ 2019-11-04 23:08 tunan96 阅读(91) 评论(0) 推荐(0) 编辑

Hive_安装部署

摘要： 1．Hive官网地址 http://hive.apache.org/ 2．文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3．下载地址 http://archive.apache.org/dist/hive 阅读全文

posted @ 2019-11-04 23:06 tunan96 阅读(149) 评论(0) 推荐(0) 编辑

Hive_和关系数据库比较

摘要：由于 Hive 采用了类似SQL 的查询语言 HQL(Hive Query Language)，因此很容易将 Hive 理解为数据库。其实从结构上来看，Hive 和数据库除了拥有类似的查询语言，再无类似之处。本文将从多个方面来阐述 Hive 和数据库的差异。数据库可以用在 Online 的应用中，但阅读全文

posted @ 2019-11-04 23:03 tunan96 阅读(304) 评论(0) 推荐(0) 编辑

Hive_架构原理

摘要： 1．用户接口：Client CLI（command-line interface）、JDBC/ODBC(jdbc访问hive)、WEBUI（浏览器访问hive） 2．元数据：Metastore 元数据包括：表名、表所属的数据库（默认是default）、表的拥有者、列/分区字段、表的类型（是否是外部表阅读全文

posted @ 2019-11-04 23:01 tunan96 阅读(119) 评论(0) 推荐(0) 编辑

Hive_优缺点

摘要：优点 1) 操作接口采用类SQL语法，提供快速开发的能力（简单、容易上手）。 2) 避免了去写MapReduce，减少开发人员的学习成本。 3) Hive的执行延迟比较高，因此Hive常用于数据分析，对实时性要求不高的场合。 4) Hive优势在于处理大数据，对于处理小数据没有优势，因为Hive的执阅读全文

posted @ 2019-11-04 22:59 tunan96 阅读(2126) 评论(0) 推荐(0) 编辑

Hive_什么是Hive

摘要： Hive：由Facebook开源用于解决海量结构化日志的数据统计。 Hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张表，并提供类SQL查询功能。本质是：将HQL转化成MapReduce程序 1）Hive处理的数据存储在HDFS 2）Hive分析数据底层的实现是MapR 阅读全文

posted @ 2019-11-04 22:58 tunan96 阅读(186) 评论(0) 推荐(0) 编辑

tunan96

空谈毫无用处，要不断实践和反思

公告