HIve 总结

1.hive 介绍    (hadoop 上  sql on MR  )

      hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行。 其优点是学习成本低,可以通过类SQL语句快速实现简单的MapReduce统计,不必开发专门的MapReduce应用,十分适合数据仓库的统计分析。

     Hive是建立在 Hadoop 上的数据仓库基础构架。它提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。Hive 定义了简单的类 SQL 查询语言,称为 HQL,它允许熟悉 SQL 的用户查询数据。同时,这个语言也允许熟悉 MapReduce 开发者的开发自定义的 mapper 和 reducer 来处理内建的 mapper 和 reducer 无法完成的复杂的分析工作。

2.常用的数据类型

Hive不同的数据类型,用于创建表。Hive所有数据类型分为四种类型,给出如下:

  • 列类型
  • 文字
  • Null 值
  • 复杂类型

3.操作表语句

     3.1建表    hive> CREATE DATABASE [IF NOT EXISTS]  book;

     3.2-查看    hive> SHOW DATABASES;
     3.3 删表  hive> DROP DATABASE IF EXISTS book;
     3.4修改表 hive> ALTER TABLE book RENAME TO bookdb;  【把book表改为bookdb】
     3.5修改表的字段  ALTER TABLE bookdb CHANGE name ename String; 【把name 字段改为ename】
       总结
              1.create
              2.drop
              3.alert table   Rename To…
4.操作分区
         1.添加分区
          2.重命名分区
          3.删除分区
5.内置运算
  1. 关系运算符
  2. 算术运算符
  3. 逻辑运算符
  4. 复杂运算符

6.内置函数

      1聚合函数

    其他见《hive 权威指南》

7.视图和索引

   创建视图  create  view  book  select id ,name from bookdb ;

   删除视图  drop  view book

    创建索引  create  index  index_id  on book;

   删除索引    drop index  index_id on book  ;

8.常用的语句

      1.select   -------   where 

       2.select   ------ order by

       3.select   ------ join  

总结 :语句和sql语句几乎相同,数据类型,运算符,内置函数有较大不同。

        
 
 

      

 

   

posted @ 2019-05-10 19:34  左手编程右手诗  阅读(380)  评论(0编辑  收藏  举报