Hive的定义及搭建

1.定义　　

　　Apache Hive数据仓库软件便于读，写和管理大型数据集驻留在分布式存储使用SQL。

　　结构可以投影到存储中的数据上。

　　客户端的连接方式可采用：command line 和 JDBC Driver。

注意：Hive实质就是客户端，不存在主从结构，搭建过程没有集群概念。

2.搭建Hive

　　前提：

　　　　 a.Hadoop集群搭建完成！

　　　　 b.start-dfs.sh 开启HDFS

　　　　　　start-yarn.sh 开启yarn

　　1.安装java

　　2.安装Hadoop

　　3.安装Hive

　　　　a.上传并解压　　

　　　　b.配置环境变量

　　4.开启集群相关服务

　　5.进入Hive

　　　　$>hive

　　6.测试

　　　　hive>show databases;

　　　　hive>use default;

　　　　hive>show tables;

　　　　hive>create table test(id int,name string);

　　　　hive>insert into test values(1,'lisi');

　　　　hive>select * from test;

　　　　hive>drop table test;

3.数据仓库和数据库

　　关系型数据库：OLTP联机事务处理：ACID，实时处理。

　　数据仓库：OLAP联机分析处理：统计，处理和加工（分析操作），离线处理，大数据集。

posted @ 2018-08-13 14:05 Coding_Now 阅读(230) 评论(0) 编辑收藏举报

努力加载评论中...

刷新页面返回顶部

Code_exploration