Hive的定义及搭建
1.定义
Apache Hive数据仓库软件便于读,写和管理大型数据集驻留在分布式存储使用SQL。
结构可以投影到存储中的数据上。
客户端的连接方式可采用:command line 和 JDBC Driver。
注意:Hive实质就是客户端,不存在主从结构,搭建过程没有集群概念。
2.搭建Hive
前提:
a.Hadoop集群搭建完成!
b.start-dfs.sh 开启HDFS
start-yarn.sh 开启yarn
1.安装java
2.安装Hadoop
3.安装Hive
a.上传并解压
b.配置环境变量
4.开启集群相关服务
5.进入Hive
$>hive
6.测试
hive>show databases;
hive>use default;
hive>show tables;
hive>create table test(id int,name string);
hive>insert into test values(1,'lisi');
hive>select * from test;
hive>drop table test;
3.数据仓库和数据库
关系型数据库:OLTP联机事务处理:ACID,实时处理。
数据仓库:OLAP联机分析处理:统计,处理和加工(分析操作),离线处理,大数据集。
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】凌霞软件回馈社区,博客园 & 1Panel & Halo 联合会员上线
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步