初识Hive

  • Hive 简单说明
  1. 他没有很多的架构来讲,他就是一个简单的工具
    1. 数据仓库软件,分布式的读,i写管理大数据
    2. 访问方式 :JDBC(代码),命令行工具(常用)
  2. FaceBook 数据太大,需要大数据工程师,办法:用sql,sql转化为mapreduce程序,自动提交个yarn。
  • 关系型数据库和hive对比
  1. 数据库
    1. RDBMS
    2. SQL
    3. 数据库适合OLTP及在线事务处理(淘宝点,商品详情显示,在数据库中找,)速度快,延迟低。
  2. HIve
    1. OLAP 在先分析处理,(我们可以进行等待)数据慢,延迟高,中在于海量数据的处理
  • HIve 官网: hive.apache.org
  • hive 的本质:MapReduce.对于我们来说时写sql,但是其实就是通过hive转化为mapreduce..他尽可以管理hdfs中的数据
  • 数据库和数据仓库应用场景
  • hive的实现机制
  • Hive 环境的准备
posted @ 2020-01-15 17:32  dousil  阅读(88)  评论(0编辑  收藏  举报