摘要: 1.Hive简介 Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供类SQL查询功能。 本质是将SQL转换为MapReduce程序。 主要用途:操作接口采用类SQL语法,提供快速开发的能力,功能扩展方便,用来做离线分析,比直接用MapReduce开发效率更 阅读全文
posted @ 2019-10-24 23:35 贾江浦 阅读(1069) 评论(0) 推荐(0) 编辑
摘要: 数据库与数据仓库的区别 数据库与数据仓库的区别实际讲的是OLTP与OLAP的区别。 操作性处理,叫联机事务处理OLTP(On-Line Transaction Processing),也可以称面向交易的处理系统,他是针对具体业务在数据库联机的日常操作,通常对少数记录进行查询,修改。用户较为关心操作的 阅读全文
posted @ 2019-10-24 20:31 贾江浦 阅读(2557) 评论(0) 推荐(0) 编辑
摘要: 1.数据仓库的基本概念 数据仓库,英文名称为Data Warehouse,可简写为DW或DWH。数据仓库的目的是构建面向分析的集成化数据环境,为企业提供决策支持(Decision Support)。它出于分析性报告和决策支持目的而创建。 数据仓库本身并不“生产”任何数据,同时自身也不需要“消费”任何 阅读全文
posted @ 2019-10-24 19:54 贾江浦 阅读(221) 评论(0) 推荐(0) 编辑