Fork me on GitHub
摘要: hive支持sql标准的数据仓库,可以将sql语句转化成mr程序执行。基础分析一般用hive来做,比较复杂的用mr来做数据仓库和数据库的区别 数据仓库:历史数据,面向分析,保证数据的完整性可以允许数据冗余。 数据库:存储结构化,在线数据,面向业务,使用范式来减少冗余。hive中有解析器,编译器,优化 阅读全文
posted @ 2019-04-27 23:26 时间行人 阅读(421) 评论(0) 推荐(0) 编辑