BenjaminYang In solitude, where we are least alone
摘要: 1.hadoop生态系统 2.hbase简介 非关系型数据库知识面扩展 cassandra、hbase、mongodb、redis couchdb,文件存储数据库 Neo4j非关系型图数据库 3.hbase概念 hadoop Database,是一个高可靠性、高性能、面向列、可伸缩、实时读写的分布式 阅读全文
posted @ 2019-01-21 16:20 benjamin杨 阅读(341) 评论(0) 推荐(0) 编辑
摘要: Hive 优化 1.核心思想: 把Hive SQL 当做Mapreduce程序去优化 以下SQL不会转为Mapreduce来执行 select仅查询本表字段 where仅对本表字段做条件过滤 Explain 显示执行计划 EXPLAIN [EXTENDED] query 2.Hive运行方式: 本地 阅读全文
posted @ 2019-01-21 14:38 benjamin杨 阅读(431) 评论(0) 推荐(1) 编辑
摘要: 1.Hive运行方式: 命令行方式cli:控制台模式 脚本运行方式(实际生产环境中用最多) JDBC方式:hiveserver2 web GUI接口 (hwi、hue等) 1.1Hive在CLI模式中与hdfs交互 执行执行dfs命令 例:dfs –ls / 1.2与Linux交互 !开头 例: ! 阅读全文
posted @ 2019-01-21 10:38 benjamin杨 阅读(1545) 评论(0) 推荐(0) 编辑