摘要: 根据对各种生态组件的分析,较好的一种架构是: 存储层:使用HDFS for Parquet/Kudu/Hbase(HDFS for Parquet和Kudu各有利弊,HBase作为补充) 资源调度层:YARN(也成为MR2) 批处理:Hive(2.0中,beeline代替了hive控制台)或MapR 阅读全文
posted @ 2019-04-20 13:56 zhjh256 阅读(611) 评论(0) 推荐(0) 编辑
摘要: 安装包下载 1、CM软件包下载 从http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.16.1/RPMS/x86_64/下载rpm包,如下: 其实不需要下载j2sdk的,因为cm安装过程中会自动安装的,自己下载了也没用(这个网上的一些文章说法是不 阅读全文
posted @ 2019-04-20 13:49 zhjh256 阅读(5373) 评论(0) 推荐(0) 编辑
摘要: CDH 5.x搭建请参考CentOS 7离线安装CDH 5.16.1完全指南(含各种错误处理)。 如果使用的是cloudera quickstart vm,则只能在linux服务器中使用eclipse提交,无法远程访问(主要是quickstart绑定的所有ip都是localhost所致,所以最好还是 阅读全文
posted @ 2019-04-20 13:18 zhjh256 阅读(743) 评论(0) 推荐(0) 编辑
摘要: 引入事务管理器 使用方式1: 使用方式2: 使用方式3: 阅读全文
posted @ 2019-04-20 09:18 zhjh256 阅读(627) 评论(0) 推荐(0) 编辑