摘要:
根据对各种生态组件的分析,较好的一种架构是: 存储层:使用HDFS for Parquet/Kudu/Hbase(HDFS for Parquet和Kudu各有利弊,HBase作为补充) 资源调度层:YARN(也成为MR2) 批处理:Hive(2.0中,beeline代替了hive控制台)或MapR 阅读全文
摘要:
安装包下载 1、CM软件包下载 从http://archive.cloudera.com/cm5/redhat/7/x86_64/cm/5.16.1/RPMS/x86_64/下载rpm包,如下: 其实不需要下载j2sdk的,因为cm安装过程中会自动安装的,自己下载了也没用(这个网上的一些文章说法是不 阅读全文
摘要:
CDH 5.x搭建请参考CentOS 7离线安装CDH 5.16.1完全指南(含各种错误处理)。 如果使用的是cloudera quickstart vm,则只能在linux服务器中使用eclipse提交,无法远程访问(主要是quickstart绑定的所有ip都是localhost所致,所以最好还是 阅读全文
摘要:
引入事务管理器 使用方式1: 使用方式2: 使用方式3: 阅读全文