4、HDP与CDH
一、 Hadoop版本
目前Hadoop发行版本非常多,我个人接触的有HDP和CDH,Hortonworks版本(Hortonworks Data Platform,简称“HDP”),Cloudera版本(Cloudera Distribution Hadoop,简称“CDH”),还有其他的版本,目前中国公司我发现用的CDH版本较多,至于什么原因我也不是很清楚,不知道是不是跟风,从我个人的角度使用来看,我觉得HDP版本要比CDH要好。
二、 HDP与CDH对比
1. 据个人了解HDP是100%完全开源的,而CDH还不是100%完全开源。Hortonworks的工程师是社区的主要贡献者,Cloudera的发行版本也是比较清晰的。
2. HDP使用开源工具Ambari安装,CDH使用Cloudera Manager工具安装。对配置的修改与更新我喜欢Ambari的界面,可以很方便的修改集群配置,Cloudera Manager的配置界面真的是太烂了,不方便,发现有些配置竟然没法改。
3. 支持的组件,HDP基本上支持所有的开源大数据组件,CDH也基本上支持所有的开源大数据组件。
4. 代码包依赖,如果是HDP平台,编写代码直接依赖hadoop版本即可,如果是CDH平台,编写代码要依赖cdh的版本,否则运行不成功,这是坑啊。
博客:https://blog.csdn.net/jsutyq/article/details/80762965