初识Hadoop
Hadoop生态特点:
开源,社区活跃
囊括了大数据的方方面面
成熟的生态圈
Hadoop常用的发型版本:
1 Apache Hadoop
- - 原生态的Hadoop。容易产生jar包冲突问题,难以解决。
2 CDH
- - CM组件,易安装,集群易搭建,易升级易管理,文档优秀,统一版本规避jar包冲突,缺点CM框架不开源。
3 HDP
- -使用原装Hadoop,纯开源。安装升级没有CDH方便
优选CDH。
Hadoop企业应用案例:
大数据分析,预测某些用户的需求,提前发货。
商品零售:大数据分析,建立模型,用户画像,精准营销。