初识Hadoop

 

Hadoop生态特点:

  开源,社区活跃

  囊括了大数据的方方面面

  成熟的生态圈

Hadoop常用的发型版本:

  1 Apache Hadoop

    - - 原生态的Hadoop。容易产生jar包冲突问题,难以解决。

  2 CDH

    - - CM组件,易安装,集群易搭建,易升级易管理,文档优秀,统一版本规避jar包冲突,缺点CM框架不开源。

  3 HDP

    - -使用原装Hadoop,纯开源。安装升级没有CDH方便

优选CDH。

 

Hadoop企业应用案例:

  大数据分析,预测某些用户的需求,提前发货。

  商品零售:大数据分析,建立模型,用户画像,精准营销。

 

posted @ 2018-06-22 09:39  我要变肥  阅读(180)  评论(0编辑  收藏  举报