Hadoop实战应用

1、云盘存储系统通过HDFS实现

2、Hadoop三大发行版本

  1)apache    -->基础版本,实际企业使用比较少

  2)cloudera    -->CDH(Cloudera的Hadoop发行版)  ClouderaManager(集群软件分发及管理监控)

  3)Hortonworks  -->HDP(Hortonworks Data Platform)

3、日志行为分析  -->30-50G

  1.数据清洗    -->数据的不合格导致应用程序出问题(空指针异常)

  2.依据需求进行数据分析(ip地址分析,访问时间分析等)

posted @ 2017-03-30 15:55  阿杜&eason  阅读(252)  评论(0编辑  收藏  举报