Hadoop实战应用
1、云盘存储系统通过HDFS实现
2、Hadoop三大发行版本
1)apache -->基础版本,实际企业使用比较少
2)cloudera -->CDH(Cloudera的Hadoop发行版) ClouderaManager(集群软件分发及管理监控)
3)Hortonworks -->HDP(Hortonworks Data Platform)
3、日志行为分析 -->30-50G
1.数据清洗 -->数据的不合格导致应用程序出问题(空指针异常)
2.依据需求进行数据分析(ip地址分析,访问时间分析等)