2012 年 12月 18 日随笔档案 - MrMission

2012年12月18日

摘要：导引两个主要的问题如何存储海量数据如何分析海量数据Hadoop就是Hadoop项目它包括Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, OozieHadoop文件系统适合于有数据流（一次写，多次读）和运行的普通主机上的海量数据但是Hadoop文件系统部适合运行延迟性输入，多次写以及随意修改的小文件HDFS 框架分块：默认64M（很大，因为用于海量数据）名字结点：含有文件系统的目录，文件信息以及相应的分块信息（很重要）数据结点：储存分块信息HA策略：1.x只能有一个名字结点，2.x之后就有针对名字结点的活动-待阅读全文

posted @ 2012-12-18 11:21 MrMission 阅读(230) 评论(0) 推荐(0) 编辑