2012年12月18日
摘要: 导引两个主要的问题如何存储海量数据如何分析海量数据Hadoop就是Hadoop项目它包括Common, Avro, MapReduce, HDFS, Pig, Hive, Hbase, ZooKeeper, Sqoop, OozieHadoop文件系统适合于有数据流(一次写,多次读)和运行的普通主机上的海量数据但是Hadoop文件系统部适合运行延迟性输入,多次写以及随意修改的小文件HDFS 框架分块:默认64M(很大,因为用于海量数据)名字结点:含有文件系统的目录,文件信息以及相应的分块信息(很重要)数据结点:储存分块信息HA策略:1.x只能有一个名字结点,2.x之后就有针对名字结点的活动-待 阅读全文
posted @ 2012-12-18 11:21 MrMission 阅读(230) 评论(0) 推荐(0) 编辑