随笔分类 -  Hadoop

摘要:HDFS-Hadoop Distributed File System,对大文件效率高,小文件效率低。和普通本地的文件系统区别在于HDFS中的文件是分布在多台计算机上的,并且访问文件需要通过HDFS中的NameNode来访问。比如一个文件1g,被分成了10份分别保存在计算机01-10中,当客户端要获取这个文件时,会发生:客户端request到NameNodeNameNode返回这个文件分布情况:会返回一堆DataNode列表和文件block对应关系DataNode就是保存文件block的各个计算机,就是数据节点客户端得知文件信息后,就直接和DataNode联系拿数据在一个HDFS集群中,如果N 阅读全文
posted @ 2013-04-29 14:03 McKay 阅读(509) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示