摘要: 一.背景 当数据集的大小超过一台独立物理计算机的存储能力时,就有必要对它进行分区(partition) 并存储到若干台单独的计算机上。管理网络中跨多台计算机存储的文件系统称为分布式文件系统 (distributed filesystem ) 。该系统架构于网络之上,势必会引入网络编程的复杂性,因此分 阅读全文
posted @ 2018-01-31 15:05 yuanninesuns 阅读(235) 评论(0) 推荐(0) 编辑
摘要: 一.要点 1.Hadoop目的是让多台计算机同时解决一个问题 2.HDFS(Hadoop Distributed File System 分布式存储系统)是一个分布式文件系统,有目录,目录下可以存储文件 3.HDFS不适合存储大量小文件,不适合低延迟数据访问,不支持多用户写入及任意修改文件 4.用户 阅读全文
posted @ 2018-01-31 13:27 yuanninesuns 阅读(192) 评论(0) 推荐(0) 编辑