摘要: HDFS HDFS (Hadoop Distributed FileSystem) 是 Hadoop 分布式文件系统,以流式数据访问模式来存储超大文件,运行与商业硬件集群上,管理网络中跨多台计算机存储的文件系统,是分布式计算中数据管理的的基础。 流式数据访问模式 : 指的是数据不是一次性获取过来,而 阅读全文
posted @ 2018-09-17 14:41 v-imok 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 走上大数据的自学之路....,Hadoop是走上大数据开发学习之路的第一个门槛。 Hadoop,是Apache的一个开源项目,开发人员可以在不了解分布式底层细节,开发分布式程序,充分利用集群进行高速运算和存储海量数据。 核心:分布式存储系统HDFS(Hadoop Distributed File S 阅读全文
posted @ 2018-09-17 09:43 v-imok 阅读(425) 评论(0) 推荐(0) 编辑