摘要: 1. 分布式文件系统,即为管理网络中跨多台计算机存储的文件系统。HDFS以流式数据访问模式来存储超大文件,运行于商用硬件集群上。HDFS的构建思路为:一次写入、多次读取是最高效的访问模式。数据集通常由数据源生成或从数据源赋值而来,接着长时间在此数据集上进行各类分析。每次分析都涉及该数据集的大部分数据 阅读全文
posted @ 2017-03-12 23:20 mengrennwpu 阅读(3936) 评论(0) 推荐(1) 编辑