摘要: 1)处理超大文件 这里的超大文件通常是指百MB、设置数百TB大小的文件。目前在实际应用中,HDFS已经能用来存储管理PB级的数据了。 2)流式的访问数据 HDFS的设计建立在更多地响应"一次写入、多次读写"任务的基础上。这意味着一个数据集一旦由数据源生成,就会被复制分发到不同的存储节点中,然后响应各 阅读全文
posted @ 2020-05-06 12:18 我为编程上架构 阅读(702) 评论(0) 推荐(0) 编辑