摘要: 1.概念 1.1什么是hadoop? hadoop 是大数据存储和处理的框架,主要组成为文件存储系统hdfs和分布式计算框架mapreduce。 1.2能做什么,擅长做什么,不擅长做什么? 1.2.1能做什么,如何做? hadoop 支持处理TB,PB级别的文件。举个栗子:如100M的文件,过滤出含 阅读全文
posted @ 2018-06-09 15:52 江南的夏天 阅读(262) 评论(0) 推荐(0) 编辑