摘要: Hadoop Apache™Hadoop®项目是为可靠的、可扩展的分布式计算而开发的一套开源软件。 Hadoop软件库是一个框架,该框架允许使用简单的编程模型跨计算机集群对大规模数据集进行分布式处理。 Hadoop旨在从单个服务器扩展到数千台机器,每台机器都提供本地计算和存储。 Hadoop框架本身 阅读全文
posted @ 2021-09-08 21:54 土博姜山山 阅读(442) 评论(0) 推荐(0) 编辑
摘要: 1 import java.io.IOException; 2 import org.apache.hadoop.conf.Configuration; 3 import org.apache.hadoop.fs.Path; 4 import org.apache.hadoop.io.IntWrit 阅读全文
posted @ 2021-09-08 21:41 土博姜山山 阅读(208) 评论(0) 推荐(0) 编辑
摘要: 1 package mapred; 2 3 import java.io.IOException; 4 import java.util.StringTokenizer; 5 6 import org.apache.hadoop.conf.Configuration; 7 import org.ap 阅读全文
posted @ 2021-09-08 21:34 土博姜山山 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 1 package mapred; 2 3 import java.io.IOException; 4 import java.util.StringTokenizer; 5 import org.apache.hadoop.conf.Configuration; 6 7 import org.ap 阅读全文
posted @ 2021-09-08 21:34 土博姜山山 阅读(94) 评论(0) 推荐(0) 编辑
摘要: 1 package mapred; 2 3 import org.apache.hadoop.io.ArrayWritable; 4 import org.apache.hadoop.io.IntWritable; 5 import org.apache.hadoop.io.MapWritable; 阅读全文
posted @ 2021-09-08 21:32 土博姜山山 阅读(57) 评论(0) 推荐(0) 编辑
摘要: 1 package hdfs; 2 3 import java.net.URI; 4 5 import org.apache.hadoop.conf.Configuration; 6 import org.apache.hadoop.fs.BlockLocation; 7 import org.ap 阅读全文
posted @ 2021-09-08 21:30 土博姜山山 阅读(60) 评论(0) 推荐(0) 编辑