摘要:
HADOOP实验-HDFS与MAPREDUCE操作 一、实验目的 1、利用虚拟机搭建集群部署hadoop 2、HDFS文件操作以及文件接口编程; 3、MAPREDUCE并行程序开发、发布与调用。 二、实验内容 1. HDFS文件操作 调用HDFS文件接口实现对分布式文件系统中文件的访问,如创建、修改 阅读全文
摘要:
Mapreduce实例——最高温度排序 实验目的 1.了解Mapreduce排序的实验原理 2.熟练掌握Mapreduce排序的程序代码编写 3.培养编写MapReduce排序代码解决问题的能力 实验原理 Hadoop中Map、Reduce任务中Shuffle和排序的过程图如下: 流程分析: 1.M 阅读全文
摘要:
MapReduce 互联网精准广告推送算法 实验目的 1.了解TF-IDF算法 2.了解关键字权重公式 3.学习使用MapReduce实现互联网精准广告推送算法 实验原理 TF-IDF的主要思想是,如果某个词或短语在一篇文章中出现的频率TF高,并且在其他文章中很少出现,则认为此词或者短语具有很好的类 阅读全文
摘要:
MapReduce实战PageRank算法 实验目的 1.了解PageRank 2.学习MapReduce PageRank算法 实验原理 PageRank:网页排名,右脚网页级别。是以Google 公司创始人Larry Page 之姓来命名。PageRank 计算每一个网页的PageRank值,并 阅读全文
摘要:
MapReduce 社交好友推荐算法 实验目的 1.了解笛卡尔积 2.学习MapReduce 社交好友推荐算法 实验原理 如果A和B具有好友关系,B和C具有好友关系,而A和C却不是好友关系,那么我们称A和C这样的关系为:二度好友关系。 在生活中,二度好友推荐的运用非常广泛,比如某些主流社交产品中都会 阅读全文
摘要:
MapReduce 最优路径算法 实验目的 1.了解Dijkstra算法 2.学习使用mapreduce计算最短路径 实验原理 最优路径算法是无向图中满足通路上所有顶点(除起点、终点外)各异,所有边也各异的的通路。应用在公路运输中,可以提供起点和终点之间的最短路径,节省运输成本。可以大大提高交通运输 阅读全文
摘要:
11.Mapreduce实例——MapReduce自定义输出格式小 实验目的 1.了解Hadoop自带的几种输出格式 2.准确理解MapReduce自定义输出格式的设计原理 3.熟练掌握MapReduce自定义输出格式程序代码编写 4.培养自己编写MapReduce自定义输出格式程序代码解决问题的能 阅读全文
摘要:
10.Mapreduce实例——MapReduce自定义输入格式小 实验目的 1.了解Hadoop自带的几种输入格式 2.准确理解MapReduce自定义输入格式的设计原理 3.熟练掌握MapReduce自定义输入格式程序代码编写 4.培养自己编写MapReduce自定义输入格式程序代码解决实际问题 阅读全文
摘要:
09.Mapreduce实例——ChainMapReduce小 实验目的 1.准确理解ChainMapReduce的设计原理 2.熟练掌握ChainMapReduce的程序代码编写 3.了解ChainMapReduce的使用场景 实验原理 一些复杂的任务难以用一次MapReduce处理完成,需要多次 阅读全文
摘要:
08.Mapreduce实例——倒排索引 实验目的 1.了解倒排索引的使用场景 2.准确理解倒排索引的设计原理 3.熟练掌握MapReduce倒排索引程序代码编写 实验原理 "倒排索引"是文档检索系统中最常用的数据结构,被广泛地应用于全文搜索引擎。它主要是用来存储某个单词(或词组)在一个文档或一组文 阅读全文