上一页 1 2 3 4 5 6 ··· 25 下一页
摘要: Mapreduce实例——排序 大 中 小 收起 实验目的 1.准确理解Mapreduce排序的实验原理 2.熟练掌握Mapreduce排序的程序代码编写 3.培养编写MapReduce排序代码解决问题的能力 实验原理 Map、Reduce任务中Shuffle和排序的过程图如下: 流程分析: 1.M 阅读全文
posted @ 2021-11-28 19:22 一口獠牙 阅读(36) 评论(0) 推荐(0) 编辑
摘要: 效果图: EpidemicSituation.py 1 import requests,os 2 import re 3 import xlwt 4 import time 5 import json 6 7 class get_yq_info: 8 9 def get_data_html(self 阅读全文
posted @ 2021-11-27 16:19 一口獠牙 阅读(21) 评论(0) 推荐(0) 编辑
摘要: 第十五周 所花时间(包括上课) 四小时 代码量(行) 700行 博客量(篇) 七 了解到的知识点 这周主要学习了mapreduce 阅读全文
posted @ 2021-11-27 09:10 一口獠牙 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 今天学习了mapreduce 阅读全文
posted @ 2021-11-26 17:13 一口獠牙 阅读(16) 评论(0) 推荐(0) 编辑
摘要: 学习mapreduce 第一个MapReduce程序:WordCount WordCount单词计数是最简单也是最能体现MapReduce思想的程序之一,该程序完整的代码可以在Hadoop安装包的src/examples目录下找到。 WordCount单词计数主要完成的功能是:统计一系列文本文件中每 阅读全文
posted @ 2021-11-25 19:16 一口獠牙 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 数据挖掘过程中,采集的原始数据里存在着各种不利于分析与建模工作的因素,比如数据不完整、数据矛盾、异常值等。这些因素不仅影响建模的执行过程,更有甚者在不知不觉间给出错误的建模结果,这就使得数据清洗显得尤为重要。但是数据清洗并不是数据预处理的全部内容,它只是第一步而已,接下来还有数据集成、数据转换和数据 阅读全文
posted @ 2021-11-24 18:33 一口獠牙 阅读(27) 评论(0) 推荐(0) 编辑
摘要: 现有某电商关于商品点击情况的数据文件,表名为goods_click,包含两个字段(商品分类,商品点击次数),分隔符“\t”,由于数据很大,所以为了方便统计我们只截取它的一部分数据,内容如下: 商品分类 商品点击次数 52127 5 52120 93 52092 93 52132 38 52006 4 阅读全文
posted @ 2021-11-22 18:39 一口獠牙 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 今日进度 11月21日 所花时间(包括上课) 6小时 代码量(行) 100 博客量(篇) 1 了解到的知识点 学习软件设计模式 阅读全文
posted @ 2021-11-21 15:20 一口獠牙 阅读(24) 评论(0) 推荐(0) 编辑
摘要: 今日进度 11月20日 所花时间(包括上课) 1小时 代码量(行) 0 博客量(篇) 1 了解到的知识点 复习软件设计模式 阅读全文
posted @ 2021-11-20 10:21 一口獠牙 阅读(11) 评论(0) 推荐(0) 编辑
摘要: 今日进度 11月19日 所花时间(包括上课) 1小时 代码量(行) 0 博客量(篇) 1 了解到的知识点 复习软件设计 阅读全文
posted @ 2021-11-19 19:48 一口獠牙 阅读(12) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 ··· 25 下一页