上一页 1 ··· 23 24 25 26 27
摘要: 一、深度学习带来了什么 (1)强调了数据的抽象 对于我们心目中的智能机器,有抽象的能力是必须的。这也就是“深”与“浅”的差别。深度学习通过多层的神经网络,将事物的表面特征变为更深的、更抽象的特征。 这与浅层学习的代表 支持向量机 相比,可以算是一个突破。最基本支持向量机是基于线性可分的。增加一层核函 阅读全文
posted @ 2018-08-03 20:24 |旧市拾荒| 阅读(268) 评论(0) 推荐(1) 编辑
摘要: 一、实例描述 在这个实例里我们使用简单的数据集,里面包含多条数据,每条数据由姓名、年龄、性别和成绩组成。实例要求是按照如下规则归档用户。 1.找出年龄小于20岁中男生和女生的最大分数 2.找出20岁到50岁男生和女生的最大分数 3.找出50岁以上的男生和女生的最大分数 样例输入: 样例输出: 1.年 阅读全文
posted @ 2018-08-03 11:01 |旧市拾荒| 阅读(456) 评论(0) 推荐(0) 编辑
摘要: 倒排索引是文档检索系统中最常用的数据结构,被广泛地应用于全文搜索引擎。它主要是用来存储某个单词(或词组)在一个文档或一组文档中存储位置的映射,即提供了一种根据内容来查找文档的方式。由于不是根据文档来确定文档所包含的内容,而是进行相反的操作,因而称为倒排索引(Inverted Index)。 一、实例 阅读全文
posted @ 2018-07-24 17:27 |旧市拾荒| 阅读(420) 评论(0) 推荐(0) 编辑
摘要: 一、实例要求 现有一批电话通信清单,记录了用户A拨打某些特殊号码(如120,10086,13800138000等)的记录。需要做一个统计结果,记录拨打给用户B的所有用户A。 二、测试样例 样例输入: file.txt: 13599999999 10086 13899999999 120 139444 阅读全文
posted @ 2018-07-22 17:08 |旧市拾荒| 阅读(490) 评论(0) 推荐(0) 编辑
摘要: 一、实例描述 多表关联和单表关联类似,它也是通过对原始数据进行一定的处理,从其中挖掘出关心的信息。下面进入这个实例。 输入是两个文件,一个代表工厂表,包含工厂名列和地址编号列;另一个代表地址列,包含地址名列和地址编号列。要求从输入数据中找出工厂名和地址名的对应关系,输出工厂名-地址名表。 样例输入: 阅读全文
posted @ 2018-07-21 10:54 |旧市拾荒| 阅读(1129) 评论(0) 推荐(0) 编辑
摘要: 一、相关介绍 Samba是在Linux和UNIX系统上实现SMB协议的一个免费软件,由服务器及客户端程序构成。SMB(Server Messages Block,信息服务块)是一种在局域网上共享文件和打印机的一种通信协议,它为局域网内的不同计算机之间提供文件及打印机等资源的共享服务。SMB协议是客户 阅读全文
posted @ 2018-07-20 10:57 |旧市拾荒| 阅读(497) 评论(0) 推荐(0) 编辑
摘要: 前面的实例都是在数据上进行一些简单的处理,为进一步的操作打基础。单表关联这个实例要求从给出的数据中寻找到所关心的数据,它是对原始数据所包含信息的挖掘。下面进入这个实例。 1.实例描述 实例中给出child-parent表,要求输出grandchild-grandparent表。 样例输入: file 阅读全文
posted @ 2018-07-18 19:42 |旧市拾荒| 阅读(755) 评论(0) 推荐(0) 编辑
摘要: 数据排序是许多实际任务在执行时要完成的第一项工作,比如学生成绩评比、数据建立索引等。这个实例和数据去重类似,都是先对原始数据进行初步处理,为进一步的数据操作打好基础。 1.实例描述 对输入文件中的数据进行排序。输入文件中的每行内容均为一个数字,即一个数据。要求在输出中每行有两个间隔的数字,其中,第二 阅读全文
posted @ 2018-07-17 11:02 |旧市拾荒| 阅读(915) 评论(0) 推荐(0) 编辑
摘要: 数据去重这个实例主要是为了读者掌握并利用并行化思想对数据进行有意义的筛选。统计大数据集上的数据种类个数、从网站日志中计算访问等这些看似庞杂的任务都会涉及数据去重。下面就进入这个实例的MapReduce程序设计。 1.实例描述 对数据文件中的数据进行去重。数据文件中的每行都是一个数据。 样例输入: f 阅读全文
posted @ 2018-07-15 20:22 |旧市拾荒| 阅读(794) 评论(0) 推荐(0) 编辑
摘要: 1.实例描述 通过一个计算学生平均成绩的例子来讲解开发MapReduce程序的流程。输入文件都是纯文本文件,输入文件中的每行内容均为一个学生的姓名和他相应的成绩,如果有多门学科,则每门学科为一个文件。输出文件每行包含学生的姓名和平均成绩。下面给出样本输入文件,以及跑MapReduce程序过后的输出文 阅读全文
posted @ 2018-07-15 15:33 |旧市拾荒| 阅读(1578) 评论(0) 推荐(0) 编辑
摘要: MapReduce 计算模型的优化涉及了方方面面的内容,但是主要集中在两个方面:一是计算性能方面的优化:二是I/O操作方面的优化。这其中,又包含六个方面的内容。 1.任务调度 任务调度是Hadoop中非常重要的一环,这个优化又涉及两个方面的内容。计算方面,Hadoop总会优先将任务分配给空闲的机器, 阅读全文
posted @ 2018-07-14 16:42 |旧市拾荒| 阅读(214) 评论(0) 推荐(0) 编辑
摘要: 刚开始在win7系统,在dos界面下做MySQL的实验,很多数据不能显示界面上,只能显示固定的大小,以为这是系统的原因,后来在网上查找了一些资料。终于发现可以自由调节dos界面大小的方法。下面给出截图。 先进入Dos界面,右键标题栏,选中属性选项。得到如下界面 改动屏幕缓冲区的宽度和高度,比如我的电 阅读全文
posted @ 2017-11-23 15:23 |旧市拾荒| 阅读(1586) 评论(0) 推荐(0) 编辑
上一页 1 ··· 23 24 25 26 27