摘要: 1,分布式单词计数的流程首先要有数据源,在SentenceSpout中定义了一个字符串数组sentences来模拟数据源。字符串数组中的每句话作为一个tuple发射。其实,SplitBolt接收SentenceSpout发射的tuple,它将每句话分割成每个单词,并将每个单词作为tuple发射。再次... 阅读全文
posted @ 2015-06-19 13:38 大熊猫同学 阅读(2363) 评论(0) 推荐(0) 编辑
摘要: 首先参考文章:http://www.oschina.net/translate/working-with-hashcode-and-equals-methods-in-java1,equals方法的比较与 == 的区别是什么?为什么需要重写equals方法?2,为什么说重写了equals方法最好重写... 阅读全文
posted @ 2015-06-17 22:33 大熊猫同学 阅读(1802) 评论(0) 推荐(0) 编辑
摘要: 一,思路1,词典实现类ArrayDictionary.java肯定要implements 词典的接口DictionaryInterface.java(参考:http://www.cnblogs.com/hapjin/p/4573826.html)。其次,为了序列化,还要implements Seri... 阅读全文
posted @ 2015-06-16 22:58 大熊猫同学 阅读(883) 评论(0) 推荐(1) 编辑
摘要: 一,理解开发环境与生产环境。比如,在windows或mac下设计好流程之后,把该设计文件上传到linux集群的机器上执行。那么,在windows下进行的工作即为开发环境,任务具体在linxu机器上执行即为生产环境。二,Kettle转换转换包括一个或多个步骤,步骤之间通过跳(hop)来连接。跳定义了一... 阅读全文
posted @ 2015-06-15 17:22 大熊猫同学 阅读(7024) 评论(0) 推荐(0) 编辑
摘要: 学习HashMap的底层实现机制 阅读全文
posted @ 2015-06-13 17:44 大熊猫同学 阅读(2090) 评论(0) 推荐(0) 编辑
摘要: 1,本程序实现了线性表的链式存储结构。实现的链表带有两个指针,一个始终指向链表中的第一个结点,另一个指针始终指向链表中的最后一个结点。 之所以设置尾指针,是因为,在插入元素到链表中的末尾时,可以通过尾指针直接找到链表的最后一个元素,从而不需要遍历链表就可以完成插入操作。 2,具体实现链表的类名为LL 阅读全文
posted @ 2015-06-03 17:00 大熊猫同学 阅读(989) 评论(0) 推荐(0) 编辑
摘要: 本程序采用JAVA语言实现了线性表的链式实现。首先定义了线性表的接口ListInterface,然后LList类实现了ListInterface完成了链表的实现。本实现中,链表是不带表头结点的,且有一个指针始终指向链表中的第一个元素,并没有定义尾指针。因此,每次向链表中插入新结点时需要遍历链表一次。... 阅读全文
posted @ 2015-06-03 16:29 大熊猫同学 阅读(2997) 评论(0) 推荐(0) 编辑
摘要: 1,迭代器是能够对数据结构如集合(ADT的实现)进行遍历的对象。在遍历过程中,可以查看、修改、添加以及删除元素,这是它与一般的采用循环来遍历集合中的元素不同的地方。因为,通常用循环进行的遍历操作一般是逐个输出元素,而用迭代器不仅仅只是查看元素,还可以改变元素(若迭代器支持remove())。2,在J... 阅读全文
posted @ 2015-06-03 15:08 大熊猫同学 阅读(1076) 评论(0) 推荐(0) 编辑
摘要: 一,Loading Balance 问题描述:有 m 台相同的机器及 n 个作业,其中 m={M(1),M(2),……M(m)}、n = {J(1),J(2),……J(n)}。每个作业都有一个处理时间,记为t。如,;t(j)表示作业 J(j) 的处理时间。任意机器在某个时刻只能处理一个作业;一旦某个 阅读全文
posted @ 2015-06-02 17:48 大熊猫同学 阅读(2520) 评论(0) 推荐(0) 编辑
摘要: 一,旅行商问题与H回路的联系(H回路 定义为 哈密尔顿回路)旅行商问题是希望售货员恰好访问每个城市一次,最终回到起始城市所用的费用最低,也即判断图中是否存在一个费用至多为K的回路。(K相当于图中顶点的个数)由于售货员可以从某个城市到其他任何一个城市。因此,该问题对应的是一个完全图(设为G′)。而关于... 阅读全文
posted @ 2015-05-30 16:52 大熊猫同学 阅读(8456) 评论(0) 推荐(0) 编辑