摘要: 一、基本排序算法 1. 冒泡排序 假如我们现在按身高升序排队,一种排队的方法是:从第一名开始,让两人相互比身高,若前者高则交换位置,更高的那个在与剩下的人比,这样一趟下来之后最高的人就站到了队尾。接着重复以上过程,直到最矮的人站在了队列首部。我们把队头看作水底,队尾看作水面,那么第一趟比较下来,最高 阅读全文
posted @ 2016-09-04 15:12 IT-驿站 阅读(29080) 评论(2) 推荐(0) 编辑
摘要: Collection接口 Collection是最基本的集合接口,一个Collection代表一组Object,即Collection的元素(Elements)。一些Collection允许相同的元素而另一些不行。一些能排序而另一些不行。Java SDK不提供直接继承自Collection的类,Ja 阅读全文
posted @ 2016-08-30 19:49 IT-驿站 阅读(12230) 评论(0) 推荐(0) 编辑
摘要: 简介 awk是一个强大的文本分析工具,相对于grep的查找,sed的编辑,awk在其对数据分析并生成报告时,显得尤为强大。简单来说awk就是把文件逐行的读入,以空格为默认分隔符将每行切片,切开的部分再进行各种分析处理。 awk有3个不同版本: awk、nawk和gawk,未作特别说明,一般指gawk 阅读全文
posted @ 2016-08-19 09:41 IT-驿站 阅读(339) 评论(0) 推荐(0) 编辑
摘要: 一、Shuffle简介 Shuffle的正常意思是洗牌或弄乱,shuffle的大致范围就是把map task的输出结果有效的传送到Reduce端。也可以这样理解,shuffle描述着数据从map task 输出到reduce task输入的这段过程。 在hadoop这样的集群环境中,大部分map t 阅读全文
posted @ 2016-08-18 21:42 IT-驿站 阅读(275) 评论(0) 推荐(0) 编辑