神话小小哥

2016年12月25日

Spark任务流程笔记

摘要： Spark学习笔记2——Spark RDD的依赖，DAG图，任务执行流程图阅读全文

posted @ 2016-12-25 15:42 神话小小哥阅读(290) 评论(0) 推荐(0)

2016年12月10日

Hadoop_FileInputFormat分片

摘要： Hadoop学习笔记总结系列5——获取分片信息介绍，以及为何Hadoop不适合处理小文件阅读全文

posted @ 2016-12-10 11:55 神话小小哥阅读(1772) 评论(0) 推荐(0)

2016年12月7日

Hadoop_MapReduce流程

摘要： Hadoop学习笔记总结系列4——MapReduce任务调度过程，以及分区、排序、规约、分组过程的总结。阅读全文

posted @ 2016-12-07 23:46 神话小小哥阅读(2759) 评论(0) 推荐(0)

2016年12月6日

[转载]Hadoop 2.X 日志文件和MapReduce的log文件研究心得

摘要：之前一直不清楚MapReduce阶段System.out打印到哪儿去了。现在知道了，任务分发了节点后，是无法再客户端窗口查看的。要想查看，需要打开默认关闭的JobHistoryServer进程。存放在每个节点的Hadoop安装目录/logs/userlogs/…在Web UI中也能查看。下面是转载的阅读全文

posted @ 2016-12-06 15:20 神话小小哥阅读(2400) 评论(0) 推荐(0)

2016年12月5日

Hadoop_YARN框架

摘要： Hadoop学习笔记总结系列3——YARN框架介绍，任务详细调度分配流程。阅读全文

posted @ 2016-12-05 23:26 神话小小哥阅读(9991) 评论(0) 推荐(0)

2016年12月4日

Hadoop_HDFS文件读写代码流程解析和副本存放机制

摘要： Hadoop学习笔记总结系列2——HDFS文件剖析文件读取和写入流程解析，源码分析；副本存放机制。阅读全文

posted @ 2016-12-04 20:55 神话小小哥阅读(2128) 评论(0) 推荐(0)

2016年10月2日

Hadoop_HDFS架构和HA机制

摘要： Hadoop学习笔记总结系列1——HDFS架构以及HA 阅读全文

posted @ 2016-10-02 11:13 神话小小哥阅读(486) 评论(0) 推荐(0)

2014年4月21日

3D俄罗斯方块设计

摘要：发布在博客：http://blog.sina.com.cn/s/blog_d38e811c0101cpis.html 阅读全文

posted @ 2014-04-21 22:15 神话小小哥阅读(206) 评论(0) 推荐(0)

2014年3月16日

统计文本中单词出现的频率

摘要：需求：写一个程序，分析一个文本文件中各个词出现的频率，并且把频率最高的10个词打印出来。文本文件大约是30KB~300KB大小。1.思路①数据结构：Word类封装单词String和频率count，并重写equals方法，以key(String)相同则认为Word对象相同。先从dictionary.txt一行一行读取字符串，使用正则表达式过滤出单词并存放在ArrayList中，遍历list,将每个string都封装成Word放入一个WordList中；再使用Collections工具类的sort()方法添加一个按照count值的comparator进行排序。2.分析使用YourKit Java 阅读全文

posted @ 2014-03-16 20:38 神话小小哥阅读(1129) 评论(0) 推荐(0)

2014年3月13日

二叉查找树的懒惰删除(lazy deletion)

摘要：第四章习题：二叉查找树类实现懒惰删除，注意findMin()和findMax()（递归）算是发布的第一篇学习笔记。也不敢保证写的代码一定正确，错了的地方请大家指正，谢谢。直接开始吧。先谈谈数据结构，二叉查找树懒惰删除较于一般的二叉查找树，多了一些域：theSize(剩下的节点数)、deletedSize(懒惰删除的节点数)、BinaryNode min，max(用于保留在findMin和findMax方法中递归查询到的flag!=1的最值点)；在内部节点类中，多了一个byte型的flag变量（=1则表示被删除）。在这里，也可以使用一个count域，这在有重复项时很常用，初始的co... 阅读全文

posted @ 2014-03-13 12:52 神话小小哥阅读(3568) 评论(0) 推荐(0)

公告