摘要:
二叉树的前序、中序、后序遍历的定义:前序遍历:对任一子树,先访问跟,然后遍历其左子树,最后遍历其右子树;中序遍历:对任一子树,先遍历其左子树,然后访问根,最后遍历其右子树;后序遍历:对任一子树,先遍历其左子树,然... 阅读全文
2013年5月15日
摘要:
集合是编程中最常用的数据结构。而谈到并发,几乎总是离不开集合这类高级数据结构的支持。比如两个线程需要同时访问一个中间临界区(Queue),比如常会用缓存作为外部文件的副本(HashMap)。这篇文章主要分析jdk... 阅读全文
摘要:
ConcurrentHashMap是Java 5中支持高并发、高吞吐量的线程安全HashMap实现。在这之前我对ConcurrentHashMap只有一些肤浅的理解,仅知道它采用了多个锁,大概也足够了。但是在经过... 阅读全文
摘要:
--行转列问题--建立测试环境Create Table TEST(DATES Varchar(6), EMPNO Varchar(5), STYPE Varchar(1), AMOUNT Int)--插入数据In... 阅读全文
2013年5月14日
摘要:
成堆的数据如何变成信息金矿Andrew Glover, 作家和开发人员, Beacon50简介: Apache Hadoop 是目前分析分布式数据的首选工具,和大多数 Java™ 2.0 技术一样,是可扩展的。从... 阅读全文
急性子的开源大数据,第 1 部分: Hadoop 教程:Hello World 与 Java、Pig、Hive、Flume、Fuse、Oozie,以及 Sqoop 与 Informix、DB2 和
摘要:
如何开始使用 Hadoop 和自己喜欢的数据库Marty Lurie, 系统工程师, IBM简介: 本文的重点是解释大数据,然后在 Hadoop 中提供简单的工作示例,Hadoop 是在大数据领域的主要开源选手。... 阅读全文
摘要:
1. 大数据大数据 是指变得过大而无法通过传统方法操纵的数据集。这些方法包括在可承受的时间内对数据进行捕获、存储和处理。虽然术语大数据 曾被用作数据仓库概念,但它现在只专注于处理的容量、吞吐量和通用性的大规模处理... 阅读全文
摘要:
使用典型 Linux 系统上的 Hadoop 从日志中提取有用数据M. Tim Jones, 独立作家, 顾问简介: 日志是任何计算系统中一个必不可少的部分,支持从审计到错误管理等功能。随着日志的发展和日志来源数... 阅读全文
摘要:
http://blog.csdn.net/sunboy_2050/article/details/6252552 如果安装了JDK,会发同你的电脑有两套JRE,一套位于 /jre 另外一套位于 C:/Progra... 阅读全文
摘要:
1.wordcount的代码如下public class WordCount{ public static class TokenizerMapper extends Mapper { ... 阅读全文