2012年8月17日

Hadoop中文件读写(Java) <转>

摘要: 前言在本文档中,你将了解到如何用Java接口读写Hadoop分布式系统中的文件,以及编码的转换等问题。其中有些细节,在你不知道的时候,是非常容易出错的。 这边读写文件分以下三种情况:1. 在非Map Reduce过程中读写分布式文件系统中的文件比如说,你想自己遍历一个文件,想截断一个文件,都属于这种方式。一般该过程发生在run函数中,程序员处理Map Reduce产生的中间文件上。2. 在map(或reduce)函数中读写一个Record。对于TextInputFormat,一个Record就是一行。我们会得到一个Text对象,作为一行。要注意的是如果读入的文件不是UTF-8 格式(比如GBK 阅读全文

posted @ 2012-08-17 12:30 要么牛逼,要么滚蛋 阅读(3069) 评论(0) 推荐(0) 编辑

C++之四书五经(上) <转>

摘要: C++是一门广泛用于工业软件研发的大型语言。它自身的复杂性和解决现实问题的能力,使其极具学术研究价值和工业价值。和C语言一样,C++已经在许多重要的领域大获成功。然而,一个不可否认的现实是,在低阶程序设计领域,C++挤压着C同时也在承受着C的强烈反弹,而在高阶程序设计领 域,Java和C#正在不断蚕食着C++的地盘。也许C++与C合为一体永远都是一个梦想,也许Java和C#的狂潮终将迫使C++回归本位——回到它有 着根本性优势的开发领域:低级系统程序设计、高级大规模高性能应用设计、嵌入式程序设计以及数值科学计算等。果真如此,我认为这未尝不是一件好事。C++吸引如此之多的智力投入,以至于这个领域 阅读全文

posted @ 2012-08-17 10:18 要么牛逼,要么滚蛋 阅读(208) 评论(0) 推荐(0) 编辑

Java重构示例三

摘要: Java重构示例三关键字:Java 程序设计 重构 示例 原则 优化 技巧 方法序言本文通过Java示例代码片段展示了常用重构原则和技巧,供初级开发人员参考。精致的代码能够清楚传达作者的意图,精致的代码是最好的注释,精致的代码非常容易维护和扩展。程序员阅读精致的代码如同大众欣赏优美的散文一样享受。11 使方法通用化11.1 重构前public DayPart[] sortDayPart() { if (dayParts == null || dayParts.length == 0) { return dayParts; } List<DayPart> dayPartList = 阅读全文

posted @ 2012-08-17 10:01 要么牛逼,要么滚蛋 阅读(490) 评论(0) 推荐(0) 编辑

导航