代码改变世界

【JAVA编码专题】JAVA字符编码系列一:Unicode,GBK,GB2312,UTF-8概念基础

2015-02-10 21:01 by jediael, 139 阅读, 0 推荐, 收藏, 编辑
摘要:这两天抽时间又总结/整理了一下各种编码的实际编码方式,和在Java应用中的使用情况,在这里记录下来以便日后参考。为了构成一个完整的对文字编码的认识和深入把握,以便处理在Java开发过程中遇到的各种问题,特别是乱码问题,我觉得组成一个系列来描述和分析更好一些,包括三篇文章:第一篇:JAVA字符编码系列... 阅读全文

读取Webpage表中的内容

2015-02-10 14:59 by jediael, 193 阅读, 0 推荐, 收藏, 编辑
摘要:nutch将从网页中抓取到的信息放入hbase数据库中,默认情况下表名为$crawlId_webpage,但表中的内容以16进制进行表示,直接scan或者通过Java API进行读取均只能读取到16进制信息。 因此nutch提供了readdb选项进行数据获取,将表中的内容读取到一个文本中。具体用法... 阅读全文

各种排序算法的分析及java实现

2015-02-03 20:09 by jediael, 137 阅读, 0 推荐, 收藏, 编辑
摘要:转载自:http://www.cnblogs.com/liuling/p/2013-7-24-01.html另可参考:http://gengning938.blog.163.com/blog/static/128225381201141121326346/ 排序大的分类可以分为两种:内排序和外排序... 阅读全文

运行一个Hadoop Job所需要指定的属性

2015-02-02 21:33 by jediael, 164 阅读, 0 推荐, 收藏, 编辑
摘要:1、设置job的基础属性Job job = new Job();job.setJarByClass(***.class);job.setJobName(“job name”);job.setNumReduce(2);2、设置Map与Reudce的类job.setMappgerClass(*.clas... 阅读全文

Hbase常见异常

2015-02-02 16:16 by jediael, 239 阅读, 0 推荐, 收藏, 编辑
摘要:1、 HBase is able to connect to ZooKeeper but the connection closes immediatelyhbase(main):001:0> listTABLE ERROR: org.apache.hadoop.hbase.ZooKeeperCon... 阅读全文

Gora官方文档之二:Gora对Map-Reduce的支持

2015-01-31 11:27 by jediael, 140 阅读, 0 推荐, 收藏, 编辑
摘要:参考官方文档:http://gora.apache.org/current/tutorial.html项目代码见:https://code.csdn.net/jediael_lu/mygorademo另环境准备见: http://blog.csdn.net/jediael_lu/article/de... 阅读全文

Linux 系统挂载数据盘

2015-01-30 18:13 by jediael, 219 阅读, 0 推荐, 收藏, 编辑
摘要:适用系统:Linux(Redhat , CentOS,Debian,Ubuntu)* Linux的云服务器数据盘未做分区和格式化,可以根据以下步骤进行分区以及格式化操作。下面的操作将会把数据盘划分为一个分区来使用。1、查看数据盘在没有分区和格式化数据盘之前,使用 “df –h”命令,是无法看到数据盘... 阅读全文

Gora快速入门

2015-01-30 09:55 by jediael, 117 阅读, 0 推荐, 收藏, 编辑
摘要:概述Gora是apache的一个开源项目。The Apache Gora open source framework provides an in-memory data model and persistence for big data. Gora supports persisting to ... 阅读全文

Gora官方范例

2015-01-29 16:14 by jediael, 140 阅读, 0 推荐, 收藏, 编辑
摘要:参考官方文档:http://gora.apache.org/current/tutorial.html项目代码见:https://code.csdn.net/jediael_lu/mygorademo一、环境准备1、下载gora并解压2、分别进入$GORA_HOME/gora-hbase/,$GOR... 阅读全文

在Eclipse中运行Nutch2.3

2015-01-28 16:41 by jediael, 177 阅读, 0 推荐, 收藏, 编辑
摘要:参考http://wiki.apache.org/nutch/RunNutchInEclipse一、环境准备1、下载nutch2.3源代码wget http://mirror.bit.edu.cn/apache/nutch/2.3/apache-nutch-2.3-src.tar.gz或者下载正在开... 阅读全文
上一页 1 2 3 4 5 6 ··· 24 下一页