摘要: 一:取出字符串中的汉字(只保留汉字)的正则表达式: Stringstr="sa汉字e3中国人r#|c";System.out.println(str.replaceAll("[^\u4E00-\u9FA5]",""));二:去除掉字符串中所有的字母(包括大写字母和小写字母) Stringstr="s... 阅读全文
posted @ 2014-05-29 09:47 heart.. 阅读(637) 评论(0) 推荐(0) 编辑
摘要: 本文主要是从HBase应用程序设计与开发的角度,总结几种常用的性能优化方法。有关HBase系统配置级别的优化,可参考:淘宝Ken Wu同学的博客。下面是本文总结的第一部分内容:表的设计相关的优化方法。1. 表的设计1.1 Pre-Creating Regions默认情况下,在创建HBase表的时候会... 阅读全文
posted @ 2014-05-26 10:26 heart.. 阅读(1071) 评论(0) 推荐(0) 编辑
摘要: 1、DOM4J简介 DOM4J是 dom4j.org 出品的一个开源 XML 解析包。DOM4J应用于 Java 平台,采用了 Java 集合框架并完全支持 DOM,SAX 和JAXP。 DOM4J使用起来非常简单。只要你了解基本的 XML-DOM 模型,就能使用。 Dom:把整个文档作为一个对象。... 阅读全文
posted @ 2014-05-19 15:06 heart.. 阅读(242) 评论(0) 推荐(0) 编辑
摘要: 1.由于用户是普通用户,没有root一些权限,所以修改hadoop用户权限用root权限,修改sudoers文件nano /etc/sudoers 打开文件,修改hadoop用户权限,如果你创建的是one用户,就one ALL=(ALL:ALL) ALL2.su hadoop :走到hadoop用户... 阅读全文
posted @ 2014-05-07 09:41 heart.. 阅读(449) 评论(0) 推荐(0) 编辑
摘要: 一、Windows平台 在windows命令行窗口下执行: 1.查看所有的端口占用情况C:\>netstat -ano 协议 本地地址 外部地址 状态PIDTCP 127.0.0.1:1434 0.0.0.0:0 LISTENING 3236TCP 127.0.0.1:5679 0.0.0.0:0... 阅读全文
posted @ 2014-04-16 17:23 heart.. 阅读(300) 评论(0) 推荐(0) 编辑
摘要: Nagios是常用的系统监控工具,提供了很多基本服务的监控脚本,如HTTP,MYSQL等,同时具有不错的可扩展性,自己可定制针对特定参数的监控脚本以及报警的方式.我现在有三台机器:192.168.0.26 namenode2 主机192.168.0.27 datanode1 从机192.168.0.28 datanode2 从机一.在机子上面安装nagios1.先在主机上安装apache2 nagios3 nagios-nrpe-plugin这三个,apahce2有的话就不用安装了sudoapt-getinstallapache2 nagios3 nagios-nrpe-plugin在装的过程 阅读全文
posted @ 2014-04-09 13:09 heart.. 阅读(846) 评论(0) 推荐(0) 编辑
摘要: 背景 分布式的集群通常包含非常多的机器,由于受到机架槽位和交换机网口的限制,通常大型的分布式集群都会跨好几个机架,由多个机架上的机器共同组成一个分布式集群。机架内的机器之间的网络速度通常都会高于跨机架机器之间的网络速度,并且机架之间机器的网络通信通常受到上层交换机间网络带宽的限制。 具体到Hadoop集群,由于hadoop的HDFS对数据文件的分布式存放是按照分块block存储,每个block会有多个副本(默认为3),并且为了数据的安全和高效,所以hadoop默认对3个副本的存放策略为:第一个block副本放在和client所在的node里(如果client不在集群范围内,则这第一个node是 阅读全文
posted @ 2014-04-03 16:01 heart.. 阅读(395) 评论(0) 推荐(0) 编辑
摘要: 1 Ganglia简介 Ganglia 是 UC Berkeley 发起的一个开源监视项目,设计用于测量数以千计的节点。每台计算机都运行一个收集和发送度量数据(如处理器速度、内存使用量等)的名为 gmond 的守护进程。它将从操作系统和指定主机中收集。接收所有度量数据的主机可以显示这些数据并且可以将这些数据的精简表单传递到层次结构中。正因为有这种层次结构模式,才使得 Ganglia 可以实现良好的扩展。gmond 带来的系统负载非常少,这使得它成为在集群中各台计算机上运行的一段代码,而不会影响用户性能。1.1 Ganglia组件 Ganglia 监控套件包括三个主要部分:gmond,gme.. 阅读全文
posted @ 2014-04-01 16:16 heart.. 阅读(1070) 评论(2) 推荐(1) 编辑
摘要: HDFS的体系架构整个Hadoop的体系结构主要是通过HDFS来实现对分布式存储的底层支持,并通过MR来实现对分布式并行任务处理的程序支持。HDFS采用主从(Master/Slave)结构模型,一个HDFS集群是由一个NameNode和若干个DataNode组成的(在最新的Hadoop2.2版本已经实现多个NameNode的配置-这也是一些大公司通过修改hadoop源代码实现的功能,在最新的版本中就已经实现了)。NameNode作为主服务器,管理文件系统命名空间和客户端对文件的访问操作。DataNode管理存储的数据。HDFS支持文件形式的数据。从内部来看,文件被分成若干个数据块,这若干个数据 阅读全文
posted @ 2014-03-27 15:08 heart.. 阅读(561) 评论(0) 推荐(0) 编辑
摘要: hbase.rootdir:这个目录是region server的共享目录,用来持久化Hbase。URL需要是'完全正确'的,还要包含文件系统的scheme。例如,要表示hdfs中的 '/hbase'目录,namenode 运行在namenode.example.org的9090端口。则需要设置为h... 阅读全文
posted @ 2014-03-05 15:37 heart.. 阅读(10283) 评论(0) 推荐(0) 编辑