YCSB 对HBase 性能测试
我认真的在想,关在牢里面的人,不一定比放在外面的人坏。 -- 三毛
这篇文章放草稿箱快两个多月了,今天突然被告知,要换方向,看了近三个月的HBase就这样别了,很突然。
刚开始装上HBase系统,再还没什么应用的情况下,就不知拿着它干嘛,好吧,测试一下。
HBase的版本是:0.90.5 Hadoop的版本是:1.0.0,分布式部署,一共四个节点。
测试工具是:YCSB,yahoo cloud system benchmark。专用于对各种分布式数据库测试的工具。可以在这个网站上下载:https://github.com/brianfrankcooper/YCSB, 个人理解,YCSB更多的是用来测试不同分布式数据库的,如cassandra,hypertable,HBase,考察不同数据库的相关性能。
下载测试工具之后,我使用的版本是:ycsb-0.1.4
1 tar xfvz ycsb-0.1.4 2 cd ycsb-0.1.4
开始配置测试环境:
将hbase中的jar包拷贝到hbase-binding/lib文件夹下,将hbase中的/conf/hbase-site.xml拷贝到/hbase-binding/conf下。在hbase中创建指定的表:usertable。测试默认的是要操作这样的一张表,需要这样的列族,不一定是三个。
1 create 'usertable','f1','f2','f3'
测试过程分为两个阶段,首先是加载数据,其次是执行事务。
加载数据,进入ycsb的bin目录,开始输入命令:
1 ./ycsb load hbase -P ../workloads/workloada -p threads=10 -p columnfamily=f1 -p recordcount=10000 -s > load.dat
命令分析:load:表明为加载数据测试。
-P:指定配置文件
workloads/workloada: 为配置文件。This workload has a mix of 50/50 reads and writes
-p:参数
threads:the number of client threads
加载完数据后,显示的部分结果如下:
1 [OVERALL], RunTime(ms), 2295.0 2 [OVERALL], Throughput(ops/sec), 4357.298474945534 3 [INSERT], Operations, 10000 4 [INSERT], AverageLatency(us), 198.2618 5 [INSERT], MinLatency(us), 9 6 [INSERT], MaxLatency(us), 788883 7 [INSERT], 95thPercentileLatency(ms), 0 8 [INSERT], 99thPercentileLatency(ms), 0 9 [INSERT], Return=0, 10000
加载完数据之后,开始执行事物,主要有read 和 update操作。执行命令如下:
./ycsb run hbase -P ../workloads/workloada -threads 10 -p measurementtype=timeseries -p
columnfamily=f1 -p timeseries.granularity=2000 > transactions.dat
命令的具体含义跟上条大体一致,可以自己参考网站的文档,合理的配置。
命令执行完,显示的部分结果:
1 [OVERALL], RunTime(ms), 541.0 2 [OVERALL], Throughput(ops/sec), 1848.4288354898335 3 [UPDATE], Operations, 502 4 [UPDATE], AverageLatency(us), 4569.788844621514 5 [UPDATE], MinLatency(us), 56 6 [UPDATE], MaxLatency(us), 373970 7 [UPDATE], Return=0, 502 8 [UPDATE], 0, 4569.788844621514 9 [READ], Operations, 498 10 [READ], AverageLatency(us), 4618.516064257028 11 [READ], MinLatency(us), 742 12 [READ], MaxLatency(us), 379287 13 [READ], Return=0, 498 14 [READ], 0, 4618.516064257028
这样,大概的一个测试过程就完成了,这只是简单的按照ycsb的文档使用了下ycsb工具,我觉的最关键的是从使用ycsb测试之后,得到的数据中进行合理的分析,去了解HBase这个系统。