代码改变世界

mymysql与go-mysql-driver性能比较

2013-01-21 09:35  轩脉刃  阅读(12961)  评论(6编辑  收藏  举报

mymysql和go-mysql-driver是两个现在都很流行的go的mysql驱动,这篇文章目的是要将这两个驱动进行一下比较

两个mysql驱动的下载地址:

https://github.com/ziutek/mymysql

http://code.google.com/p/go-mysql-driver/

首先是性能测试

准备工作:

在mysql建表和初始化数据(db是test)

drop table if exists admin;

CREATE TABLE `admin` (
    `adminid` INT(10) UNSIGNED NOT NULL AUTO_INCREMENT,
    `username` varchar(20) NOT NULL DEFAULT '' COMMENT '后台用户名',
    `password` char(32) NOT NULL DEFAULT '' COMMENT '密码,md5存',
    PRIMARY KEY(`adminid`)
)
COMMENT='后台用户信息表'
COLLATE='utf8_general_ci'
ENGINE=InnoDB;

insert into admin set adminid=1, username='admin', password='21232f297a57a5a743894a0e4a801fc3';

 

两边的库代码和测试代码

Image

已经将gomysqldriver和mymysql的代码放到github上了,有兴趣的去里面看看。

https://github.com/jianfengye/MyWorks/tree/master/gomysqltest

代码里面注意的几点就是我们测试了get,insert,update三个操作,并且insert的时候不指定主键,让其自增,innodb的表,这样让mysql处理插入操作尽可能快。

 

下面运行go test -bench=".*" -v -benchmem

mymysql的表现:

Image(1)

go-mysql-driver的表现:

Image(2)

输出的数据分析:

Benchmark的测试用例名   benchtime内调用了多少次  每次调用耗时(纳秒)  每次调用耗内存  每次调用分配内存次数

比如:

mymysql 的Benchmark_getAdmin在1s内一共调用了2000次,每次调用使用了974622纳秒,使用内存大小为13444Byte,分配内存的alloc调用了220次

可以看出,go-mysql-driver的每个命令运行的时间是比mymysql多,但是内存是使用的情况却比mymysql少。

猜测原因由于go-mysql-driver是使用默认的database/sql和database/sql/driver接口,由于接口是官方提供的,估计耗时多在方法匹配上,调用内存方面由于是官方的database/sql来进行连接等分配,写的会比mymysql写的好一些。

下面比较两边的profile

在两个项目下都调用

go test -bench=".*" -c

go test -bench=".*" -cpuprofile="cpu.prof" -memprofile="mem.prof" -blockprofile="block.prof" -memprofilerate=1 -blockprofilerate=1

依次调用

go tool pprof mymysql.test cpu.prof

go tool pprof mymysql.test cpu.prof

go tool pprof mymysql.test cpu.prof

生成svg文件

具体可以参考我之前的一篇文章 go的pprof使用(http://www.cnblogs.com/yjf512/archive/2012/12/27/2835331.html

我这里已经将它们都生成好了并命名为诸如mymysql_cpu.svg放在github上,你也可以直接去下载看

https://github.com/jianfengye/MyWorks/tree/master/gomysqltest

怎么看svg

关于pprof这里有一篇权威文章:cpuprofile(http://google-perftools.googlecode.com/svn/trunk/doc/cpuprofile.html

 

先要明白几个名词

sample

sample就是“取样”。pprof是基于取样调查的,比如我每纳秒取样一次,收集这个时候程序的运行函数栈,知道现在是运行在那个函数中,然后把这些信息放在pprof文件中提供分析。

node

node就是函数调用信息,哪个函数中被调用了,调用了多少次

Image(3)

方法名

本方法占用sample次数(占所有sample的总数)

本方法的下行方法调用次数(占所有sample的比例)

“本方法占用sample的次数”就是除了调用下行的方法之外的其他代码占用的方法数,当然是越小越好,越小说明了除了下行的方法之外的代码几乎不占用cpu时间。node的大小和这个值是正相关的

“下行方法调用次数”就是下行方法的调用中占用了多少个sample。

如果上面两个值相等,那么“下行方法调用次数”就会被被忽略。这个一般只出现在edges中。

比如sweepspan就是下行方法占用37个sample,本身只占用了1个sample。

edges

edges就是终结点

Image(4)

runtime.mcmp就是自身是终结点,没有下行方法,所以下行和本方法占用的sample相等。

基本信息解读

比如:

Image(5)

mymysql.test是可执行文件名

Total samples:总的统计sample(打点数)

Focusing on:关注的sample。为什么有关注sample这么一说呢,并不是说所有的node和edges都是有用的信息,有的不重要的node和edges是会被忽略的。Focusing on samples就是除了这些不重要的node和edges之外的sample。

Dropped nodes:参考Focusing on。被忽略的node。

Dropped edges: 参考Focusing on。被忽略的edges。

ps: 这里默认的total sample是等于focusing sample的。你在pprof的时候可以使用--ignore参数来忽略掉那些不重要的node或者edges

明白了这些就知道了,看图应该从最大的node往小的方向看,分析下占用资源多的函数在那里,是否可以优化这个函数或者方法。

 

比如可以看一下

gomysqldriver_cpu.svg这个例子

它有个比较占用sample的分支是

Image(6)

它的源头在parseDSN

看到代码里面去,会发现是解析dsn这步的时候使用了正则,导致运行Open的时候运行速度下降了。

所以说如果parseDSN这个函数的参数不是dsn string,而是使用map直接指定username,password等,这里的速度就会上去了。当然这其实也是不可以的,因为database/sql/driver的Open方法定义的参数就是一个string。

总结:

pprof图将代码流程完完全全地展现在我们面前。所以说呢我们可以做这么几件事情:

1 根据pprof优化代码

2 根据pprof学习一个完全陌生的开源软件

3 根据pprof学习go的一个程序是怎么运行的

4 项目上线前的性能测试和压力测试(在ab之外的有一个好的选择了)

mymysql和go-mysql-driver的测试总结

根据以上的比较,我还是倾向于使用go-mysql-driver。原因有几个:

1 go-mysql-driver是实现了golang标准库database/sql的产物。底层实现比较有保证

2 go-mysql-driver虽然每个命令的运行时间比mymysql长,但是内存使用少得非常明显,这点两方算打平。

3 go-mysql-driver实现了database/sql,如果数据库换成其他的话,不需要更改应用逻辑的代码。

4 go-mysql-driver实现了database/sql,这个接口的设计也是非常好的,基本和php中的pdo一样,上手和学习成本低。