MyBatis原理深入解析(二)
8 MyBatis
数据源与连接池
8.1 MyBatis
数据源DataSource
分类
MyBatis
把数据源DataSource
分为三种:
UNPOOLED
不使用连接池的数据源
POOLED
使用连接池的数据源
JNDI
使用JNDI实现的数据源
相应地,MyBatis
内部分别定义了实现了java.sql.DataSource
接口的UnpooledDataSource
,PooledDataSource
类来表示UNPOOLED
、POOLED
类型的数据源。 如下图所示:
对于JNDI
类型的数据源DataSource
,则是通过JNDI
上下文中取值。
8.2 数据源DataSource
的创建过程
MyBatis
数据源DataSource
对象的创建发生在MyBatis
初始化的过程中。下面让我们一步步地了解MyBatis
是如何创建数据源DataSource
的。
在Mybatis
的XML
配置文件中,使用<dataSource>
元素来配置数据源:
1. MyBatis
在初始化时,解析此文件,根据<dataSource>
的type
属性来创建相应类型的的数据源DataSource
,即:
1
|
type=”POOLED” :MyBatis会创建PooledDataSource实例
|
2. 顺便说一下,MyBatis
是通过工厂模式来创建数据源DataSource
对象的,MyBatis
定义了抽象的工厂接口:org.apache.ibatis.datasource.DataSourceFactory
,通过其getDataSource()
方法返回数据源DataSource
:
1
|
public interface DataSourceFactory {
|
上述三种不同类型的type
,则有对应的以下dataSource
工厂:
POOLED
:PooledDataSourceFactory
UNPOOLED
:UnpooledDataSourceFactory
JNDI
:JndiDataSourceFactory
3. MyBatis
创建了DataSource
实例后,会将其放到Configuration
对象内的Environment
对象中,供以后使用。
8.3 DataSource
什么时候创建Connection
对象
当我们需要创建SqlSession
对象并需要执行SQL
语句时,这时候MyBatis
才会去调用dataSource
对象来创建java.sql.Connection
对象。也就是说,java.sql.Connection
对象的创建一直延迟到执行SQL
语句的时候。
比如,我们有如下方法执行一个简单的SQL
语句:
1
|
String resource = "mybatis-config.xml";
|
前4句都不会导致java.sql.Connection
对象的创建,只有当第5句sqlSession.selectList("SELECT * FROM STUDENTS")
,才会触发MyBatis
在底层执行下面这个方法来创建java.sql.Connection
对象:
1
|
protected void openConnection() throws SQLException {
|
8.4 不使用连接池的UnpooledDataSource
当<dataSource>
的type
属性被配置成了UNPOOLED
,MyBatis
首先会实例化一个UnpooledDataSourceFactory
工厂实例,然后通过getDataSource()
方法返回一个UnpooledDataSource
实例对象引用,我们假定为dataSource
。
使用UnpooledDataSource
的getConnection()
,每调用一次就会产生一个新的Connection
实例对象。
UnPooledDataSource
的getConnection()
方法实现如下:
1
|
/*
|
如上代码所示,UnpooledDataSource
会做以下事情:
初始化驱动:判断
driver
驱动是否已经加载到内存中,如果还没有加载,则会动态地加载driver
类,并实例化一个Driver
对象,使用DriverManager.registerDriver()
方法将其注册到内存中,以供后续使用。创建
Connection
对象:使用DriverManager.getConnection()
方法创建连接。配置
Connection
对象:设置是否自动提交autoCommit
和隔离级别isolationLevel
。返回
Connection
对象。
总结:从上述的代码中可以看到,我们每调用一次getConnection()
方法,都会通过DriverManager.getConnection()
返回新的java.sql.Connection
实例。
8.5 为什么要使用连接池?
1. 创建一个java.sql.Connection
实例对象的代价
首先让我们来看一下创建一个java.sql.Connection
对象的资源消耗。我们通过连接Oracle
数据库,创建创建Connection
对象,来看创建一个Connection
对象、执行SQL
语句各消耗多长时间。代码如下:
1
|
public static void main(String[] args) throws Exception
|
从此结果可以清楚地看出,创建一个Connection
对象,用了250
毫秒;而执行SQL
的时间用了170
毫秒。
创建一个Connection
对象用了250
毫秒!这个时间对计算机来说可以说是一个非常奢侈的!
这仅仅是一个Connection
对象就有这么大的代价,设想一下另外一种情况:如果我们在Web
应用程序中,为用户的每一个请求就操作一次数据库,当有10000
个在线用户并发操作的话,对计算机而言,仅仅创建Connection
对象不包括做业务的时间就要损耗10000 × 250ms = 250 0000ms = 2500s = 41.6667min
,竟然要41
分钟!!!如果对高用户群体使用这样的系统,简直就是开玩笑!
2. 问题分析:
创建一个java.sql.Connection
对象的代价是如此巨大,是因为创建一个Connection
对象的过程,在底层就相当于和数据库建立的通信连接,在建立通信连接的过程,消耗了这么多的时间,而往往我们建立连接后(即创建Connection
对象后),就执行一个简单的SQL
语句,然后就要抛弃掉,这是一个非常大的资源浪费!
3. 解决方案:
对于需要频繁地跟数据库交互的应用程序,可以在创建了
Connection
对象,并操作完数据库后,可以不释放掉资源,而是将它放到内存中,当下次需要操作数据库时,可以直接从内存中取出Connection
对象,不需要再创建了,这样就极大地节省了创建Connection
对象的资源消耗。由于内存也是有限和宝贵的,这又对我们对内存中的Connection
对象怎么有效地维护提出了很高的要求。我们将在内存中存放Connection
对象的容器称之为连接池(Connection Pool
)。下面让我们来看一下MyBatis
的连接池是怎样实现的。
8.6 使用了连接池的PooledDataSource
同样地,我们也是使用PooledDataSource
的getConnection()
方法来返回Connection
对象。现在让我们看一下它的基本原理:
PooledDataSource
将java.sql.Connection
对象包裹成PooledConnection
对象放到了PoolState
类型的容器中维护。
MyBatis将连接池中的PooledConnection
分为两种状态:空闲状态(idle
)和活动状态(active
),这两种状态的PooledConnection
对象分别被存储到PoolState
容器内的idleConnections
和activeConnections
两个List
集合中:
idleConnections
:空闲(idle
)状态PooledConnection
对象被放置到此集合中,表示当前闲置的没有被使用的PooledConnection
集合,调用PooledDataSource
的getConnection()
方法时,会优先从此集合中取PooledConnection
对象。当用完一个java.sql.Connection
对象时,MyBatis
会将其包裹成PooledConnection
对象放到此集合中。
activeConnections
:活动(active
)状态的PooledConnection
对象被放置到名为activeConnections
的ArrayList
中,表示当前正在被使用的PooledConnection
集合,调用PooledDataSource
的getConnection()
方法时,会优先从idleConnections
集合中取PooledConnection
对象,如果没有,则看此集合是否已满,如果未满,PooledDataSource
会创建出一个PooledConnection
,添加到此集合中,并返回。
1. 获取java.sql.Connection
对象的过程
下面让我们看一下PooledDataSource
的getConnection()
方法获取Connection
对象的实现:
1
|
public Connection getConnection() throws SQLException {
|
上述的popConnection()
方法,会从连接池中返回一个可用的PooledConnection
对象,然后再调用getProxyConnection()
方法最终返回Conection
对象。(至于为什么会有getProxyConnection()
,请关注下一节)。
现在让我们看一下popConnection()
方法到底做了什么:
- 先看是否有空闲(
idle
)状态下的PooledConnection
对象,如果有,就直接返回一个可用的PooledConnection
对象;否则进行第2步。- 查看活动状态的
PooledConnection
池activeConnections
是否已满;如果没有满,则创建一个新的PooledConnection
对象,然后放到activeConnections
池中,然后返回此PooledConnection
对象;否则进行第三步;- 看最先进入
activeConnections
池中的PooledConnection
对象是否已经过期:如果已经过期,从activeConnections
池中移除此对象,然后创建一个新的PooledConnection
对象,添加到activeConnections
中,然后将此对象返回;否则进行第4步。- 线程等待,循环2步
1
|
/*
|
如上所示,对于
PooledDataSource
的getConnection()
方法内,先是调用类PooledDataSource
的popConnection()
方法返回了一个PooledConnection
对象,然后调用了PooledConnection
的getProxyConnection()
来返回Connection
对象。
2. java.sql.Connection
对象的回收
当我们的程序中使用完Connection
对象时,如果不使用数据库连接池,我们一般会调用connection.close()
方法,关闭connection
连接,释放资源。如下所示:
1
|
private void test() throws ClassNotFoundException, SQLException
|
调用过close()
方法的Connection
对象所持有的资源会被全部释放掉,Connection
对象也就不能再使用。
那么,如果我们使用了连接池,我们在用完了Connection
对象时,需要将它放在连接池中,该怎样做呢?
为了和一般的使用Conneciton
对象的方式保持一致,我们希望当Connection
使用完后,调用close()
方法,而实际上Connection
资源并没有被释放,而实际上被添加到了连接池中。这样可以做到吗?答案是可以。上述的要求从另外一个角度来描述就是:能否提供一种机制,让我们知道Connection
对象调用了什么方法,从而根据不同的方法自定义相应的处理机制。恰好代理机制就可以完成上述要求。
怎样实现Connection
对象调用了close()
方法,而实际是将其添加到连接池中:
这是要使用代理模式,为真正的
Connection
对象创建一个代理对象,代理对象所有的方法都是调用相应的真正Connection
对象的方法实现。当代理对象执行close()
方法时,要特殊处理,不调用真正Connection
对象的close()
方法,而是将Connection
对象添加到连接池中。
MyBatis
的PooledDataSource
的PoolState
内部维护的对象是PooledConnection
类型的对象,而PooledConnection
则是对真正的数据库连接java.sql.Connection
实例对象的包裹器。
PooledConnection
对象内持有一个真正的数据库连接java.sql.Connection
实例对象和一个java.sql.Connection
的代理,其部分定义如下:
1
|
class PooledConnection implements InvocationHandler {
|
PooledConenction
实现了InvocationHandler
接口,并且,proxyConnection
对象也是根据这个它来生成的代理对象:
1
|
public PooledConnection(Connection connection, PooledDataSource dataSource) {
|
实际上,我们调用PooledDataSource
的getConnection()
方法返回的就是这个proxyConnection
对象。当我们调用此proxyConnection
对象上的任何方法时,都会调用PooledConnection
对象内invoke()
方法。
让我们看一下PooledConnection
类中的invoke()
方法定义:
1
|
public Object invoke(Object proxy, Method method, Object[] args) throws Throwable {
|
从上述代码可以看到,当我们使用了
pooledDataSource.getConnection()
返回的Connection
对象的close()
方法时,不会调用真正Connection
的close()
方法,而是将此Connection
对象放到连接池中。
8.7 JNDI
类型的数据源DataSource
对于JNDI
类型的数据源DataSource
的获取就比较简单,MyBatis
定义了一个JndiDataSourceFactory
工厂来创建通过JNDI
形式生成的DataSource
。下面让我们看一下JndiDataSourceFactory
的关键代码:
1
|
if (properties.containsKey(INITIAL_CONTEXT) && properties.containsKey(DATA_SOURCE))
|
9 MyBatis
事务管理机制
9.1 概述
对数据库的事务而言,应该具有以下几点:创建(create
)、提交(commit
)、回滚(rollback
)、关闭(close
)。对应地,MyBatis
将事务抽象成了Transaction
接口:
MyBatis
的事务管理分为两种形式:
使用
JDBC
的事务管理机制:即利用java.sql.Connection
对象完成对事务的提交(commit()
)、回滚(rollback()
)、关闭(close()
)等。
使用MANAGED
的事务管理机制:这种机制MyBatis
自身不会去实现事务管理,而是让程序的容器如(JBOSS
,Weblogic
)来实现对事务的管理。
9.2 事务的配置、创建和使用
1. 事务的配置
我们在使用MyBatis
时,一般会在MyBatis
的XML
配置文件中定义类似如下的信息:
<environment>
节点定义了连接某个数据库的信息,其子节点<transactionManager>
的type
会决定我们用什么类型的事务管理机制。
2. 事务工厂的创建
MyBatis事务
的创建是交给TransactionFactory
事务工厂来创建的,如果我们将<transactionManager>
的type
配置为JDBC
,那么,在MyBatis
初始化解析<environment>
节点时,会根据type="JDBC"
创建一个JdbcTransactionFactory
工厂,其源码如下:
1
|
/**
|
如上述代码所示,如果type = "JDBC"
,则MyBatis
会创建一个JdbcTransactionFactory.class
实例;如果type="MANAGED"
,则MyBatis
会创建一个MangedTransactionFactory.class
实例。
MyBatis
对<transactionManager>
节点的解析会生成TransactionFactory
实例;而对<dataSource>
解析会生成datasouce
实例,作为<environment>
节点,会根据TransactionFactory
和DataSource
实例创建一个Environment
对象,代码如下所示:
1
|
private void environmentsElement(XNode context) throws Exception {
|
Environment
表示着一个数据库的连接,生成后的Environment
对象会被设置到Configuration
实例中,以供后续的使用。
上述一直在讲事务工厂TransactionFactory
来创建的Transaction
,现在让我们看一下MyBatis
中的TransactionFactory
的定义吧。
3. 事务工厂TransactionFactory
事务工厂Transaction
定义了创建Transaction
的两个方法:一个是通过指定的Connection
对象创建Transaction
,另外是通过数据源DataSource
来创建Transaction
。与JDBC
和MANAGED
两种Transaction
相对应,TransactionFactory
有两个对应的实现的子类:
4. 事务Transaction
的创建
通过事务工厂TransactionFactory
很容易获取到Transaction
对象实例。我们以JdbcTransaction
为例,看一下JdbcTransactionFactory
是怎样生成JdbcTransaction
的,代码如下:
1
|
public class JdbcTransactionFactory implements TransactionFactory {
|
如上说是,JdbcTransactionFactory
会创建JDBC
类型的Transaction
,即JdbcTransaction
。类似地,ManagedTransactionFactory
也会创建ManagedTransaction
。下面我们会分别深入JdbcTranaction
和ManagedTransaction
,看它们到底是怎样实现事务管理的。
5. JdbcTransaction
JdbcTransaction
直接使用JDBC
的提交和回滚事务管理机制。它依赖与从dataSource
中取得的连接connection
来管理transaction
的作用域,connection
对象的获取被延迟到调用getConnection()
方法。如果autocommit
设置为on
,开启状态的话,它会忽略commit
和rollback
。
直观地讲,就是JdbcTransaction
是使用的java.sql.Connection
上的commit
和rollback
功能,JdbcTransaction
只是相当于对java.sql.Connection
事务处理进行了一次包装(wrapper
),Transaction
的事务管理都是通过java.sql.Connection
实现的。JdbcTransaction
的代码实现如下:
1
|
public class JdbcTransaction implements Transaction {
|
6. ManagedTransaction
ManagedTransaction
让容器来管理事务Transaction
的整个生命周期,意思就是说,使用ManagedTransaction
的commit
和rollback
功能不会对事务有任何的影响,它什么都不会做,它将事务管理的权利移交给了容器来实现。看如下Managed
的实现代码大家就会一目了然:
1
|
/**
|
注意:如果我们使用
MyBatis
构建本地程序,即不是WEB
程序,若将type
设置成MANAGED
,那么,我们执行的任何update
操作,即使我们最后执行了commit
操作,数据也不会保留,不会对数据库造成任何影响。因为我们将MyBatis
配置成了MANAGED
,即MyBatis
自己不管理事务,而我们又是运行的本地程序,没有事务管理功能,所以对数据库的update
操作都是无效的。
10 MyBatis
关联查询
MyBatis
提供了高级的关联查询功能,可以很方便地将数据库获取的结果集映射到定义的Java Bean
中。下面通过一个实例,来展示一下Mybatis
对于常见的一对多和多对一关系复杂映射是怎样处理的。
设计一个简单的博客系统,一个用户可以开多个博客,在博客中可以发表文章,允许发表评论,可以为文章加标签。博客系统主要有以下几张表构成:
Author
表:作者信息表,记录作者的信息,用户名和密码,邮箱等。
Blog
表:博客表,一个作者可以开多个博客,即Author
和Blog
的关系是一对多。
Post
表:文章记录表,记录文章发表时间,标题,正文等信息;一个博客下可以有很多篇文章,Blog
和Post
的关系是一对多。
Comments
表:文章评论表,记录文章的评论,一篇文章可以有很多个评论:Post
和Comments
的对应关系是一对多。
Tag
表:标签表,表示文章的标签分类,一篇文章可以有多个标签,而一个标签可以应用到不同的文章上,所以Tag
和Post
的关系是多对多的关系;(Tag
和Post
的多对多关系通过Post_Tag
表体现)
一般情况下,我们会根据每一张表的结构创建与此相对应的JavaBean
(或者Pojo
),来完成对表的基本CRUD
操作。
上述对单个表的JavaBean
定义有时候不能满足业务上的需求。在业务上,一个Blog
对象应该有其作者的信息和一个文章列表,如下图所示:
如果想得到这样的类的实例,则最起码要有一下几步:
- 通过
Blog
的id
到Blog
表里查询Blog
信息,将查询到的blogId
和title
赋到Blog
对象内;- 根据查询到到
blog
信息中的authorId
去Author
表获取对应的author
信息,获取Author
对象,然后赋到Blog
对象内;- 根据
blogId
去Post
表里查询对应的Post
文章列表,将List<Post>
对象赋到Blog
对象中;
这样的话,在底层最起码调用三次查询语句,请看下列的代码:
1
|
/*
|
从上面的代码可以看出,想获取一个BlogInfo
对象比较麻烦,总共要调用三次数据库查询,得到需要的信息,然后再组装BlogInfo
对象。
10.1 嵌套语句查询
Mybatis
提供了一种机制,叫做嵌套语句查询,可以大大简化上述的操作,加入配置及代码如下:
1
|
<resultMap type="com.foo.bean.BlogInfo" id="BlogInfo">
|
1
|
/*
|
通过上述的代码完全可以实现前面的那个查询。这里我们在代码里只需要 blogInfo = (BlogInfo)session.selectOne("com.foo.bean.BlogMapper.queryBlogInfoById",id);
一句即可获取到复杂的blogInfo
对象。
嵌套语句查询的原理:
在上面的代码中,Mybatis
会执行以下流程:
- 先执行
queryBlogInfoById
对应的语句从Blog表里获取到ResultSet结果集;- 取出
ResultSet
下一条有效记录,然后根据resultMap
定义的映射规格,通过这条记录的数据来构建对应的一个BlogInfo
对象。- 当要对
BlogInfo
中的author
属性进行赋值的时候,发现有一个关联的查询,此时Mybatis
会先执行这个select
查询语句,得到返回的结果,将结果设置到BlogInfo
的author
属性上;- 对
BlogInfo
的posts
进行赋值时,也有上述类似的过程。- 重复
2
步骤,直至ResultSet.next() == false
;
这种关联的嵌套查询,有一个非常好的作用就是:可以重用select
语句,通过简单的select
语句之间的组合来构造复杂的对象。上面嵌套的两个select
语句com.foo.bean.AuthorMapper.selectByPrimaryKey
和com.foo.bean.PostMapper.selectByBlogId
完全可以独立使用。
N+1
问题:
它的弊端也比较明显:即所谓的
N+1
问题。关联的嵌套查询显示得到一个结果集,然后根据这个结果集的每一条记录进行关联查询。
现在假设嵌套查询就一个(即resultMap
内部就一个association
标签),现查询的结果集返回条数为N
,那么关联查询语句将会被执行N
次,加上自身返回结果集查询1
次,共需要访问数据库N+1
次。如果N
比较大的话,这样的数据库访问消耗是非常大的!所以使用这种嵌套语句查询的使用者一定要考虑慎重考虑,确保N
值不会很大。
以上面的例子为例,select
语句本身会返回com.foo.bean.BlogMapper.queryBlogInfoById
条数为1
的结果集,由于它有两条关联的语句查询,它需要共访问数据库1 * (1 + 1) = 3
次数据库。
10.2 嵌套结果查询
嵌套语句的查询会导致数据库访问次数不定,进而有可能影响到性能。Mybatis
还支持一种嵌套结果的查询:即对于一对多,多对多,多对一的情况的查询,Mybatis
通过联合查询,将结果从数据库内一次性查出来,然后根据其一对多,多对一,多对多的关系和ResultMap
中的配置,进行结果的转换,构建需要的对象。
重新定义BlogInfo
的结果映射resultMap
:
1
|
<resultMap type="com.foo.bean.BlogInfo" id="BlogInfo">
|
对应的sql
语句如下:
1
|
<select id="queryAllBlogInfo" resultMap="BlogInfo">
|
1
|
/*
|
嵌套结果查询的执行步骤:
根据表的对应关系,进行
join
操作,获取到结果集;根据结果集的信息和
BlogInfo
的resultMap
定义信息,对返回的结果集在内存中进行组装、赋值,构造BlogInfo
;返回构造出来的结果
List<BlogInfo>
结果。
对于关联的结果查询,如果是多对一的关系,则通过形如<association property="author" column="blog_author_id" javaType="com.foo.bean.Author">
进行配置,Mybatis
会通过column
属性对应的author_id
值去从内存中取数据,并且封装成Author
对象;
如果是一对多的关系,就如Blog
和Post
之间的关系,通过形如 <collection property="posts" column="blog_post_id" offType="com.foo.bean.Post">
进行配置,MyBatis
通过blog_id
去内存中取Post
对象,封装成List<Post>
;
对于关联结果的查询,只需要查询数据库一次,然后对结果的整合和组装全部放在了内存中。
原文作者:文/陶邦仁(简书作者)
原文标题:终结篇:MyBatis原理深入解析(二)