pgpool-II是一个工作于PostgreSQL服务器端和PostgreSQL客户端之间的中间件,它提供了如下的功能:
1.连接池
pgpool-II中保存了到PostgreSQL服务器的连接,然后当一个有着同样属性(也就是说用户名,数据库,协议版本相同)的新连接请求到来时,重用保存在pgpool-II中的连接。这样可以减轻连接的开销,改进这个系统吞吐量。
2.复制
pgpool-II能够管理多个PostgreSQL服务器。运用复制功能来在2个或者多个物理磁盘上创建数据库的实时备份,这样当一个磁盘出现故障时,系统 还能够继续提供服务。
3.负载平衡
假设一个数据库复制成多个,无论在哪一个数据库服务器上执行Select查询都会返回相同的结果。pgpool-II利用了复制的特点,通过将Select查询步骤分配到多个数据库服务器上来减少每一个数据库服务器的负载,这样做改进了系统整体的吞吐量。系统性能将随着服务器的数量成比例的提高。当有许多用户同时执行多个请求时,负载平衡的优点就能很好体现出来。
4.限制多余的连接
PostgreSQL数据库有一个最大并发连接数的限制,超过这个限制数的连接将会被拒绝。虽然能更改最大连接数,但是增加了资源消耗,影响了系统性能。pgpool-II也有最大连接数的限制,但是多余的连接将会被排成队列的形式等待,而不是马上返回一个错误的信息。
5.并行查询
通过运用并行查询的功能,数据能被分发到多个服务器上,这样一个请求能并发的在多个服务器上执行以减少系统整体的执行时间 。并行查询在处理搜索大规模数据时很有帮助。
pgpool-II和PostgreSQL的前后端协议通信,并在前端和后端之中传达连接。因此,一个数据库应用程序(前端)认为pgpool-II是一个PostgreSQL服务器,同时,数据库服务器(后端)认为pgpool-II是它的客户端之一。因为pgpool-II对数据库服务器和客户端都是透明的,所以一个现有的数据库应用程序不用做任何更改就能使用pgpool-II。