Azure SQL Database Active Geo-Replication简介
笔者在《迁移 SQL Server 数据库到 Azure SQL 实战》一文中,介绍了如何把一个本地版的 SQL Server 数据库迁移到 Azure SQL Database。迁移虽然顺利实现了,但是现在我们又面临一个新的任务:如何对新迁移的数据库进行备份?
对于数据库的维护来说,备份工作可谓是重中之重。MS Azure 当然也提供了很完善的数据库备份功能,但是在动手创建备份计划前,请思考一下备份工作的真实目的:当然首先要保证数据的安全,一般来说定时创建数据库的备份文件,再拷贝到不同的存储设备上就可以了;其次,当灾难发生时,能不能在最短的时间内还原数据库从而恢复应用?最后,能不能让备份的数据库也创造一些价值?
让我们带着这些问题,一起来了解下 Azure 提供的一种可以跨越数据中心的数据库备份方式:Active Geo-Replication。
文章来源:葡萄城产品技术社区
一、Active Geo-Replication 是什么?
这里的 Active 我们可以理解为 "正在运行的",Geo 表示的是 "geographic" 也就是 "地理的",Replication 是 "复制" 的意思。合起来的大意就是 "在不同的地理位置上运行的副本"。
Active Geo-Replication 允许我们最多配置4个只读的从数据库,再加上一个主数据库,此时你就会拥有五个数据库的实例,并且它们都是可访问的。注意,这五个数据库可以设置在不同的数据中心,也就是说当其中的四个数据中心完全挂掉的时候,你的数据库依然是安全的,并且可以立即使用,这是因为它是正在运行的数据库。主数据库可读写,并且以异步的方式把变更同步到其余的从数据库。我们可以轻松的把主数据库和从数据库配置到不同的数据中心,因而当灾难发生时,我们可以用最少的时间恢复程序的执行并且做到不丢失数据。
这是如何做到的呢?当主数据库由于任何原因不可用时,我们可以把任何一个从数据库切换为主数据库,切换完成后,各个数据库会立即适应自己的新角色,即主数据库异步的向从数据库同步数据。需要注意的是,Azure 并不会智能的帮我们做切换工作,这个工作需要小伙伴们自己手动执行,或者是写程序执行。
Active Geo-Replication 实现了一个可以在不同的区域间进行数据库冗余备份的架构 (Azure 上的数据库) 。它通过异步复制已提交的事务来保证主从服务器的同步。因此从数据库中的数据会稍微比主数据库滞后一点点(笔者在主数据库中插入一条数据,在下一行中执行从数据库中的查询就能查到这条数据)。
Active Geo-Replication 的设置非常简单,可以通过图形化的操作就能完成。下面的截图是设置了一个从数据库的 demo:
这一点 MS 真的做得很好,操作好用到你想在哪个数据中心创建备份,直接点地图上的圈圈就行了!但是操作的时间问题却是无法保证的,笔者尝试把 8G 的数据库向不同的数据中心做备份,短的几分钟就好了,长的则需要数小时!
二、使用 Active Geo-Replication 的优势
1. 提供数据库级别的灾难恢复
当我们把从数据库部署到 Azure 上的不同的数据中心时,就为应用程序提供了最强的的灾难恢复能力。跨数据中心的冗余数据库备份让我们能够很容易的,并且很快的从灾难中恢复数据。其中,这些灾难可能是人力不可抗拒的自然灾害,也有可能是一些人为的恶意攻击。
2. 只读的从数据库可以分担主数据库的部分负载
像生成报表等一些只读的操作,完全可以通过访问从数据库来完成,从而降低主数据库的负载。对于笔者来说,这是使用 Active Geo-Replication 的重要目的。读过前文的朋友知道,笔者是在维护一个旧的系统,不是必须要做的事情,笔者是不愿意去优化那些已经跑了很多年的、慢吞吞的、很复杂的报表查询操作的。现在好了,只需要把这些查询定向到备份用的从数据库就可以了,结果就是所有操作的性能都会有所提升。
更进一步,还可以把从数据库与主数据库设置在同一区域中,然后实现对读操作的负载平衡,详情请参考 MSDN。当然这并不会增加应用程序的容灾能力。
3. 数据库迁移
通过使用 Active Geo-Replication,我们可以用最短的时间完成数据库的迁移工作,其实就是创建一个从数据库的过程。
4. 应用程序升级的回退备份
我们可以创建一个从数据库作为应用程序升级失败后回退用的备份。这里可能会让人迷惑,因为主从数据库是有同步关系的,在升级主数据库的过程中从数据库肯定会被同步,它又如何能够作为备份呢?真相是这样的:在从数据库创建后可以让它断开与主数据库的主从关系,断开后就不会再被同步,所以可以起到备份的作用。
三、Active Geo-Replication的主要功能
前面我们介绍了 Active Geo-Replication 相比传统备份方法的一些优势,接下来我们一起看看它都有哪些主要功能。
1. 自动进行的异步复制
我们只能为已经存在的数据库添加从数据库,并且只能把从数据库添加到和主数据库不同的 Azure SQL Database server 中。被创建的从数据库会使用主数据库中的数据进行填充,这个过程称为播种(seeding)。播种完成后,主数据库中的更新就会以异步复制的方式,自动同步到从数据库中。
2. 支持最多四个从数据库
两个或两个以上的从数据库可以显著的增强主数据库的容灾能力。当有多个从数据库存在时,即便其中的一个从数据库发生了故障,也不影响主数据库的抗灾能力。注意,当你配备多个从数据库作为备份时,也是有成本的,需要根据具体需求确定从数据库的个数。
3. 从数据库是只读的
应用程序可以把一些只读的操作放在从数据库上,并且可以使用不同的用户权限去操作从数据库。此处我们可能会关注主从数据库同步的性能,当我们在从数据库上执行操作时,会不会影响主数据库到从数据库的同步。按照 MS 的说法是不会的,对从数据库的读操作使用了一种称为快照隔离模式(snapshot isolation mode)的高大上方法,能够在读操作的同时,不影响主数据库到从数据库的同步。
4. 可以使用 elastic database pool
Active Geo-Replication 可以像普通数据库一样被配置到 elastic database pool 中。
5. 从数据库可以设置为与主数据库不同的配置
对于作为备份存在的从数据库而言,如果保持资源类型和主数据库一致是相当奢侈的。好在 MS 也为我们提前想好了,把从数据库的资源类型设置的低一点可以为我们节省不少的预算。但这样也可能会带来一点问题,就是主从数据库的同步延迟会增加。具体情况取决于你的应用。
6. 用户可控的灾难恢复
一个从数据库可以在任何时刻被切换成主数据库。同时,原来的主数据库会成为从数据库。
当灾难发生在主数据库上时,我们可以把一个从数据库切换成主数据库,程序只需要重新配置数据库的链接信息即可。再次强调,这个操作需要用户使用写程序等方式来完成。
7. 同步防火墙和认证信息
传统 sql server 的登录用户都是在 database server 级别设置的,这在数据库同步的应用场景中,可能会带来一些不便。比如从数据库所在的 database server 上是否设置了相同的用户登录信息;如果没有,当主从数据库切换后,应用程序访问数据库时就可能碰到登录问题。
为了解决这一问题,新的 sql server 支持数据库级别的用户访问控制。用户不需要有登录 sql server 的权限,只要能够访问某个数据库就可以了,并且用户的信息是保存在数据库的配置文件中的,可以随数据库一起复制。
同理,防火墙的规则也可以设置在数据库上。
8. 使用 PowerShell 进行管理
可以使用 Azure Resource Manager (ARM) APIs 通过 PowerShell 管理 Active Geo-Replication。
四、总结
Active Geo-Replication 在提供数据库备份的同时,也增加了很多附加的价值,为我们的应用程序和维护带来了更多的灵活性。如果使用得当,可以通过很少的成本增加来创造大量的价值。
相关阅读:
Azure Blob Storage 基本用法 -- Azure Storage 之 Blob
Azure Queue Storage 基本用法 -- Azure Storage 之 Queue
Azure File Storage 基本用法 -- Azure Storage 之 File
Azure Table storage 基本用法 -- Azure Storage 之 Table