你当前正在访问 Microsoft Azure Global Edition 技术文档网站。 如果需要访问由世纪互联运营的 Microsoft Azure 中国技术文档网站,请访问 https://docs.azure.cn。
Azure 弹性 SAN是一种云原生存储区域网络(SAN)服务,可为一系列计算选项提供可缩放、经济高效、高性能和全面的存储解决方案。 弹性 SAN 允许您创建和管理卷,这些卷是虚拟磁盘,可以通过 iSCSI 协议连接到虚拟机、容器或其他 Azure 服务。
使用 Azure 时,可靠性是共同的责任。 Microsoft提供了一系列功能来支持复原和恢复。 你负责了解这些功能如何在你使用的所有服务中工作,并选择满足业务目标和运行时间目标所需的功能。
本文介绍如何使Azure 弹性 SAN应对各种潜在中断和问题,包括暂时性故障、可用性区域故障和区域范围的故障。 它还介绍了备份和恢复选项,并重点介绍了有关Azure 弹性 SAN服务级别协议(SLA)的关键信息。
提高可靠性的生产部署建议
对于生产工作负载,我们建议您:
- 使用区域冗余存储(ZRS): ZRS 将数据的副本分散到三个可用性区域。
- 配置网络访问以减少在发生区域故障期间的手动干预: 专用终结点能自动支持区域故障转移,无需手动干预,而服务终结点可能需要手动干预。
- 对于需要跨区域灾难恢复的工作负荷: 定期创建卷的快照,并将快照导出为托管磁盘快照,以保护数据。 将快照复制到与主要区域相距地理上的次要区域。
可靠性体系结构概述
弹性 SAN 具有三级资源层次结构:
- 弹性 SAN:配置冗余、分配存储容量和设置性能限制的顶级资源。 分配给弹性 SAN 的基本单位数决定了整个 SAN 中可用的总 IOPS 和吞吐量。
- 卷组:用于大规模管理卷的管理构造。 网络访问设置(如专用终结点或服务终结点)在卷组级别配置,并由组中的所有卷继承。
- 卷:从 SAN 的总容量中分区出来的单个存储卷。 卷通过 iSCSI 协议连接到计算资源。
有关部署的资源的更多详细信息,请参阅 弹性 SAN 资源。
在内部,弹性 SAN 将数据存储在 存储群集中。 将弹性 SAN 配置为使用本地冗余存储(LRS),数据将在一个数据中心的单个存储群集中复制三次。 可以将区域冗余存储(ZRS)配置为跨三个可用性区域存储数据的副本。 有关详细信息,请参阅 可用性区域故障的复原能力。
暂时性故障的复原能力
暂时性故障是指组件发生短暂的间歇性故障。 这些故障经常出现在云之类的分布式环境中,在运营过程中比较常见。 暂时性故障在短时间内自行纠正。 应用程序通常可以通过重试受影响的请求来处理暂时性故障,这一点很重要。
与任何云托管的 API、数据库和其他组件通信时,所有云托管的应用程序都应遵循 Azure 暂时性故障处理指南。 有关详细信息,请参阅有关处理暂时性故障的建议。
如果与弹性 SAN 卷的 iSCSI 连接中断,则客户端上的 iSCSI 发起程序会自动尝试重新连接。 在重新连接期间,I/O 操作可能会出现短暂的暂停。 使用适当的重试和超时设置配置 iSCSI 发起器以处理瞬时中断。 有关详细的 iSCSI 和 MPIO 设置建议,请参阅 优化弹性 SAN 的性能。
应对可用区故障的弹性
可用性区域 是 Azure 区域内物理上独立的数据中心组。 当某个区域发生故障时,服务可以切换到其他可用的区域。
可以将Azure 弹性 SAN配置为使用区域冗余存储(ZRS),这意味着数据在区域中的三个可用性区域之间同步复制。 区域冗余有助于实现生产工作负荷的复原和可靠性。
连接方式会影响工作负载在发生区域故障时透明切换的能力。 建议使用专用终结点连接到您的卷。 专用终结点支持自动故障转移。 如果使用服务终结点,故障转移可能需要手动干预。 有关连接方法的详细信息,请参阅 了解 Elastic SAN 的网络配置。
使用本地冗余存储(LRS)会使您的弹性 SAN 无法抵御可用区故障的风险。 LRS 通过将数据存储在单个可用性区域中,而不是在具有 ZRS 的区域之间分发数据,使弹性 SAN 非区域 化。
要求
区域支持: 区域冗余的弹性 SAN 资源可以部署到区域子集。 有关区域列表,请参阅弹性 SAN 的缩放目标。
Cost
使用 ZRS 创建弹性 SAN 时,成本高于 LRS。 有关定价的详细信息,请参阅 Azure 弹性 SAN 定价。
配置可用性区域支持
使用 ZRS 创建新的弹性 SAN: 创建弹性 SAN 并选择 ZRS 作为冗余选项时,弹性 SAN 会自动区域冗余。 创建弹性 SAN 后,无法更改冗余选项。 有关创建新的弹性 SAN 资源的详细信息,请参阅 部署弹性 SAN。
在现有 LRS 弹性 SAN 上启用区域冗余: 无法将 LRS 弹性 SAN 转换为 ZRS。 若要迁移,请为弹性 SAN 卷创建快照,将其导出到托管磁盘快照,在 ZRS 上部署新的弹性 SAN,然后使用这些磁盘快照在新弹性 SAN 上创建卷。 有关详细信息,请参阅 Snapshot Azure 弹性 SAN 卷。
所有区域正常时的行为
本节描述当您配置弹性 SAN 以实现区域冗余时的预期情况,并且所有区域均正常运行。
跨区域操作: 连接到弹性 SAN 卷时,iSCSI 连接会路由到某个可用性区域中的群集。 平台会自动引导区域之间的流量。
跨区域数据复制: 当客户端将数据写入弹性 SAN 卷时,在确认写入操作之前,该数据会同步写入三个可用性区域中的群集。 同步复制可确保数据高度一致性,并确保区域故障期间不会丢失数据。
部署 ZRS 弹性 SAN 比 LRS 弹性 SAN 更可靠,但增加了更多的写入延迟。 对弹性 SAN 进行基准测试并模拟应用程序的工作负荷,以比较 LRS 和 ZRS 之间的延迟,看它是否会影响工作负荷。
区域故障期间的行为
该部分介绍在为区域冗余配置弹性 SAN 时可以预期的情况,以及当其中一个区域发生故障时的应对措施。
检测和响应: 弹性 SAN 平台可检测可用性区域中的任何故障。 无需执行任何操作即可为 ZRS 弹性 SAN 启动区域故障转移。
通知: Microsoft不会在区域关闭时自动通知你。 但是,可以使用 Azure 服务运行状况 来了解服务的总体运行状况,包括任何区域故障,并且可以设置 服务运行状况警报 来通知问题。
活动请求: 当可用性区域变得不可用时,服务可能会终止连接到受影响区域中副本的正在进行的 I/O 操作,并且必须重试这些操作。 如果使用专用终结点,服务会自动故障转移。 如果使用服务终结点,可能需要重启 iSCSI 发起程序才能故障转移到正常的区域。
预期数据丢失: 弹性 SAN 通过跨三个可用性区域同步复制数据,防止区域故障期间数据丢失。
预期的停机时间: 使用专用终结点时,区域故障转移会自动发生。 在故障转移后,存储区域网络(SAN)在重新平衡时,您可能会经历几分钟的可用性和性能下降。
使用服务终结点时,弹性 SAN 不会自动切换到健康的区域。 可能需要重启 iSCSI 发起程序来启动故障转移到其他正常运行的区域。
流量重新路由: 当某个区域不可用时,弹性 SAN 平台会检测区域丢失,并将流量路由到剩余的正常区域。
若要确保自动区域故障转移而不进行手动干预,请使用专用终结点连接到 Elastic SAN。 使用服务终结点而不是专用终结点时,可能需要手动重启 iSCSI 启动程序,以启动故障转移过程到正常域。
区域恢复
当可用性区域恢复时,弹性 SAN 平台会自动还原正常操作,并跨三个区域恢复复制。 你不必执行任何操作。
测试区域故障
Azure 弹性 SAN平台管理区域冗余资源的流量路由、故障转移和区域恢复。 由于此功能是完全管理的,因此无需验证可用区故障处理流程。
对区域范围的故障的复原能力
Azure 弹性 SAN是单区域服务。 如果区域不可用,弹性 SAN 资源也不可用。 弹性 SAN 没有内置的跨区域数据复制或故障转移机制。 如果你的工作负荷需要区域级复原能力,则负责构建自己的多区域灾难恢复解决方案。
用于复原的自定义多区域解决方案
你负责为弹性 SAN 数据实现多区域灾难恢复。 建议的方法是使用卷快照:
定期创建快照。 使用 卷快照 来捕获弹性 SAN 卷在特定时间点的副本。
恢复点目标(RPO)取决于创建快照并将其复制到次要区域的频率。 创建快照和复制快照的频率越高,灾难期间潜在的数据丢失就越低。
将快照导出到可管理磁盘快照。将卷快照导出到可管理磁盘快照,这些快照可以复制到其他区域。
将快照复制到次要区域。将增量快照复制到 与主要区域相距地理位置较远的新区域。 这样可降低多个区域受单个灾难影响的风险。
从快照还原。 在灾难恢复方案中,从复制的托管磁盘快照在辅助弹性 SAN 上创建新卷。
恢复时间目标(RTO)取决于数据的大小、跨区域复制快照所需的时间,以及在次要区域中部署和配置新的弹性 SAN 所需的时间。 若要缩短恢复时间,请考虑在发生灾难之前在恢复区域中部署辅助弹性 SAN。 这也有助于避免服务中断期间的容量限制。
备份和还原
对于大多数解决方案,不应只依赖于备份。 请改用本指南中所述的其他功能来支持复原要求。 但是,备份可以防范其他方法没有的一些风险。 有关详细信息,请参阅什么是冗余、复制和备份?。
弹性 SAN 支持两种类型的备份:
Azure 弹性 SAN backup: Azure 备份此功能提供了一种完全托管的解决方案,用于计划备份、设置恢复点的过期时间线,并将恢复数据恢复到新卷。 它有助于防止数据丢失,防止意外删除、勒索软件和应用程序更新。 有关详细信息,请参阅 Azure 弹性 SAN 备份(预览版)。
Important
由于此解决方案由 Microsoft 的 Azure 预览版补充条款所涵盖,因此使用它进行测试,而不用于生产用途。
快照: 或者,可以根据数据保护要求创建和管理快照。
Azure 弹性 SAN支持卷快照来实现数据保护。 快照是卷的增量时间点副本,这些副本占用弹性 SAN 总容量的空间。 若要保护数据,请定期创建快照。 频率取决于你能够承受丢失多少数据,即你的 RPO。 可以手动创建快照,也可以生成自己的自动化,以便按计划创建快照。
快照存储在卷所在的同一弹性 SAN 中,并使用相同的冗余设置。 若要防止区域范围的故障,请将快照导出到托管磁盘快照,并将其复制到其他区域。 有关详细信息,请参阅 导出卷快照 并将 增量快照复制到新区域。
可以从快照或托管磁盘快照中创建新的弹性 SAN 卷。 有关详细信息,请参阅 从快照创建卷。
服务维护期间的系统弹性能力
Microsoft定期应用服务更新并执行其他维护。 Azure平台会自动处理这些活动,确保维护是无缝且透明的。 除非通过 Azure 服务运行状况 计划内维护 通知,否则在维护事件期间不会有停机。
服务级别协议
Azure服务的服务级别协议(SLA)描述了每个服务的预期可用性以及解决方案必须满足的条件,以实现该可用性预期。 有关详细信息,请参阅 联机服务的 SLA。