了解数据中心冗余和高可用性(数据中心容错与冗余)

了解数据中心冗余和高可用性(数据中心容错与冗余)

浏览次数:
信息来源: 用户投稿
更新日期: 2025-10-21
文章简介

所有类型的企业(医疗保健、金融、零售、通信、服务专业人员等)都需要确保其计算机操作持续运行。停机意味着客户流失、公司声誉受损以及其他财务损失。公司计算机需要具有高可用性,这意味着它们需要几乎永远不会出

2025阿里云双十一服务器活动

所有类型的企业(医疗保健、金融、零售、通信、服务专业人员等)都需要确保其计算机操作持续运行。停机意味着客户流失、公司声誉受损以及其他财务损失。公司计算机需要具有高可用性,这意味着它们需要几乎永远不会出现故障。越来越多的企业和组织依靠高可用性数据中心来保持其系统和数据持续运行和可用。

为什么需要数据中心冗余?

不幸的是,公司信息系统的许多部分都可能出现故障。系统可能因攻击、不良编程、自然灾害和其他问题而遭受损害。任何可用性策略的一部分是能够快速排除任何紧急情况或灾难。

信息系统需要冗余——这意味着数据中心应该立即用可用的系统替换故障系统。冗余数据中心允许公司保持可操作性,同时让公司和数据中心有时间准确确定系统失败的原因,以免这些问题再次发生。

公司IT人员需要与数据中心合作以确定适当的冗余级别。备份整个系统的成本可能相当高,但仅备份系统的一部分可能意味着公司无法提供基本服务。了解公司恢复运营所需的具体冗余水平至关重要。

为了做出这一决定,公司应考虑以下几点:

  • 系统最多可以恢复到哪个日期——紧急情况前一周、一天前、一个小时?
  • 在实际经济损失开始之前,系统可以关闭多长时间?
  • 哪些程序依赖于其他程序?
  • 这些问题的答案可以帮助确定公司保持运营所需的冗余水平。数据中心中存在的冗余级别与运营成本直接相关,因此也与客户的服务价格相关。对于因其业务模式而需要始终如一的可靠性的客户,需要更高级别的冗余;对于那些不这样做的人,较低级别的冗余是可以接受的。

    当然,较低级别的冗余意味着从长远来看会增加潜在的停机时间。较少的冗余将导致可能持续数小时或数天的潜在停机时间,而对公司数据的访问为零。更多的冗余将导致更少的停机时间,但会增加成本;如果您的商业模式需要尽可能少的停机时间,那么这在利润和整体净增长方面通常是合理的。

    了解数据中心冗余和高可用性,数据中心容错与冗余

    服务器冗余通常以N等级衡量,其中N代表在特定工作负载下保持数据中心满负荷运行所需的基础设施。实际上,这通常是指冷却能力和不间断电源,但也可以在与服务器冗余相关的其他环境中使用。

    自然,N是没有冗余的功能的基线度量。很少有数据中心在此级别上运行,因为此类设施中过多的停机时间会迅速导致任何客户将业务转移到其他地方。因此,最小冗余的行业标准是N+1。这种冗余级别确保,对于数据中心使用的每四个组件,都有一个备份,可以在发生故障或维护时恢复使用。

    N+2将此原则带到下一个逻辑步骤,每使用4个单元就有2个冗余组件单元。这通常会大大提高可靠性,允许数据设施在维持完整工作负载的同时维持更广泛的维护或故障。在为具有中等可靠性需求的客户提供服务的数据中心实施时,这通常足以留住客户。

    2N冗余等级通过确保在维护或使用中的每个组件出现故障期间有一个可用的副本单元来确保显着提高可靠性。这是要求近乎完全可靠性的公司或机构(例如医院、警察部门和研发实验室)所需的最低冗余级别。

    2N+1是最后一个常用的冗余级别,数据中心使用的每个单元都有一个冗余组件,每四个组件有一个额外的单元。实施2N+1冗余的数据中心可以可靠地保证每年持续不超过26分钟的停机时间。虽然有更高级别的冗余,但这些很少被任何客户使用,但那些具有超高可靠性要求的客户除外。

    数据中心冗余如何工作?

    需要考虑不同级别的冗余。N+1一般最弱,2N更强,2N+1更强。分析这些术语的最佳方法是举个例子。正如我们前面所讨论的,这些是冗余和可用性的标准化级别;但它是如何工作的呢?在下一节中,我们将简单地说明N+1、N+2、2N和2N+1服务器冗余的功能。

    如果您要举办一个需要N人就座的活动,那么最少的计划要求您拥有N+1把椅子。额外的椅子以防万一。N+2稍微好一些——这意味着可以更换两把椅子。更好的策略是拥有2N把椅子(每人两把椅子)。使用2N把椅子,您不必担心有多少把椅子坏了或发生故障。您将随时准备为每个人提供全套椅子来重置整个桌子。

    2N把椅子的第二个好处是,即使只是几个休息时间,你也可以用第二组N把椅子把每个人送到不同的桌子上。当客人在第二张桌子上时,您可以检查第一组中的所有椅子——坏的和可能坏的。

    2N+1只是意味着你有两倍于你需要的椅子,再加上一个额外的引导。现在与计算机信息系统进行比较。N+1意味着您有足够的组件来处理紧急情况以及一个额外的组件。问题是您仍然只能使用一个电路、一个发电机或一个馈电。

    使用2N个组件,数据中心可以使用第二个电路、发电机或馈电来运行操作,而无需考虑原始损坏是部分故障还是完全故障。2N+1冗余提供了双馈的可用性以及用于额外保护的另一个组件。

    当然,这些系统并不是万无一失的。重复的服务器总是有可能发生故障,或者给定灾难的性质使得任何冗余级别都不足以迅速恢复操作。这就是为什么冗余只是全面灾难恢复计划的一部分。

    标签:
    内容交付网络CDN与云服务的不同之处(内容交付服务是什么意思)
    « 上一篇
    返回列表
    下一篇 »

    如本文对您有帮助,就请抽根烟吧!