硬件冗余
Hardware Redundancy
业务持续计划(BCP)是冗余规划的核心。BCP是一种方法学,用来管理部分关键服务或全部关键服务的运行故障产生的风险。在Web应用程序上,它涵盖了软件和硬件发生故障时、受到攻击时和遇到灾难时业务的连续性。对于小规模应用,大多技术术语在规模小时都可以忽略,但BCP基本上意味着有一个切实的规划能进行灾难恢复。
不同层次的BCP对应不同等级的可能灾难。处理好一块硬盘的故障是非常基本的,而冗余的网络设备则可以划归到中等层次。如果要遵循最高等级的BCP,那么企业需要考虑为关键应用在多个大陆上的多个数据中心配备主机。这样可以提高国际用户的响应时间,更为重要的是,丢失整个数据中心这样的事情有时确实会发生,即使整个数据中心都丢失了,服务仍然能够保持运行。
对无需双重数据中心故障转移的应用而言,可以接受的冗余层次是对每样事物至少有一个备份,如果有需要则提供更多备份(例如一个平台拥有上百块磁盘,却只提供一块备份磁盘,显然是严重不足的)。非常重要并需要牢记在心的一件事情是:任何物件都绝对有可
能发生故障,而且最终所有物件都会发生故障。这既包括我们通常会怀疑的对象,比如硬盘,也包括那些被认为是永恒不变的部件:电力电缆、网络电缆、网络交换机、电力供应、处理器、内存、路由器以及摆放其他东西的机架。
在第9章中论及规模调整时,我们会从设计角度进一步探讨冗余的相关知识,而不仅仅局限于原始的硬件方面。






