硬件平台的增长
Hardware Platform Growth
好像大型应用程序的设计和实现带来的麻烦还不够多似的,把已经实现的平台从一种规模迁到另一种规模会赐予我们一系列全新的问题。大型应用程序的硬件平台看起来和它的那些小型应用程序的兄弟们是截然不同的。如果一个支持100 000个用户的小型应用或者原型是基于一个专用的服务器,那么依照线性扩展的模型(通常这并非现实情形)推断,相同的应用如果要支持1000万的用户基础就需要100台机器。管理有100台机器的服务器平台和单个服务器相比,要进行很多规划,还会增加一些附加需求。
特别是在小团队中,指定并购买硬件的责任,往往落在体系结构领域或者工程师领导头上。在更大规模的运作中,这些任务则属于业务经理的工作范畴。但无论如何,在这方面为小型平台配备专用的协调人员还是有些小题大做了。
当从一个纯粹的工程师转换为担当硬件平台管理员时,有很多因素需要考虑,这些因素并非显而易见。接着的内容依次考虑几种这样的因素,并尝试和覆盖在安排初期扩展时会遇到的主要难点。
可得性和交付周期
Availability and Lead Times
当选择硬件供货商时,除去考虑你所定购的硬件的规范和成本,也要注意查看订购更多的同类型硬件的困难程度。如果你的某些任务,预计会依赖于单一类型的硬件,比如说某种特定的RAID控制器,那么预先查明订购更多这种硬件是否容易是很重要的。这包括查明你的供货商是否保持这个组件的一定量的库存,如果没有,那么从与制造商订货到交货的时间又有多久。你肯定不希望因为花三个月时间等待零部件生产而延误了扩建。
供应商的可靠性和产品是否会下线也是个问题。对于需要特定种类硬件的核心组件,花点时间联系一下制造商,了解一下它对这个产品生产线的规划还是很值得的。如果一种产品要停产了,能在打算下单购买超出50个这种产品之前,获知这一消息将会很有用。基于相同的原因,花点心思去找找选择同一家供应商的伙伴也是值得的,与他们合作,学习他们的经验,毕竟实践出真知。
进口,海运,和分段运输
Importing, Shipping, and Staging
如果主机不在美国,那大量硬件都需要进口。硬件进口费时费钱。对硬件征收的进口税会大大增加购买负担,并且需要在订购前考虑到预算当中去。让硬件通过海关也可能会成为一个大问题,海运过程通常会增加数天的时间。而且目前尚没有为通过海关预留时间的好办法,如果能对所在国家的海关流程有透彻的了解,则能节省大量的时间。
从本地经销商处购买硬件时,要记得他们销售给你的硬件可能是需要进口的,并据此调整你从订货到交货的时间。与供应商建立良好的关系相当有效,这有助于查明他们的库存水平、供货者以及订货进度表。许多供应商能够在第二天就提交所需硬件,而没有库存时,交货时间就会延长一个月。
好的主机托管机构允许将硬件直接运输到数据中心,并在正式部署前提供存放空间。把硬件先运输到家中或办公场所,再将其快速运送到最终目的地只是对时间和精力的浪费。随着硬件平台的发展,这个流程会越来越不方便,而且终将难以管理。存放大型硬件平台所
需的空间以及启动这些硬件所需的电源很容易超出一个小办公室所能承载的范围。在选择主机提供商时,存放空间的可用性应该记入考虑范围。
空间
Space
如果初次的尝试是基于小型主机托管机构的,那物理空间将是相当严重的问题。如果你的平台一开始只占用八分之一机架,那么你要了解在需要时有没有可能拓展到二分之一机架,或扩展到全部机架。接着是否可以有两个机架?是否可以有三十个机架?这些问题都是至关重要的,需要在确定供应商之前事先询问。如果有能力拓展,那么机架是否相邻?若不相邻,托管机构能否为不相邻的机架提供布线连接?会提供哪种机架底座(Telco、two-post,或者four-post),它们和你的硬件是否契合?检查机架底座和机架深度是很重要的,因为有些机架和很长体积的服务器不兼容。
没有什么能比迁移数据中心更困难、更耗时、更有压力了,尤其是应用程序正在发展,而空间却已耗尽的情况。数据中心迁移通常需要很多额外的硬件,以确保在迁移过程中,有部分应用程序可以在源DC及目标DC上运行。显然这样做是相当昂贵的,所以只要有任何其他方式可以避免这种迁移,都是值得一试的。
电源
Power
跟空间一样,你也得为预期的平台拓展准备足够的UPS后备电源。服务器耗电用安培计量,一个常规的机架需要15安培(如果有用电)。一个满载的含有40台1U大小服务器的机架很轻松就能耗掉100安培(使用快速磁盘时耗费的电量还要更多),所以你得考虑机架安装额外电源所需费用、使用额外电力的花费,以及DC需要多少电力能源。
你可以买你想要的任何服务器,但是如果数据中心电力不足,那么什么服务器也没法使用。所以你应该在总预算和将来拓展的容量计划中考虑到电力因素。
网络操作中心(NOC)设施
NOC Facilities
不同提供商提供的服务也大不相同,很多机构在不同价位上提供不同的服务集合。最低等级的NOC只监控自身的基础设施,在与你有关的事情发生时给点提醒。这种提醒包括常见的网络中断及路由问题,还包括安装特定的问题,如未能成功抵制服务攻击。
重启服务器这种基础性的又与网络无关的服务基本上总是有的。但一些更复杂的服务,如诊断硬件错误并交换损坏的磁盘,就不是这样了。这种服务常常是额外提供,可能要在托管主机成本中包含一笔相关费用,也可能是基于服务次数收费。有些提供商每个月提供一定数目的免费次数服务,超出这些次数时才收费。根据你和你的工程师团队以及这些设施的距离远近,这个问题与其他问题相比可能不那么要紧。但无论如何,在选择机构时还是应该知道这些。
连接
Connectivity
一流的机构都有多个对等连接到高速主干网的链接。机构提供的连接也是多种多样的。到机位的默认连接是100-baseT的以太网电缆。了解一下机构能否在需要时将网络轻易提高到1000-baseT,如果你选择使用光缆,确认一下能否提高到1000-baseSX。
如果对外的网络硬件支持,可以设置一条连接到机架的后备线路,这条后备线路在处理DC路由这个层级的故障时会很有用。除生产系统的连接之外,配备一条用于管理的冗余线路也挺不错。同样的,提供商不同,它们所提供的这种服务也不相同,所以事先应做点调查。






