
接踵而来的宕机事件
对于云服务提供商和他们的用户来说,2015年的夏天就像当前的股市一样,显得极不寻常和让人心惊肉跳。
在经历了接踵而来的陌陌、网易、支付宝、携程网、艺龙网、招商证券、同花顺、齐鲁证券网络故障之后,2015年的5月被不少圈内人士揶揄为“黑色五月”。然而在“黑色五月”过去之后,宕机事件却并没有就此平息。
2015年6月6日下午,青云的服务商睿江科技机房因雷暴天气引发电力故障,导致青云广东1区全部硬件设备意外关机重启,青云官网及控制台短时无法访问、部署于GD1的用户业务暂时不可用。
2015年6月21日,阿里云香港节点出现全线宕机,业务中断超过12小时,甚至有部分用户数据出现损毁,在业界引发轰然大波。
阿里云事故发生伊始,坊间就传出了令人眼花缭乱的各种解释,包括光纤挖断、电力故障、消防警报等等,不一而足,让一起机房宕机事故演变成了一出“罗生门”。
6月21日晚,阿里云发布公告称,本次故障因香港运营商IDC电力问题所致,阿里云已责成香港运营商尽快完成机房整改措施,规避此类问题的再次发生。
阿里云的香港数据中心服务商名气通则声称,其香港二号数据中心于2015年6月21日上午9点40分因电力故障导致部分客户服务中断。名气通第一时间启动应急方案进行紧急抢修,下午2点恢复部分客户服务,晚上9点50分完全恢复电力供应,客户服务全部恢复正常。
对于这起宕机事故,业内人士普遍表示“难以置信”。因为对于中断1分钟都可能让客户难以忍受的云服务来说,这类故障通常在几分钟之内就能解决,12个小时显然有些不可思议了。
但是,阿里云还不是最惨的。有用户反映,其租用的恒创主机在本次事故中瘫痪超过24小时。对此,我们也许只能用“没有最惨,只有更惨”来形容了。
为什么香港倍受青睐
6月21日的宕机事故,将香港数据中心一下子推到了风口浪尖。那么问题就来了:为什么香港经常有台风等自然灾害,但还是有越来越多的企业选择香港数据中心?
总结归纳一番,其原因不外乎以下几点:
一、香港的国际金融中心地位。这一点自然不用多说,只要是想要开拓金融行业客户的云服务商,自然都不会放弃香港。而另一方面,金融行业对计算能力、稳定性及数据安全的要求是所有行业中最为严苛的,因此只要能够搞定这些金融客户,对于云服务商本身也是一个很好的正面宣传。
二、香港的黄金地理位置。作为“东方之珠”的香港,在地理位置方面也有着得天独厚的优势。香港是亚太地区海底光缆集中交汇地区,基础设施完善,通讯覆盖全面,并建有多个世界级的数据中心,可满足国际化用户的需求。这也使得香港除了国际金融中心之外,还俨然有成为亚洲数据中心枢纽之势。
三、香港政府的大力支持。对于数据中心建设,香港政府一直都是鼎力支持,不但在选址、价格等各方面都有各种优惠政策,而且还为很多机房提供了免费的制冷供电。
四、企业的海外业务需求。近年来,包括消费电子、游戏开发、电子商务等众多领域的中国企业,都对拓展海外市场业务有着旺盛的需求,因此将香港作为走出国门的第一站,实在是再合适不过了。
五、减少麻烦和规避风险。除了以上原因之外,还有一点是许多企业通常都不太愿意提及的,那就是可以绕过内地的数据备案制度。
正是因为有着诸多的优势,再加上如今“大众创业、万众创新”的主旋律,所以即使是在发生宕机事件之后,香港数据中心未来还是会有大批创业公司和想要拓展海外市场的企业不断涌入。

宕机事件暴露的问题
长久以来,香港数据中心在云服务商和广大企业用户心目中的形象都非常靠谱。但是这一次的宕机事件,却暴露出了相当严重的问题。
按照阿里云的官方公告,本次故障因香港运营商IDC电力问题所致。但是为了保证数据中心7×24小时的不间断运转,像阿里云这样规模的云服务,名气通应该为其配备两个独立的变电站或者一个变电站二个独立仓位出来的供电线路,也就是双路供电。这样即使其中一条线路出现电力故障,数据中心也可以瞬间切换到另一条供电线路,用户根本察觉不到影响。
就算是遇到了不可预料的重大自然灾害,两条供电线路都被切断,那么也用不着惊慌,因为数据中心可以通过备用的柴油发电机为机房供电。
如果“屋漏偏逢连夜雨”,连柴油发电机也出现了故障……好吧,那就只有靠最后一招——UPS了。不过考虑到大型数据中心不断攀升的功耗,这可撑不了多久。
正是因为有着完备的防范措施,所以在正常情况下像电力故障这类问题,数据中心通常只需要几分钟就可以解决,这也是业内人士对阿里云香港机房断电12小时普遍感到“难以置信”的原因。因此有资深人士推测,在宕机事故的背后可能还有更深层次的因素,譬如出现了难以维修的控电设备故障、备用柴油发电机故障、阿里云与名气通之间的协调沟通不畅导致工作效率较低、修复进度受阻等等。
关于数据中心应该自建还是外包这个问题,业界一直众说纷纭,莫衷一是。就在上个月,针对Zynga先租用亚马逊云服务、再自建数据中心、而后又关闭数据中心重新使用亚马逊一事,我还写了一篇《两小儿辩云:数据中心该自建还是外包?》做了一番调侃。目前看来,在香港宕机事件发生之后,关于数据中心是否应该自建这个话题的争论势必还将继续下去。











