亚马逊云计算数据中心遭雷击更多细节

来源:赛迪网  
2011/8/17 10:08:13
上周,本站报道了亚马逊在都柏林数据中心遭雷击的事件,当时亚马逊表示数据中心需要10天左右时间来维修。本周,亚马逊发布了一份详细的事故报告。

上周,本站报道了亚马逊在都柏林数据中心遭雷击的事件,当时亚马逊表示数据中心需要10天左右时间来维修。本周,亚马逊发布了一份详细的事故报告。

为什么发电机无法启动

一般来说,当市电中断时,数据中心会无缝启用备用发电机。可编程逻辑控制器(PLC)能够实现发电机与供电系统的同步。在这种情况下,其中一个PLC没有完成与发电机连接。目前,亚马逊观测了该PLC的状态和行为,主要原因是PLC的接地故障导致它没有正常工作。“我们正在与供应商,并进行进一步分析,以确认所涉及的设备。”亚马逊表示,将增加更多的冗余和其PLC的隔离,并与供应商的工作添加一个备份的PLC。

管理软件存在的问题

在一些情况下,软件程序会管理复杂的复苏过程。第一次停电后不久。“管理服务器接收请求,要求继续管理受影响区域。但由于在受影响的可用性区域管理服务器无法访问,路由到这些服务器的请求失败。其次,在管理服务器接收到请求,但这些请求开始大量的排队。“我们重载管理服务器接收请求,等待这些排队的请求完成。这两个因素的结合,导致长时间的延时和更高的错误发生。”

EBS软件的问题

在停机中,受影响最严重是亚马逊的弹性块存储(EBS)。软件错误检测到停电前,在恢复过程中产生了诸多问题。

责编:陈慧
vsharing微信扫一扫实时了解行业动态
portalart微信扫一扫分享本文给好友

著作权声明:畅享网文章著作权分属畅享网、网友和合作伙伴,部分非原创文章作者信息可能有所缺失,如需补充或修改请与我们联系,工作人员会在1个工作日内配合处理。
最新专题
IT系统一体化时代来了

2009年Oracle 用Exadata服务器告诉企业,数据中心的IT服务一体化解决方案才是大势所趋,而当前企业对大数据处理的..

高性能计算——企业未来发展的必备..

“天河二号”问鼎最新全球超级计算机500强,更新的Linpack值让世界认识到了“中国速度”。但超算不能只停留于追求..

    畅享
    首页
    返回
    顶部
    ×
      信息化规划
      IT总包
      供应商选型
      IT监理
      开发维护外包
      评估维权
    客服电话
    400-698-9918