阿里云回应史上最大规模宕机故障:存在四大问题!
12月18日,阿里云香港Region可用区C发生大规模服务中断事件,对很多客户业务产生重大影响,影响面扩大到香港可用区C的EBS、OSS、RDS等更多云服务。
一般来说,云服务器宕机只需要一个小时左右便能恢复,而阿里云这次宕机从18日早上8点56分首次检测到故障警告,到次日凌晨0点30分所有服务恢复正常,历时超过15个半小时。
这无疑是阿里云运营十多年来持续时间最长的一次大规模故障。
12月18日,阿里云第一时间对客户进行事件原因分析和维护的进展更新,同时态度诚恳并明确表态,对于受本次故障影响的产品,阿里云将根据相关产品的SLA协议进行赔付。
12月25日,阿里云发布关于阿里云香港Region可用区C服务中断事件的说明,对故障情况进行了详细说明,并公布了整个处理过程,对问题进行了详细分析,还提出了改进措施。声明中阿里云表示,要向所有受到故障影响的客户公开致歉,并尽快处理赔偿事宜。
阿里云的公告显示,冷机系统故障恢复时间过长、现场处置不及时导致触发消防喷淋、客户在香港地域新购ECS等管控操作失败、故障信息发布不够及时透明是导致此次宕机时间长、规模大的四大重要原因。
值得注意的是,此次出故障的机房并非阿里云自建数据中心,而是租用的香港电讯盈科公司机房。目前,阿里云所租用的香港电讯盈科公司机房已修复制冷设备故障,阿里云香港地域所有可用区云产品功能已经全部恢复正常。对于受本次故障影响的产品,阿里云将根据相关产品的SLA协议进行赔付。
作者:梅雅鑫
责编/版式:沈新竹
审核:申晴
监制:刘启诚

关注公众号:拾黑(shiheibook)了解更多
赞助链接:
关注数据与安全,洞悉企业级服务市场:https://www.ijiandao.com/
四季很好,只要有你,文娱排行榜:https://www.yaopaiming.com/
让资讯触达的更精准有趣:https://www.0xu.cn/

随时掌握互联网精彩
- TIOBE 8 月编程语言排行榜:没有一门语言能比得上 Python!
- 工信部:加强手机等移动智能终端技术规范引导,持续做好未成年人网络保护相关工作
- 大量用户反馈 QQ 账号被盗;AirPods Pro2 或支持查找功能;Spring Boot 2.7.1发布|极客头条
- 如何在72.9万款游戏中脱颖而出
- 中国5G给人留“车尾灯” 2至4年行业应用初具规模
- 确定性叠加高速增长:中兴通讯股价强势涨停
- 提前泄露小米10至尊版,博主赔偿100万;传字节跳动实习生删除GB以下所有机器学习模型;快手宣布7月将取消大小周|极客头条
- 荣耀50系列官宣定档6月16日,360已启动造车
- 浪潮联合电信研发边缘一体化云柜,助力5G价值最大化
- 米聊复活了?小米还推出一款对标Clubhouse的应用
- 【大公司创新情报】中国移动与中国广电启动“5G战略”合作
- Surface 会客厅|从不画脸却能圈粉无数,呼葱觅蒜的创作秘密是……?