7月6号上午,蓝鲸TMT曝出消息称阿里云北京机房内网发生故障 ,导致大量互联网公司业务受到影响 。
经专业人士相识 确认,这次故障是阿里云方面的题目 ,阿里云工作职员 表现 ,10点20分阿里云北京区开始出现故障 ,靠近 11点20分规复 正常。
阿里云的故障已有多次
想必对阿里云认识 的人对阿里云故障题目 并不陌生 ,已往 几年内,我们不绝 看到阿里云曝出题目 。可查的消息表现 阿里云的故障非常多:
印象比力 深的是 ,2015年9月1日,阿里云客户发出的全部 根本 下令 都不能运行。末了 阿里表明 是:一个产物 升级触发bug导致了用户ECS里的部分 正常文件被误隔离 。
2015年6月21日,阿里云在中国香港的节点发生高出 12小时克制 服务的变乱 。阿里云的表明 是:阿里云香港服务瘫痪12小时重要 是由于 机房建立 方和运营商名气通电力故障 ,阿里云直到电力故障发生近12个小时后才得以进入机房抢修。
别的 博客园官方博客指出尚有 反复 不为大多数人发现的故障:
2013年7月23日10:00~11:00,1小时RDS故障
2013年7月23日19:14~19:19,5分钟RDS故障
2013年7月24日18:20~18:50 ,30分钟SLB故障
2013年7月26日11:37~11:40,3分钟RDS故障
我们看到,阿里云每次出现题目 的缘故起因 都不尽雷同 ,抑或是操纵 故障,抑或是施工水电故障,这表现 出云盘算 的脆弱的一面 。
客岁 9月,时任阿里CTO的王坚谈到故障题目 时是这么说的 ,安全题目 是广泛 存在的,阿里云是中国公共云服务范畴 的前锋 ,因而不得不为厥后 者付出全部代价 ,最大的教导 是代价非常高昂。
当故障出现以后
每当题目 出现的时间 ,用户群会出现两种声音,一种是 ,还好有多台服务器,业务没有全部受到影响,但别的 一部分 人就没这么荣幸 了 ,很多 用户业务也是全套摆设 在阿里云,并没有异地备份。
也有的用户表现 ,由于 比力 信托 阿里云 ,以是 把全部业务都摆设 在阿里上,但是由于 每天 服务器都做异地备份,数据库每小时备份一次,固然 数据量有点大 ,异地传输存在耽误 时间,但是至少丧失 会低落 。
阿里有看似很诱人的补偿 方式——百倍补偿 。但也有人质疑,有效 户表现 ,按12小时盘算 ,十台服务器不外 万八块钱。尚有 网友表现 ,假如 用户买了365天的服务时间 ,故障了1周7天,按照百倍补偿 算是700天,但阿里也只要补偿 365天 。
尚有 一种声音在质疑阿里推行的补偿 战略 ,到底应不应该补偿 ,业内好像 也没有同一 的说法。
但我们清楚 的是,假如 故障影响了某一时候 的业务举行 ,造成的丧失 很大概 是这些补偿 完全不能补充 的。
不能完全否定云盘算 ,但能做些什么呢?
越来越多的人选择了云盘算 服务,包罗 许很多 多大型的公司,既能节流 开支 ,也能加快 业务发展进度,云盘算 是局面 所趋 。云盘算 期间 的IT服务非常会合 ,大型互联网服务供应商一旦出现题目 带来的影响将非常大 ,时常成为消息 核心 。
客岁 五月末,携程的技能 故障导致12小时宕机,为我们敲起了安全信息防护的警钟。
纵然 是台甫 鼎鼎的AWS也有出故障的时间 ,2015年,9月20日,美国东海岸亚马逊网络服务(AWS)出了故障 ,5小时后才规复 。
尚有 网络搜刮 引擎巨头谷歌于2013年16日下战书 故障约5分钟,包罗 搜刮 、邮件等网络服务短暂克制 运作,这段期间环球 网络流量锐减约40% ,谷歌丧失 估计近55万美元 。
不能回避云盘算 自身的题目 ,也不应该过渡追捧云盘算 ,不能由于 一次故障就通盘 否认,但是可以思量 从技能 本领 做出发起 。
比如 当一个用户在把全部 业务摆设 到上面的时间 ,云服务商能给出提示,大概 别的更换 的办理 方案,把这作为备用战略 推行 ,这是一条办理 题目 的可选办法。
假如 有这种智能化的保举 和发起 体系 的话也是提拔 服务品格 的一条路径 。
在之前的一次采访中,一家创业公司的CEO向笔者表现 ,很多 时间 我们的技能 需求阿里云并不能满意 ,大概 说在碰到 题目 的时间 不能及时 得到 专家的技能 支持,对于阿里这种规模的云盘算 服务商来讲,很多 时间 不能很好地照顾中小客户的需求。
提拔 服务品格 是阿里云如许 的大型服务商必要 留意 的一个题目 。
关于DOIT
DOIT是中国领先的科技新媒体 ,始于2003年,关注科技与数据经济,洞察IT走向DT 。