(原標題:阿里云宕一次機,會賠多少錢?)
張文絞/國是直通車
3月3日凌晨,阿里云出現(xiàn)宕機故障。
受宕機故障影響,華北不少互聯(lián)網(wǎng)公司APP、網(wǎng)站紛紛癱瘓,一大波程序員、運營和運維不得不從被窩里爬起來干活。
更重要的是,這已經(jīng)不是阿里云第一次出現(xiàn)故障。
網(wǎng)友“上海藍盟網(wǎng)絡(luò)夏立成”調(diào)侃,“阿里云一年一宕機,今年特別早”。
而在宕機驚魂之后,人們需要思考宕機故障何以屢屢發(fā)生,事后該如何賠償?
驚魂三小時
針對阿里云此次宕機,58高級架構(gòu)師沈劍稱,事故持續(xù)了3個小時左右,事后觀察了2個小時。
宕機最直接的影響是,購買阿里云服務(wù)的企業(yè)網(wǎng)站或APP無法正常使用。
如果說“無法使用”還是一個抽象名詞,那么受影響的企業(yè)能夠提供比較具象的理解。
孔夫子舊書網(wǎng)3日發(fā)布聲明稱,由于阿里云大規(guī)模故障,導致孔網(wǎng)暫時無法使用。言外之意,在宕機的這段時間內(nèi),用戶將無法在孔網(wǎng)購買商品。
再比如同日發(fā)布聲明的即嗨比分(一家足球賽事直播應(yīng)用平臺)稱,阿里云宕機導致即嗨部分模塊出現(xiàn)卡頓現(xiàn)象,即用戶體驗出現(xiàn)下降。
依次類推,阿里云出現(xiàn)故障面積越大,受影響的企業(yè)和用戶也就越多。
在宕機故障發(fā)生大約1小時后,阿里云官方回應(yīng)稱,華北2地域可用區(qū)C部分ECS服務(wù)器等實例出現(xiàn)IO HANG,經(jīng)緊急排查處理后逐步恢復。
中新社國是直通車查詢阿里云官網(wǎng)顯示,阿里云服務(wù)從地域上可以分為亞太、歐洲與美洲、中東與印度三大塊,而具體到亞太又包括華北、華東、華南、香港等13個分區(qū)。
阿里云官網(wǎng)截圖
“華北2地域可用區(qū)C部分”,即華北地域中的一處。
通常,為了降低網(wǎng)絡(luò)時延、提高客戶訪問速度,企業(yè)會選擇購買靠近客戶的地域。
因此,此次宕機故障發(fā)生后,“華北可謂是亂成一鍋粥”。
而隨著越來越多企業(yè)及應(yīng)用將數(shù)據(jù)搬上云端,服務(wù)器上的每一個小小的宕機,都可能引發(fā)一場大災(zāi)難。
阿里云歷次宕機
作為國內(nèi)最大的云服務(wù)商,這并不是阿里云第一次宕機。
2018年6月,阿里云出現(xiàn)大規(guī)模訪問異常,圖片服務(wù)等產(chǎn)品無法正常使用,官網(wǎng)賬號也無法登陸。官方公布,該故障是因為運維上的一個操作失誤。事后,阿里云表示,將敬畏每一行代碼,敬畏每一份托付。
2016年10月,阿里云華東1地域可用區(qū)B部分也曾發(fā)生過ECS服務(wù)器IO HANG的事故。
再往前,2015年9月,阿里云云盾的安騎士產(chǎn)品升級觸發(fā)bug導致了用戶ECS里的部分正常文件被誤隔離。原因是,程序員寫錯了一行代碼。也是在當年,阿里云啟動了“百倍時間賠償計劃”。
另有媒體統(tǒng)計,2012年、2013年、2014年阿里云都曾出現(xiàn)不同程度的故障。
據(jù)市場研究機構(gòu)IDC日前報告,阿里云市場份額位居中國第一,占比達到43%,相當于第二至第九名的總和。排名其后的分別是,騰訊云、中國電信、AWS、金山云、Ucloud、微軟、百度云和華為云。
如此大體量,阿里云每次的宕機都會給客戶帶來不小影響。
與其給客戶帶來的負面影響相反,阿里云憑借中國大市場已經(jīng)躋身全球云服務(wù)領(lǐng)先地位。
阿里巴巴1月30日公布財報顯示,阿里云營收規(guī)模為213.6億元,4年間增長約20倍,成為亞洲最大的云服務(wù)公司。上一年,這一數(shù)字為111.7億元。
宕機如何賠償?
在此次宕機事件發(fā)生后,阿里云表示,將根據(jù)SLA協(xié)議,盡快處理賠償事宜。
“SLA協(xié)議”即,服務(wù)等級協(xié)議(Service Level Agreement,簡稱 “SLA”)。根據(jù)阿里云官網(wǎng)資料顯示,對于單ECS實例,如服務(wù)可用性低于99.95%,用戶可獲得月度服務(wù)費10%、25%、100%不等的賠償。
阿里云官網(wǎng)截圖
此外,華為云、騰訊云的賠償標準均與此相似。
一位云計算企業(yè)工程師告訴中新社國是直通車,云服務(wù)發(fā)生故障的賠償基本以“送時間”為主。比如此前,阿里云就執(zhí)行過“百倍時間賠償”。
阿里云官網(wǎng)截圖