北京時(shí)間 10 月 20 日 15 時(shí) 30 分,一場始于亞馬遜 AWS US-EAST-1 區(qū)域的服務(wù)故障,迅速演變?yōu)橄砣虻臄?shù)字服務(wù)危機(jī) —— 核心 NoSQL 數(shù)據(jù)庫服務(wù) DynamoDB 出現(xiàn)嚴(yán)重中斷,不僅導(dǎo)致 AWS 自身多項(xiàng)功能癱瘓,更讓依賴其架構(gòu)的 Epic、任天堂等巨頭的在線服務(wù)陷入停擺,數(shù)百萬玩家與用戶被迫面對 “無法登錄”“功能報(bào)錯(cuò)” 的困境。

作為 AWS 生態(tài)的 “數(shù)據(jù)中樞”,DynamoDB 的癱瘓直接擊中了全球大量互聯(lián)網(wǎng)服務(wù)的命脈。這款完全托管的無服務(wù)器數(shù)據(jù)庫,憑借高性能、低延遲的特性,被廣泛用于存儲用戶數(shù)據(jù)、游戲進(jìn)度、服務(wù)配置等核心信息 —— 小到 APP 的用戶登錄狀態(tài),大到游戲的匹配系統(tǒng)數(shù)據(jù),都依賴其穩(wěn)定運(yùn)行。而此次 US-EAST-1 區(qū)域的中斷,并非簡單的 “短暫卡頓”:根據(jù)用戶反饋,DynamoDB 不僅無法響應(yīng)數(shù)據(jù)讀寫請求,連后臺監(jiān)控面板都無法正常加載,AWS 官方也在故障發(fā)生 1 小時(shí)后才發(fā)布 “服務(wù)降級” 公告,此前大量開發(fā)者因無法通過 AWS 支持中心創(chuàng)建案例,甚至無法及時(shí)反饋問題,進(jìn)一步加劇了危機(jī)應(yīng)對的滯后性。
故障的影響迅速從云服務(wù)層傳導(dǎo)至用戶端,游戲領(lǐng)域首當(dāng)其沖。Epic Games 的在線生態(tài)幾乎全面受創(chuàng):《堡壘之夜》玩家登錄時(shí)普遍遭遇 “代碼:LS-0013” 報(bào)錯(cuò),無法進(jìn)入匹配隊(duì)列;《彩虹六號圍攻》則出現(xiàn) “服務(wù)器連接超時(shí)” 問題,已登錄的玩家也會被強(qiáng)制踢出游戲;而面向青少年的創(chuàng)作平臺《Roblox》更直接顯示 “服務(wù)暫時(shí)不可用”,全球超千萬活躍用戶被迫下線。任天堂的在線服務(wù)同樣未能幸免,Switch 玩家發(fā)現(xiàn)無法登錄任天堂賬號,《馬里奧賽車 8 豪華版》《Splatoon 3》等聯(lián)機(jī)游戲的匹配功能完全失效,部分玩家甚至無法加載本地存檔 —— 這些問題的根源,正是任天堂北美地區(qū)的用戶數(shù)據(jù)、聯(lián)機(jī)匹配邏輯均依賴 US-EAST-1 區(qū)域的 DynamoDB 存儲與調(diào)用。
除了游戲領(lǐng)域,北美地區(qū)的互聯(lián)網(wǎng)服務(wù)也遭受 “連環(huán)打擊”。亞馬遜自家的 Prime Video 無法加載影片列表,用戶點(diǎn)擊播放后僅顯示 “加載失敗”;智能助手 Alexa 則出現(xiàn) “無法響應(yīng)指令” 的情況,部分用戶反饋連基礎(chǔ)的 “設(shè)置鬧鐘”“查詢天氣” 功能都無法使用。更嚴(yán)重的是,AWS 支持體系自身也陷入癱瘓:用戶無法通過 AWS 支持中心提交故障工單,支持 API 同樣無法創(chuàng)建案例,這意味著企業(yè)客戶即便發(fā)現(xiàn)業(yè)務(wù)異常,也難以通過官方渠道獲取幫助,只能在社交平臺上自發(fā)交流故障應(yīng)對經(jīng)驗(yàn),形成 “問題無法上報(bào)、故障無法溯源” 的惡性循環(huán)。
從技術(shù)層面來看,DynamoDB 的核心特性本應(yīng)是 “高可用性”—— 其內(nèi)置的多區(qū)域復(fù)制、自動備份功能,理論上能抵御單一區(qū)域的故障。但此次中斷暴露了部分企業(yè) “過度依賴單一區(qū)域” 的隱患:許多廠商為降低成本,未啟用 DynamoDB 的跨區(qū)域?yàn)?zāi)備功能,導(dǎo)致 US-EAST-1 區(qū)域一旦癱瘓,便無備用數(shù)據(jù)節(jié)點(diǎn)可切換。例如有獨(dú)立開發(fā)者透露,其團(tuán)隊(duì)為節(jié)省每月數(shù)百美元的跨區(qū)域復(fù)制費(fèi)用,僅在 US-EAST-1 部署了數(shù)據(jù)庫,此次故障直接導(dǎo)致旗下 APP 完全停服,損失難以估量。
截至北京時(shí)間 18 時(shí) 30 分,AWS 官方仍未公布故障的具體原因,僅表示 “正在全力修復(fù) DynamoDB 服務(wù)”,部分區(qū)域的讀寫功能已逐步恢復(fù),但游戲與視頻平臺的服務(wù)仍未完全穩(wěn)定。這場故障再次敲響警鐘:隨著全球數(shù)字服務(wù)對云廠商的依賴度不斷加深,單一區(qū)域的服務(wù)中斷,已足以引發(fā)跨行業(yè)、跨地區(qū)的連鎖反應(yīng),而企業(yè)在追求云服務(wù)便利性的同時(shí),如何構(gòu)建更穩(wěn)健的災(zāi)備體系,將成為未來必須面對的課題。





























浙公網(wǎng)安備 33010502007447號