Cloudflare周二突發全球網絡故障,導致X、ChatGPT、DoorDash、IKEA等大量網站無法訪問,累計超210萬用戶上報異常。公司稱問題源於威脅流量配置文件異常膨脹,耗時不到四小時修複後,問題已經解決。分析稱,事件再次凸顯全球互聯網對少數基礎設施廠商的高度依賴。
美東時間周二早間,互聯網基礎設施服務商Cloudflare表示,其全球網絡正在遭遇異常,導致包括社交媒體平台X在內的大量網站出現“internal
server
error”等訪問故障,用戶無法訪問許多網站和服務,包括零售、電商、社交媒體、金融服務以及交通相關平台。該公司隨後聲稱,在耗時不到四小時後已修複問題。

宕機期間,X的部分功能中斷,多家網站也陷入訪問受阻。根據故障跟蹤平台Downdetector的數據,除X之外,也有大量站點受到影響,相關報告數量持續攀升。用戶在訪問X、ChatGPT、DoorDash、IKEA,以及紐約市大都會運輸署(MTA)等網站時,都看到與Cloudflare相關的錯誤信息。


隨後,Cloudflare的一位女發言人表示,在美東時間早上6點20分左右,他們的某項服務出現了異常的流量激增,導致經過公司網絡的流量出現錯誤。
Cloudflare另一位發言人Jackie
Dutton在公告中說,這個問題是由一個用於管理威脅流量、自動生成的配置文件引起的,修複耗時不到四小時。公司表示已經部署了核心修複措施,但謹慎指出係統“仍需時間完全穩定”。
Dutton表示:
“這個文件的條目數量超過了預期大小,觸發了負責處理Cloudflare部分服務流量的軟件係統崩潰。”
聲明稱,沒有證據顯示此次事件與網絡攻擊或惡意活動有關。
故障的影響範圍極為廣泛。Downdetector在平台上表示,在Cloudflare宕機期間,“各類受影響服務的報告累計超過210萬條”,顯示此次事件已成為近年來較為嚴重的一次基礎設施級別中斷。

事故發生後,Cloudflare的股價周二開盤一度暴跌7%,隨後跌幅收窄。

數字資產行業也出現反應。幣安聯合創始人、前CEO趙長鵬在X上發文稱:“區塊鏈依然正常運行(Blockchain kept
working)”,暗示去中心化係統未受此次事件影響。
到美東時間12:15,Cloudflare表示係統正在逐步恢複,但全球部分區域仍可能出現訪問錯誤、性能下降或登錄問題。公司將在狀態頁麵持續更新修複進度。

對少數公司過於依賴
近年來,多次因為數字基礎設施供應商出現問題,導致全球互聯網使用陷入癱瘓。亞馬遜雲服務(AWS)、CrowdStrike
Holdings Inc.和微軟公司先後出現過類似事故,也突顯全球互聯網在很大程度上依賴於少數公司提供服務。
Cloudflare和AWS的服務對普通用戶來說幾乎是“隱形”的,但它們的工具支撐著消費者每天使用的大量網站和服務。
上個月AWS的宕機讓互聯網部分區域陷入癱瘓,導致數百萬用戶的網站和應用無法使用,零售銷售受阻,社交媒體和金融服務中斷,很多企業也受到影響。去年,網絡安全公司CrowdStrike所使用的一項工具中的漏洞更是讓全球的電腦係統大麵積崩潰,引發數千次航班延誤和取消,也讓政府機構和大型企業的運營陷入混亂。
加州網絡安全公司Check Point Software的專家Graeme
Stewart表示,這類事故凸顯了互聯網對少數幾家基礎設施提供商的過度依賴。
他說:
“很多機構依然讓所有關鍵服務都依賴同一條路徑,而且沒有真正有效的備份。一旦這條路徑出問題,就沒有任何後備方案。這就是我們一直看到的問題。”
薩裏大學(University of Surrey)網絡安全教授Alan
Woodward表示,周二的故障再次說明互聯網高度依賴“少數玩家”。他把Cloudflare形容為“你從未聽說過的最大公司”。
“人們別無選擇,隻能依賴這些少數大公司。”
首席技術官道歉
Cloudflare首席技術官Dane Knecht為這次事故道歉。他在X上寫道:
“當Cloudflare網絡出現問題,影響到依賴我們的海量流量時,我們辜負了客戶,也辜負了整個互聯網。這個問題本身、造成的影響、以及解決所花的時間,都是不可接受的。我們已經開始著手確保類似情況不會再次發生,但我知道今天確實給大家帶來了麻煩。客戶對我們的信任最為重要,我們會盡一切努力贏回這份信任。”
Cloudflare在過去幾年曾多次經曆類似宕機。
2019年7月,Cloudflare軟件中的一個漏洞導致網絡部分模塊過度占用計算資源,使全球數千家依賴Cloudflare的網站(包括Discord、Shopify、SoundCloud以及Coinbase)離線長達30分鍾。2022年6月,Cloudflare發生故障,影響其19個數據中心的流量,導致多個主要網站和服務癱瘓,持續約一個半小時。
Cloudflare的軟件被全球數十萬家公司使用,作為企業網站與終端用戶之間的緩衝層,用於保護網站免受流量攻擊或流量突發導致的宕機。
去年,網絡安全公司CrowdStrike發布的錯誤軟件更新導致運行微軟Windows係統的數百萬台設備崩潰,給航空、銀行、醫療等眾多行業造成大範圍混亂。
CrowdStrike的這次宕機源於其產品中一個在客戶電腦最底層運行的錯誤。而Cloudflare的作用是保護互聯網基礎設施,如網站和平台,因此當Cloudflare宕機時,許多熱門網站會直接無法訪問或出現異常。Cloudflare主要負責“讓網站始終在線且速度夠快”,而CrowdStrike專注於保護電腦和服務器免受攻擊。
