昨天全球互聯網中斷,世界學到了什麼。
在11月18日,世界目睹了近年來最具破壞性的互聯網中斷之一。主要平台,從社交網絡到人工智能工具、音樂服務、設計平台,甚至狀態儀表板,都短暫地離線。
根本原因追溯到一次故障的Cloudflare更新,這一更新在幾分鍾內波及全球互聯網。
這一事件清楚地提醒我們,今天的數字生態系統已變得多麼深度互聯。
到底發生了什麼?
Cloudflare 的 Bot Management 更新中的一個配置文件意外地超出了其預期的大小。當這個超大的文件在 Cloudflare 的全球網路中同步時,它超載了關鍵系統並觸發了廣泛的 HTTP 500 錯誤。網站在技術上並沒有 "宕機",但是用戶根本無法訪問它們。
由於Cloudflare位於數百萬個網站與用戶之間,過載造成了連鎖反應。DNS查詢下降,API調用失敗,甚至Cloudflare自己的儀表板也難以加載。像X、ChatGPT、Spotify和Canva這樣的大型平台立即感受到了影響。
重要的是,這並不是一次網路攻擊。Cloudflare 確認此次中斷是內部意外造成的,強調了在互聯網規模下運營的復雜性。
Cloudflare是如何修復它的?
一旦確定問題,工程師們回滾了有缺陷的更新,將流量重新引導以穩定過載區域,並逐步恢復服務——CDN 節點、DNS 解析器、WARP、分析等。逐步恢復確保了在恢復期間的穩定性。
接
查看原文