
«Tôi hoảng rồi, chuyện gì đang xảy ra?», sự cố của Cloudflare gây rối loạn Internet toàn cầu
Tuyển chọn TechFlowTuyển chọn TechFlow

«Tôi hoảng rồi, chuyện gì đang xảy ra?», sự cố của Cloudflare gây rối loạn Internet toàn cầu
Phân tích cho rằng, sự việc một lần nữa làm nổi bật sự phụ thuộc cao của internet toàn cầu vào một số ít nhà cung cấp cơ sở hạ tầng.
Bài viết: Triệu Vũ Hà
Nguồn: Wall Street Insights
Vào sáng thứ Ba theo giờ miền Đông nước Mỹ, nhà cung cấp dịch vụ hạ tầng internet Cloudflare cho biết mạng lưới toàn cầu của họ đang gặp sự cố bất thường, dẫn đến nhiều trang web, bao gồm cả nền tảng mạng xã hội X, xuất hiện lỗi "internal server error" và các sự cố truy cập khác, khiến người dùng không thể truy cập vào nhiều trang web và dịch vụ, bao gồm bán lẻ, thương mại điện tử, mạng xã hội, dịch vụ tài chính cũng như các nền tảng liên quan đến giao thông. Sau đó công ty tuyên bố đã khắc phục sự cố trong thời gian chưa đầy bốn giờ.

Trong thời gian ngừng hoạt động, một số chức năng của X bị gián đoạn và nhiều trang web khác cũng gặp khó khăn khi truy cập. Theo dữ liệu từ nền tảng theo dõi sự cố Downdetector, ngoài X, rất nhiều trang web khác cũng bị ảnh hưởng, với số lượng báo cáo liên tục tăng lên. Người dùng khi truy cập các trang như X, ChatGPT, DoorDash, IKEA và Cơ quan Vận tải Đô thị New York (MTA) đều thấy các thông báo lỗi liên quan đến Cloudflare.


Sau đó, một phát ngôn viên nữ của Cloudflare cho biết khoảng 6 giờ 20 phút sáng theo giờ miền Đông nước Mỹ, một trong các dịch vụ của họ đã gặp tình trạng tăng đột biến lưu lượng bất thường, gây ra lỗi trong lưu lượng đi qua mạng lưới công ty.
Jackie Dutton, một phát ngôn viên khác của Cloudflare, cho biết trong thông báo rằng sự cố này do một cấu hình tự động được tạo ra nhằm quản lý lưu lượng đe dọa gây ra, và việc khắc phục mất chưa đến bốn giờ. Công ty cho biết đã triển khai các biện pháp sửa chữa trọng tâm nhưng thận trọng lưu ý rằng hệ thống "vẫn cần thêm thời gian để ổn định hoàn toàn".
Dutton cho biết:
"Số lượng mục trong tệp cấu hình này vượt quá kích thước dự kiến, làm sập hệ thống phần mềm xử lý lưu lượng cho một phần dịch vụ của Cloudflare."
Thông báo cho biết không có bằng chứng nào cho thấy sự kiện này liên quan đến tấn công mạng hay hoạt động độc hại.
Phạm vi ảnh hưởng của sự cố rất rộng lớn. Downdetector cho biết trong thời gian Cloudflare ngừng hoạt động, "đã có hơn 2,1 triệu báo cáo về các dịch vụ bị ảnh hưởng thuộc nhiều loại", cho thấy đây là một trong những sự gián đoạn ở cấp độ hạ tầng nghiêm trọng nhất trong những năm gần đây.

Sau sự cố, cổ phiếu của Cloudflare lúc mở cửa phiên giao dịch thứ Ba đã giảm mạnh tới 7%, sau đó thu hẹp mức giảm.

Lĩnh vực tài sản kỹ thuật số cũng có phản ứng. Triệu Trường Bằng, đồng sáng lập và cựu CEO của Binance, đăng bài trên X viết: "Blockchain vẫn hoạt động bình thường (Blockchain kept working)", ám chỉ các hệ thống phi tập trung không bị ảnh hưởng bởi sự kiện lần này.
Đến 12 giờ 15 phút theo giờ miền Đông nước Mỹ, Cloudflare cho biết hệ thống đang dần phục hồi, tuy nhiên một số khu vực trên thế giới vẫn có thể gặp lỗi truy cập, hiệu suất giảm hoặc vấn đề đăng nhập. Công ty sẽ tiếp tục cập nhật tiến độ khắc phục trên trang trạng thái của mình.

Sự phụ thuộc quá mức vào một vài công ty
Gần đây, nhiều lần do các nhà cung cấp hạ tầng kỹ thuật số gặp sự cố mà khiến toàn bộ internet toàn cầu rơi vào tình trạng tê liệt. Amazon Web Services (AWS), CrowdStrike Holdings Inc. và Microsoft từng trải qua các sự cố tương tự, làm nổi bật thực tế rằng internet toàn cầu phụ thuộc rất lớn vào một vài công ty cung cấp dịch vụ.
Các dịch vụ của Cloudflare và AWS gần như "vô hình" đối với người dùng thông thường, nhưng công cụ của họ lại hỗ trợ hàng loạt trang web và dịch vụ mà người tiêu dùng sử dụng hàng ngày.
Tháng trước, sự cố ngừng hoạt động của AWS khiến một phần internet rơi vào tê liệt, khiến hàng triệu người dùng không thể truy cập website và ứng dụng, làm gián đoạn bán lẻ, ngưng trệ mạng xã hội và dịch vụ tài chính, đồng thời ảnh hưởng đến nhiều doanh nghiệp. Năm ngoái, một lỗ hổng trong công cụ do công ty an ninh mạng CrowdStrike sử dụng đã khiến hệ thống máy tính toàn cầu sụp đổ trên diện rộng, gây ra hàng nghìn chuyến bay bị trì hoãn và hủy bỏ, đồng thời làm rối loạn hoạt động của các cơ quan chính phủ và doanh nghiệp lớn.
Graeme Stewart, chuyên gia tại công ty an ninh mạng Check Point Software ở California, cho biết các sự cố như vậy làm nổi bật sự phụ thuộc quá mức của internet vào một vài nhà cung cấp hạ tầng.
Ông nói:
"Nhiều tổ chức vẫn đặt tất cả các dịch vụ trọng yếu trên cùng một tuyến đường duy nhất, và không có phương án dự phòng thực sự hiệu quả. Khi tuyến đường đó gặp sự cố, sẽ không còn giải pháp thay thế nào cả. Đó chính là vấn đề chúng ta liên tục chứng kiến."
Giáo sư an ninh mạng Alan Woodward tại Đại học Surrey cho biết sự cố hôm thứ Ba một lần nữa cho thấy internet phụ thuộc cao độ vào "một vài đối tượng chủ chốt". Ông mô tả Cloudflare là "công ty lớn nhất mà bạn chưa từng nghe tên".
"Con người không còn lựa chọn nào khác ngoài việc phải phụ thuộc vào một vài công ty lớn này."
Giám đốc công nghệ xin lỗi
Giám đốc công nghệ (CTO) của Cloudflare, Dane Knecht, đã xin lỗi vì sự cố này. Ông viết trên X:
"Khi mạng lưới Cloudflare gặp sự cố, ảnh hưởng đến lượng lớn lưu lượng đang phụ thuộc vào chúng tôi, chúng tôi đã làm phụ lòng khách hàng và cả internet. Bản thân sự cố này, tác động do nó gây ra, và thời gian để khắc phục đều là điều không thể chấp nhận được. Chúng tôi đã bắt đầu hành động để đảm bảo điều tương tự sẽ không xảy ra nữa, nhưng tôi biết rằng hôm nay thực sự đã gây rắc rối cho mọi người. Niềm tin của khách hàng đối với chúng tôi là điều quan trọng nhất, và chúng tôi sẽ nỗ lực hết sức để giành lại niềm tin đó."
Cloudflare trong những năm gần đây đã nhiều lần trải qua các sự cố ngừng hoạt động tương tự.
Tháng 7 năm 2019, một lỗ hổng trong phần mềm Cloudflare khiến một số mô-đun mạng lưới chiếm dụng quá nhiều tài nguyên tính toán, khiến hàng ngàn trang web phụ thuộc vào Cloudflare trên toàn cầu, bao gồm Discord, Shopify, SoundCloud và Coinbase, bị ngắt kết nối trong 30 phút. Tháng 6 năm 2022, Cloudflare gặp sự cố ảnh hưởng đến lưu lượng tại 19 trung tâm dữ liệu của họ, khiến nhiều trang web và dịch vụ chính ngừng hoạt động trong khoảng một tiếng rưỡi.
Phần mềm của Cloudflare được sử dụng bởi hàng chục ngàn công ty trên toàn thế giới, đóng vai trò lớp đệm giữa trang web doanh nghiệp và người dùng cuối, nhằm bảo vệ trang web khỏi các cuộc tấn công lưu lượng hoặc sập mạng do lưu lượng đột biến.
Năm ngoái, bản cập nhật phần mềm lỗi của công ty an ninh mạng CrowdStrike đã khiến hàng triệu thiết bị chạy hệ điều hành Microsoft Windows bị sập, gây ra hỗn loạn trên diện rộng trong ngành hàng không, ngân hàng, y tế và nhiều lĩnh vực khác.
Sự cố ngừng hoạt động của CrowdStrike bắt nguồn từ một lỗi trong sản phẩm của họ chạy ở cấp độ sâu nhất trên máy tính khách hàng. Trong khi đó, Cloudflare có nhiệm vụ bảo vệ hạ tầng internet như các trang web và nền tảng, do đó khi Cloudflare ngừng hoạt động, nhiều trang web phổ biến sẽ không thể truy cập trực tiếp hoặc hoạt động bất thường. Cloudflare chủ yếu chịu trách nhiệm "giữ cho các trang web luôn hoạt động và đủ nhanh", trong khi CrowdStrike tập trung vào việc bảo vệ máy tính và máy chủ khỏi các cuộc tấn công.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News










