
AI vì sao cũng cần ngủ?
Tuyển chọn TechFlowTuyển chọn TechFlow

AI vì sao cũng cần ngủ?
Người thông minh biết khi nào nên nghỉ ngơi.
Tác giả: Thang Nhất Đào
Biên tập: Tĩnh Vũ
Nguồn: GeekPark
Ngày 31 tháng 3 năm 2026, Anthropic đã vô tình rò rỉ 510.000 dòng mã nguồn của Claude Code lên kho npm công khai do sai sót trong quá trình đóng gói. Chỉ trong vài giờ, mã này đã bị sao chép sang GitHub và không thể thu hồi được nữa.
Nội dung bị rò rỉ rất phong phú; các nhà nghiên cứu an ninh và đối thủ cạnh tranh đều khai thác theo nhu cầu riêng. Tuy nhiên, trong số tất cả các tính năng chưa ra mắt, có một cái tên đã gây tranh luận rộng rãi — autoDream (tạm dịch: “Tự động mơ”).
autoDream là một phần của hệ thống nền tảng thường trực mang tên KAIROS (tiếng Hy Lạp cổ, nghĩa là “khoảnh khắc thích hợp”).
KAIROS liên tục quan sát và ghi lại hoạt động của người dùng trong khi họ làm việc, đồng thời duy trì nhật ký hàng ngày (có chút tương đồng với cơ chế “tôm hùm”). autoDream chỉ khởi động sau khi người dùng tắt máy tính, để tổng hợp những ký ức tích lũy trong ngày, loại bỏ mâu thuẫn và chuyển đổi những quan sát mơ hồ thành sự thật rõ ràng.
Hai hệ thống này tạo thành một chu kỳ hoàn chỉnh: KAIROS “thức”, autoDream “ngủ” — các kỹ sư Anthropic đã thiết kế cho AI một lịch sinh học riêng.
Trong hai năm qua, câu chuyện được quan tâm nhất trong ngành AI là Agent: tự vận hành liên tục, không bao giờ ngừng nghỉ — điều này được coi là lợi thế cốt lõi của AI so với con người.
Thế nhưng, chính công ty đẩy khả năng Agent tới mức sâu nhất lại tự thiết lập thời gian nghỉ ngơi cho AI ngay trong mã nguồn của mình.
Tại sao?
Chi phí của việc vận hành liên tục
Một AI vận hành không ngừng sẽ đụng phải một bức tường.
Mỗi mô hình ngôn ngữ lớn đều có một “cửa sổ ngữ cảnh”, tức là giới hạn vật lý về lượng thông tin mà mô hình có thể xử lý cùng lúc. Khi Agent vận hành liên tục, lịch sử dự án, sở thích người dùng và nhật ký hội thoại ngày càng dồn nén; khi vượt ngưỡng tới hạn, mô hình bắt đầu quên các chỉ thị ban đầu, mâu thuẫn nội tại và bịa đặt sự thật.
Cộng đồng kỹ thuật gọi hiện tượng này là “suy thoái ngữ cảnh”.
Nhiều giải pháp ứng phó của Agent khá thô bạo: nhét toàn bộ lịch sử vào cửa sổ ngữ cảnh, trông chờ mô hình tự phân biệt trọng yếu. Kết quả là thông tin càng nhiều, hiệu suất càng giảm.
Bộ não con người cũng va phải cùng một bức tường ấy.
Toàn bộ trải nghiệm ban ngày được ghi nhanh vào “vùng hải mã”. Đây là vùng lưu trữ tạm thời có dung lượng giới hạn, giống như một tấm bảng trắng. Còn ký ức dài hạn thực sự được lưu ở “vỏ não mới”, nơi có dung lượng lớn hơn nhưng tốc độ ghi chậm hơn.
Nhiệm vụ cốt lõi của giấc ngủ ở người chính là xóa sạch bảng trắng đã đầy và chuyển thông tin hữu ích vào ổ cứng.
Phòng thí nghiệm của Björn Rasch tại Trung tâm Thần kinh học thuộc Đại học Zurich (Thụy Sĩ) đặt tên cho quá trình này là “củng cố hệ thống chủ động” (active systems consolidation).
Các thí nghiệm thiếu ngủ kéo dài lặp đi lặp lại chứng minh rằng: một bộ não không ngừng nghỉ sẽ không trở nên hiệu quả hơn, mà trước tiên là suy giảm trí nhớ, sau đó là suy giảm chú ý, và cuối cùng ngay cả khả năng phán đoán cơ bản cũng sụp đổ.
Chọn lọc tự nhiên vốn tàn nhẫn với mọi hành vi kém hiệu quả, vậy mà giấc ngủ lại không bị đào thải. Từ ruồi giấm đến cá voi, gần như tất cả các loài động vật có hệ thần kinh đều ngủ. Cá heo thậm chí tiến hóa ra kiểu “ngủ bán cầu”, trong đó hai bán cầu não luân phiên nghỉ ngơi — chúng thà phát minh một phương thức ngủ hoàn toàn mới chứ vẫn kiên quyết không từ bỏ giấc ngủ.
Cảnh cá kình, cá nhà táng và cá heo mũi chai nghỉ ngơi dưới đáy bể | Nguồn ảnh: Thư viện Y khoa Quốc gia Hoa Kỳ (United States)
Hai hệ thống trên đều chịu chung một nhóm ràng buộc: khả năng xử lý tức thời có giới hạn, trong khi kinh nghiệm tích lũy thì tăng trưởng vô hạn.
Hai bài làm khác nhau
Trong sinh học có một khái niệm gọi là “tiến hóa hội tụ”: các loài không có quan hệ huyết thống gần, do chịu áp lực môi trường tương tự, có thể độc lập tiến hóa ra các giải pháp giống nhau. Ví dụ kinh điển nhất là cấu trúc mắt.
Cả bạch tuộc và con người đều có mắt dạng máy ảnh: một thủy tinh thể có khả năng điều tiết hội tụ ánh sáng lên võng mạc, một lớp mống mắt kiểm soát lượng ánh sáng đi vào, và cấu trúc tổng thể gần như giống hệt nhau.
So sánh cấu trúc mắt bạch tuộc và con người | Nguồn ảnh: OctoNation
Thế nhưng bạch tuộc thuộc ngành thân mềm, còn con người thuộc ngành động vật có xương sống; tổ tiên chung xa nhất của hai loài sống cách đây hơn 500 triệu năm, thời điểm ấy trên Trái Đất chưa hề tồn tại bất kỳ cơ quan thị giác phức tạp nào. Hai tuyến tiến hóa hoàn toàn độc lập đã dẫn tới gần như cùng một kết quả. Bởi vì để biến ánh sáng thành một hình ảnh sắc nét một cách hiệu quả, các quy luật vật lý hầu như chỉ cho phép duy nhất một cấu trúc dạng máy ảnh: một ống kính có khả năng lấy nét, một mặt phẳng cảm quang để tiếp nhận hình ảnh, và một khẩu độ điều tiết lượng ánh sáng — ba thành phần này không thể thiếu một.
Mối quan hệ giữa autoDream và giấc ngủ ở người có thể thuộc loại này — dưới những ràng buộc tương tự, hai hệ thống có xu hướng hội tụ về cùng một cấu trúc.
Điểm giống nhau nổi bật nhất là cả hai đều **phải hoạt động ngoại tuyến**.
autoDream không thể chạy trong lúc người dùng đang làm việc; nó khởi động như một tiến trình con độc lập, hoàn toàn tách biệt khỏi luồng chính và bị giới hạn nghiêm ngặt về quyền truy cập công cụ.
Bộ não người cũng đối mặt với vấn đề tương tự, nhưng giải pháp còn triệt để hơn: việc chuyển ký ức từ vùng hải mã (bộ nhớ tạm) sang vỏ não mới (bộ nhớ dài hạn) đòi hỏi một loạt nhịp điện não chỉ xuất hiện trong giấc ngủ.
Trong đó quan trọng nhất là “gợn sóng đỉnh” ở hải mã, có nhiệm vụ đóng gói từng đoạn ký ức được mã hóa trong ngày và gửi tới vỏ não; còn “dao động chậm” ở vỏ não và “sóng thoi” ở đồi thị sẽ phối hợp chính xác về mặt thời gian cho toàn bộ quá trình này.
Bộ nhịp này không thể hình thành khi tỉnh táo; các kích thích bên ngoài sẽ phá vỡ nó. Vì vậy bạn không phải ngủ vì mệt, mà là bộ não buộc phải đóng “cửa trước” mới có thể mở “cửa sau”.
Hay nói cách khác, trong cùng một khoảng thời gian, việc thu nhận thông tin và tổ chức cấu trúc thông tin là hai hoạt động cạnh tranh tài nguyên, chứ không bổ trợ lẫn nhau.
Mô hình củng cố hệ thống chủ động trong giấc ngủ. A (di chuyển dữ liệu): Trong giấc ngủ sâu (giấc ngủ sóng chậm), những ký ức vừa được ghi vào “vùng hải mã” (bộ nhớ tạm) sẽ được tái hiện lặp đi lặp lại, nhờ đó dần được chuyển và cố định vào “vỏ não mới” (bộ nhớ dài hạn). B (giao thức truyền tải): Quá trình di chuyển dữ liệu này phụ thuộc vào “cuộc trò chuyện” đồng bộ cao giữa hai vùng. Vỏ não phát ra sóng điện não chậm (đường màu đỏ) như nhịp điều khiển chính. Dưới tác động của đỉnh sóng, vùng hải mã đóng gói các mảnh ký ức thành tín hiệu tần số cao (gợn sóng đỉnh tại đường màu xanh lá cây), đồng thời phối hợp hoàn hảo với sóng mang do đồi thị phát ra (sóng thoi tại đường màu xanh dương). Điều này giống như nhét chính xác dữ liệu ký ức tần số cao vào các khe trống của kênh truyền, đảm bảo thông tin được đồng bộ tải lên vỏ não. | Nguồn ảnh: Thư viện Y khoa Quốc gia Hoa Kỳ (United States)
Điểm thứ hai là cả hai đều không lưu toàn bộ ký ức, mà thực hiện biên tập.
autoDream sau khi khởi động sẽ không lưu giữ toàn bộ nhật ký. Nó trước tiên đọc ký ức hiện có để xác nhận thông tin đã biết, rồi quét nhật ký hàng ngày của KAIROS, đặc biệt xử lý những phần mâu thuẫn với nhận thức trước đây: những ký ức khác với lời nói hôm qua, hoặc phức tạp hơn so với hiểu biết trước đây sẽ được ưu tiên ghi nhớ.
Ký ức đã được sắp xếp sẽ được lưu vào một hệ thống chỉ mục ba tầng: lớp con trỏ nhẹ luôn được tải sẵn, các tệp chủ đề được tải theo yêu cầu, còn toàn bộ lịch sử đầy đủ sẽ không bao giờ được tải trực tiếp. Những sự thật có thể tra cứu trực tiếp từ mã dự án (ví dụ: hàm nào được định nghĩa trong tập tin nào) hoàn toàn không được đưa vào ký ức.
Bộ não người trong giấc ngủ cũng thực hiện gần như đúng việc này.
Một nghiên cứu của Tiến sĩ Erin J. Wamsley, giảng viên Trường Y Harvard, chỉ ra rằng giấc ngủ ưu tiên củng cố những thông tin bất thường — ví dụ như những điều khiến bạn ngạc nhiên, gây dao động cảm xúc hoặc liên quan đến những vấn đề chưa được giải quyết. Trong khi đó, vô số chi tiết đời thường lặp đi lặp lại, không đặc trưng sẽ bị loại bỏ, chỉ giữ lại các quy luật trừu tượng — bạn có thể không nhớ rõ hôm qua trên đường đi làm đã nhìn thấy gì, nhưng bạn chắc chắn nhớ rõ đường đi.
Điều thú vị là ở một điểm, hai hệ thống lại đưa ra lựa chọn khác nhau. Ký ức do autoDream tạo ra trong mã được gán nhãn rõ ràng là “hint” (gợi ý), chứ không phải “truth” (sự thật); mỗi lần Agent sử dụng, đều phải xác minh lại xem gợi ý đó còn đúng hay không, bởi nó biết rõ những gì mình tổng hợp có thể không chính xác.
Bộ não người lại không có cơ chế này. Đó chính là lý do tại sao nhân chứng trong phòng xử án thường đưa ra lời khai sai — họ không cố tình nói dối, mà vì ký ức được ghép nối tạm thời từ các mảnh rời rạc trong não, và sai sót mới là điều bình thường.
Có lẽ tiến hóa chẳng cần trang bị cho bộ não con người một nhãn “độ bất định”. Trong môi trường nguyên thủy đòi hỏi phản ứng thể chất nhanh chóng, tin tưởng ký ức giúp hành động ngay lập tức, còn hoài nghi ký ức sẽ gây do dự — và sự do dự ấy sẽ dẫn tới thất bại.
Nhưng đối với một AI liên tục ra quyết định dựa trên kiến thức, chi phí xác minh là rất thấp, trong khi lòng tự tin mù quáng lại tiềm ẩn nguy hiểm.
Hai bối cảnh khác nhau, dẫn tới hai đáp án khác nhau.
Sự lười biếng thông minh hơn
Trong sinh học tiến hóa, tiến hóa hội tụ nghĩa là hai tuyến tiến hóa độc lập, không trao đổi thông tin trực tiếp, lại hướng tới cùng một đích. Trong tự nhiên không có sao chép, nhưng kỹ sư thì hoàn toàn có thể đọc luận văn.
Khi thiết kế cơ chế “ngủ” này, Anthropic rốt cuộc là vì va phải cùng một “bức tường vật lý” như bộ não người, hay ngay từ đầu họ đã tham khảo khoa học thần kinh?
Trong mã nguồn bị rò rỉ không hề có trích dẫn nào từ tài liệu khoa học thần kinh, và cái tên autoDream cũng mang đậm chất đùa cợt của một lập trình viên. Động lực mạnh mẽ hơn hẳn có lẽ chính là các ràng buộc kỹ thuật: cửa sổ ngữ cảnh có giới hạn cứng, vận hành lâu dài gây tích tụ nhiễu, còn việc xử lý trực tuyến sẽ làm ô nhiễm luồng suy luận chính. Họ đang giải một bài toán kỹ thuật, và mô phỏng sinh học chưa bao giờ là mục đích.
Thực tế, chính sức ép nén từ các ràng buộc đó mới quyết định hình dáng của đáp án.
Trong hai năm qua, định nghĩa về “trí tuệ mạnh hơn” trong ngành AI gần như luôn chỉ hướng theo một chiều duy nhất — mô hình lớn hơn, cửa sổ ngữ cảnh dài hơn, tốc độ suy luận nhanh hơn, và vận hành liên tục 7×24. Hướng đi luôn là “nhiều hơn”.
Sự tồn tại của autoDream lại gợi mở một mệnh đề khác: một trí tuệ thông minh có thể là một trí tuệ… lười biếng hơn.
Một trí tuệ không bao giờ dừng lại để tự tổ chức lại chính mình sẽ không trở nên ngày càng thông minh hơn, mà chỉ ngày càng hỗn loạn hơn.
Bộ não người, sau hàng trăm triệu năm tiến hóa, đã rút ra một kết luận trông có vẻ vụng về: trí tuệ phải có nhịp điệu — tỉnh táo để cảm nhận thế giới, ngủ để hiểu thế giới. Khi một công ty AI, trong quá trình giải bài toán kỹ thuật, độc lập đi tới cùng một kết luận ấy, điều đó có thể đang ngầm báo hiệu:
Trí tuệ tồn tại một số chi phí cơ bản không thể tránh khỏi.
Có lẽ, một AI không bao giờ ngủ không phải là một AI mạnh hơn. Nó chỉ đơn giản là một AI chưa nhận ra rằng mình cần phải ngủ.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














