
Karpathy gia nhập, Anthropic gần như đã “dọn sạch” danh sách bạn bè của OpenAI
Tuyển chọn TechFlowTuyển chọn TechFlow

Karpathy gia nhập, Anthropic gần như đã “dọn sạch” danh sách bạn bè của OpenAI
Khi đồng sáng lập OpenAI gia nhập công ty đối thủ với vai trò nhân viên.
Tác giả: David, TechFlow
Một nhân vật từng làm việc tại OpenAI lại vừa gia nhập một công ty khác.
Ngày 19 tháng 5, Andrej Karpathy — cựu đồng sáng lập OpenAI, cựu Giám đốc Trí tuệ nhân tạo (AI) của Tesla và nổi tiếng là “thánh” lập trình theo cảm hứng (Vibe Coding) — chính thức thông báo gia nhập Anthropic.
Karpathy gia nhập OpenAI ngay từ khi công ty được thành lập năm 2015, sau đó chuyển sang làm Giám đốc AI tại Tesla và năm 2024 tự thành lập công ty giáo dục AI mang tên Eureka Labs.
Nói ngắn gọn, đây là một người đã đạt được tự do tài chính, đang điều hành công ty riêng và hoàn toàn không cần phải làm thuê cho bất kỳ ai. Thế nhưng ông vẫn quyết định chuyển công tác.
Điều đặc biệt hơn nữa là, dù ở tầm mức “đại thần”, Karpathy lại không trực tiếp báo cáo công việc với nhà sáng lập Anthropic — Dario Amodei. Theo thông tin chính thức từ Anthropic, ông sẽ báo cáo cho Nick Joseph — người phụ trách mảng huấn luyện sơ bộ (Pre-training) của công ty.
Vị trí và tình thế này nếu đặt trong bối cảnh các tập đoàn công nghệ truyền thống thì chỉ tương đương cấp Giám đốc. Còn cấp quản lý trực tiếp của ông — Nick Joseph — cũng là một cựu nhân viên OpenAI...
Vì vậy, tình hình hiện tại là: một đồng sáng lập OpenAI gia nhập công ty đối thủ với tư cách nhân viên dưới quyền; cấp quản lý trực tiếp của ông cũng là cựu nhân viên OpenAI; còn bản thân nhà sáng lập Anthropic — Dario Amodei — cũng xuất thân từ OpenAI, từng giữ chức Phó Chủ tịch Nghiên cứu tại OpenAI trước khi rời đi.
Thật sự rất thú vị.
Tác giả đã xem qua danh sách nội bộ của Anthropic: từ hai anh em đồng sáng lập Dario và Daniela Amodei, đến John Schulman — cựu đồng sáng lập OpenAI, người đầu năm 2024 chuyển sang Anthropic để phụ trách nghiên cứu về tính phù hợp (alignment); rồi đến Nick Joseph, và mới đây nhất là Karpathy vừa gia nhập…
Công ty này giờ đây giống như một hội cựu sinh viên OpenAI dời địa điểm hoạt động sang chính công ty đối thủ. Nếu như tại Mỹ cũng áp dụng loại “thỏa thuận không cạnh tranh” phổ biến ở các tập đoàn lớn trong nước, thì hôm nay buổi họp mặt của hội cựu sinh viên này có lẽ phải dời sang tòa án.

Đồng sáng lập làm việc dưới quyền cựu đồng nghiệp, chỉ để giúp Claude tự huấn luyện chính mình
Nhiệm vụ cụ thể Karpathy đảm nhận lần này là thành lập một đội ngũ mới. Theo phát ngôn viên Anthropic chia sẻ với truyền thông, mục tiêu của đội nhóm này là «sử dụng chính Claude để đẩy nhanh tiến độ nghiên cứu huấn luyện sơ bộ».
Hiểu một cách đơn giản: để AI tự huấn luyện AI.
Thông thường, giai đoạn huấn luyện sơ bộ là khâu tốn kém nhất và đòi hỏi nhiều năng lực tính toán nhất trong quá trình xây dựng mô hình lớn, đồng thời cũng quyết định khả năng cốt lõi cuối cùng của mô hình. Trước đây, toàn bộ công việc này hoàn toàn dựa vào con người: các nhà nghiên cứu thiết kế phương án huấn luyện, kỹ sư triển khai các tác vụ huấn luyện quy mô lớn, còn hiệu quả thì phải chờ vài tháng sau mới biết.

Đội nhóm mà Karpathy sẽ dẫn dắt lần này sẽ tích hợp chính Claude vào quy trình huấn luyện thế hệ Claude tiếp theo. Nói cách khác, một phần công việc nghiên cứu và phát triển thế hệ Claude kế tiếp sẽ do chính thế hệ Claude hiện tại thực hiện.
Nếu hướng tiếp cận này thực sự thành công, tốc độ tiến hóa của AI sẽ không còn tăng theo dạng tuyến tính nữa. Jack Clark — đồng sáng lập Anthropic — từng đề cập tới hướng đi này đầu tháng 5, khẳng định rằng ông «ngày càng có xu hướng tin tưởng» rằng việc AI thúc đẩy chính quá trình nghiên cứu và phát triển AI đang diễn ra ngày càng nhanh chóng.
Quay trở lại với Karpathy: Một người vốn không thiếu tiền, không thiếu danh tiếng, không thiếu cơ hội nghề nghiệp, lại còn đang điều hành một công ty khởi nghiệp giáo dục AI — vì sao ông lại sẵn sàng làm việc dưới quyền một cựu đồng nghiệp?
Giải thích duy nhất hợp lý là ông tin rằng việc AI tự huấn luyện sẽ đặc biệt quan trọng trong vài năm tới — quan trọng đến mức ông sẵn sàng gác lại mọi thứ khác để tập trung làm việc này, đồng thời lĩnh vực này cũng hoàn toàn phù hợp với sở thích và năng lực của ông.
Thiếu năng lực tính toán? Hãy gọi “đại thần”!
Việc để AI tự huấn luyện bản thân thực tế xuất phát từ những nguyên nhân thương mại.
Đầu tháng 5, Dario Amodei thừa nhận một sự thật khá “khó nói” trong hội nghị dành cho nhà phát triển của công ty: Doanh thu và lượng sử dụng sản phẩm của Anthropic trong quý I tăng vọt gấp 80 lần so với cùng kỳ năm ngoái — trong khi kế hoạch ban đầu chỉ dự kiến tăng 10 lần.
Tốc độ tăng trưởng vượt xa dự báo tới 8 lần khiến công ty hoàn toàn chưa chuẩn bị đủ năng lực tính toán. Hệ quả trực tiếp là các phiên bản trả phí của Claude — gồm Claude Pro, Claude Max và Claude Code — đều gặp phải tình trạng giới hạn lưu lượng truy cập ở các mức độ khác nhau, khiến người dùng trả phí phàn nàn dữ dội.
Lý do rất đơn giản: GPU thực sự không đủ dùng. Trong vài tháng qua, công ty gần như “cuồng mua” năng lực tính toán.
Giao dịch ấn tượng nhất là hợp đồng ký ngày 6 tháng 5 với SpaceX của Elon Musk. Theo CNBC đưa tin, Anthropic đã giành toàn bộ năng lực sản xuất của trung tâm dữ liệu Colossus 1 thuộc sở hữu SpaceX. Colossus 1 tọa lạc tại Memphis, bang Tennessee, được trang bị hơn 220.000 card GPU NVIDIA và có công suất điện vượt quá 300 megawatt — đủ để cung cấp điện cho 300.000 hộ gia đình.
Điều mỉa mai ở đây là Colossus 1 vốn được Musk xây dựng dành riêng cho công ty AI xAI của chính ông. Trong khi đó, hồi tháng Hai năm nay, Musk còn đăng trên X (Twitter) gọi Anthropic là «misanthropic» (kẻ ghét loài người). Việc hai bên có thể ngồi lại đàm phán làm ăn chỉ vì Musk lúc này đang kiện OpenAI.
“Kẻ thù của kẻ thù là nhà cung cấp năng lực tính toán” — điều này cũng rất hợp lý.
Bên cạnh hợp đồng với SpaceX, Anthropic còn ký thỏa thuận hợp tác cung cấp năng lực tính toán tối đa 5 gigawatt với Amazon; ký thêm một hợp đồng 5 gigawatt nữa với Google và Broadcom; đạt được thỏa thuận trị giá 30 tỷ USD với Microsoft và NVIDIA; đồng thời đầu tư 50 tỷ USD cùng Fluidstack để xây dựng hạ tầng tại Mỹ.

Những con số này nghe có vẻ chi tiêu rất mạnh tay. Tuy nhiên, một báo cáo của IDC công bố tháng Năm chỉ ra rằng, xét về năng lực tính toán chuyên biệt dành riêng cho huấn luyện mô hình, Anthropic hiện vẫn thua OpenAI một khoảng cách đáng kể.
Cách vận hành của OpenAI rất rõ ràng: dồn mọi nguồn lực vào năng lực tính toán, vào trung tâm dữ liệu, vào số lượng tham số. Con đường này Anthropic chắc chắn không thể theo kịp.
Vì vậy, việc để AI tự huấn luyện AI là lựa chọn bắt buộc duy nhất của Anthropic. Sử dụng một GPU một cách thông minh hơn cũng tương đương với việc mua thêm một GPU. Vì thế, mời “đại thần” Karpathy về đây chính là để dùng trí tuệ tiết kiệm những chiếc GPU mà công ty không thể mua được.
Trong số 11 đồng sáng lập OpenAI, giờ chỉ còn 2 người
Nếu Karpathy sánh được với cả một trung tâm dữ liệu, thì việc OpenAI mất đi ông không chỉ đơn thuần là mất đi một cá nhân.
Hơn nữa, chuyện này không bắt đầu từ Karpathy.
Anthropic ngay từ đầu đã là một công ty do nhóm người từng làm việc tại OpenAI thành lập. Năm 2021, OpenAI đồng loạt mất bảy nhân sự chủ chốt, bao gồm Phó Chủ tịch Nghiên cứu, Phó Chủ tịch Chính sách An toàn, kỹ sư chính phụ trách GPT-3, hai tác giả bài báo nổi tiếng về định luật mở rộng (scaling laws), nhân vật tiên phong trong nghiên cứu khả năng giải thích (interpretability) và Giám đốc phụ trách chính sách. Họ cùng nhau đăng ký thành lập một công ty mang tên Anthropic.
Đây cũng là lý do giới bên ngoài đùa rằng công ty này là «Hội cựu sinh viên OpenAI».
Sau đó, liên tục có người gia nhập bổ sung. Năm 2024 là John Schulman — đồng sáng lập OpenAI và Jan Leike — cựu Trưởng phòng Nghiên cứu về tính phù hợp; năm nay là Karpathy và cấp quản lý trực tiếp của ông — Nick Joseph — cùng một loạt nhà nghiên cứu khác ít nổi tiếng hơn nhưng cũng rất then chốt.
Nhóm người này không phân tán đi các công ty khác để khởi nghiệp riêng. Họ cùng đổ dồn về một nơi duy nhất. Quan trọng hơn, họ không hề có ý định quay lại.
Theo các báo cáo công khai, lý do cốt lõi khiến nhóm người này rời OpenAI năm 2021 là bất đồng quan điểm về việc công ty đẩy mạnh thương mại hóa quá nhanh trong khi nghiên cứu an toàn chưa theo kịp. Năm năm sau, OpenAI nhận được hàng chục tỷ USD đầu tư từ Microsoft, biến ChatGPT thành một sản phẩm tiêu dùng đại chúng, và tháng Năm năm nay thậm chí còn tích hợp nền tảng quản lý quảng cáo vào ChatGPT — bất kỳ doanh nghiệp nào tại Mỹ giờ đây đều có thể chạy quảng cáo trực tiếp trên ChatGPT.
Còn những người từng rời đi vì công ty thương mại hóa quá nhanh cách đây 5 năm, thì ngày hôm nay lại càng không có lý do nào để quay đầu.
Nếu phóng tầm nhìn rộng hơn, trong số 11 đồng sáng lập OpenAI ban đầu, hiện chỉ còn lại 2 người vẫn đang làm việc tại công ty: CEO Sam Altman và Tổng Giám đốc điều hành Greg Brockman. Chín người còn lại đều đã rời đi dưới nhiều hình thức khác nhau.
Năm 2024, những người rời đi gần như chiếm trọn toàn bộ ban lãnh đạo cấp cao của OpenAI: CTO Mira Murati, Nhà khoa học trưởng Ilya Sutskever, Trưởng phòng Nghiên cứu về tính phù hợp Jan Leike và đồng sáng lập John Schulman đều tuyên bố rời đi trong cùng năm đó. Năm 2025 lại tiếp tục có thêm 12 lãnh đạo cấp cao ra đi, cộng với 7 nhà nghiên cứu chủ chốt bị Meta “chiêu mộ” tập thể vào mùa hè.
Những người này hoặc tự thành lập các công ty liên quan đến AI, hoặc gia nhập các đối thủ như Anthropic — tuy nhiên gần như không ai rời ngành để chuyển sang lĩnh vực khác, cũng gần như không ai chọn quay trở lại OpenAI.
Anthropic trông có vẻ là bên hưởng lợi lớn nhất từ làn sóng di cư này. Nhưng gốc rễ của hiện tượng này có lẽ nằm ở phía OpenAI. Karpathy không phải người đầu tiên đến, và cũng có thể sẽ không phải người cuối cùng.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














