
Ba khoảnh khắc của Anthropic: Rò rỉ mã nguồn, đối đầu với chính phủ và việc vũ khí hóa
Tuyển chọn TechFlowTuyển chọn TechFlow

Ba khoảnh khắc của Anthropic: Rò rỉ mã nguồn, đối đầu với chính phủ và việc vũ khí hóa
Công ty này, lấy “an toàn” làm điểm bán hàng, đang biến câu chuyện về an toàn thành một hào bảo vệ thương mại, và thực chất điều họ muốn giành giật chính là dữ liệu người dùng đang nằm trong tay Microsoft cùng các đối thủ khác.
Tác giả: Ben Thompson
Biên dịch: TechFlow
Giới thiệu của TechFlow: Mô hình mới Fable của Anthropic vừa ra mắt được hai tháng đã bị chính phủ Mỹ khẩn cấp đình chỉ. Lý do bề ngoài là “rò rỉ an ninh”, nhưng thực chất sự việc phơi bày cuộc chiến kép giữa các phòng thí nghiệm AI với chính phủ và với ngành phần mềm. Công ty vốn lấy “an ninh” làm điểm bán hàng đang biến câu chuyện an ninh thành hào lũy thương mại — còn mục tiêu thực sự họ nhắm tới chính là dữ liệu người dùng đang nằm trong tay Microsoft và những đối thủ tương tự.
Tôi hiểu lập trường của những người chế giễu: họ luôn cho rằng tuyên bố công khai của Anthropic — đặc biệt là những phát ngôn đi kèm việc ra mắt mô hình — nhằm gieo rắc nỗi sợ hãi vì mục đích tiếp thị. Hai tháng trước, Anthropic công bố Mythos Preview, khẳng định mô hình này quá nguy hiểm để công khai, nhất là khả năng bảo mật mạng mạnh mẽ của nó. Sau đó, hai tháng sau, công ty lại công bố Fable — bản Mythos đã được trang bị thêm nhiều lớp bảo vệ an ninh.
Theo trải nghiệm hạn chế của tôi, Fable quả thực là một mô hình xuất sắc. Hiện nay, ngoài hiệu năng lập trình, rất khó đánh giá khách quan một mô hình; tuy nhiên cảm nhận chủ quan thì vẫn có. Tôi thấy trải nghiệm tương tác với Fable cực kỳ ấn tượng — khiến các mô hình khác, kể cả GPT-5.5 và Opus-4.8, đều trông nhỏ bé và ngớ ngẩn. Trước đây tôi chỉ từng có cảm giác như vậy hai lần: một lần với GPT-4, một lần với Grok-4 — cả hai đều đại diện cho thế hệ mới về quy mô và độ phức tạp của mô hình nền tảng; tôi tin Fable bắt nguồn từ một đợt huấn luyện sơ bộ hoàn toàn mới, và là mô hình đầu tiên của thế hệ mới này.
Vì vậy, tôi hoàn toàn chấp nhận khả năng Fable/Mythos thực sự vượt trội hơn trong việc nhận diện và khai thác các vấn đề an ninh, và việc Anthropic thận trọng ra mắt là hợp lý. Tuy nhiên, vấn đề khi công khai mô hình là các lớp bảo vệ có thể bị vượt qua (jailbreak), và rõ ràng điều này đã xảy ra ngay sau khi mô hình được phát hành.
Anthropic một lần nữa đối đầu với chính phủ Mỹ
Điều xảy ra sau đó vẫn chưa rõ ràng. Trong bài blog của mình, Anthropic viết:
Chính phủ Mỹ viện dẫn quyền lực an ninh quốc gia để ban hành lệnh kiểm soát xuất khẩu, tạm dừng toàn bộ quyền truy cập vào Fable-5 và Mythos-5 đối với mọi công dân nước ngoài, bất kể họ đang ở trong hay ngoài lãnh thổ Hoa Kỳ — kể cả nhân viên nước ngoài của Anthropic. Thực tế, lệnh này buộc chúng tôi phải đột ngột vô hiệu hóa Fable-5 và Mythos-5 đối với toàn bộ khách hàng nhằm tuân thủ pháp luật. Việc truy cập vào tất cả các mô hình Anthropic khác không bị ảnh hưởng.
Chúng tôi nhận được lệnh từ chính phủ lúc 17 giờ 21 phút giờ miền Đông Hoa Kỳ hôm nay. Thư không nêu chi tiết cụ thể về những lo ngại an ninh quốc gia. Chúng tôi hiểu chính phủ cho rằng đã phát hiện phương pháp vượt qua hoặc “jailbreak” Fable-5. Chúng tôi đã xem xét các minh họa sử dụng kỹ thuật cụ thể này để xác định một số lượng nhỏ lỗ hổng đã biết. Các lỗ hổng này đều trông khá đơn giản, và chúng tôi phát hiện các mô hình công khai khác cũng có thể tìm ra chúng mà không cần jailbreak.
Anthropic sau đó lập luận rằng các trường hợp jailbreak phi tổng quát là điều không thể tránh khỏi và phạm vi tác động rất hạn chế; không có bằng chứng nào cho thấy tồn tại jailbreak tổng quát. Những trường hợp jailbreak được phát hiện dường như do Amazon báo cáo — điều đáng chú ý bởi Amazon vừa là nhà đầu tư của Anthropic, vừa là nhà cung cấp dịch vụ suy luận chính cho công ty. Khi tôi viết bài này, các lãnh đạo Anthropic đang ở Washington D.C., cố gắng giải quyết vấn đề mà họ khẳng định là một sự hiểu lầm, trong khi các quan chức Nhà Trắng ám chỉ rằng ban lãnh đạo công ty đã thờ ơ trước những lo ngại hợp pháp về an ninh quốc gia.
Với quá nhiều sự kiện còn gây tranh cãi, tôi thực sự chẳng có gì để bổ sung thêm về xung đột hiện tại; song tôi hoàn toàn không ngạc nhiên khi xung đột này xảy ra — tôi đã giải thích trong bài viết “Anthropic và sự đồng thuận (alignment)” rằng mâu thuẫn giữa chính phủ Mỹ và Anthropic là điều tất yếu. Về phương diện này, những người cho rằng Mythos chưa đủ mạnh để xứng đáng khiến chính phủ hành động mạnh đã bỏ lỡ trọng tâm: nếu bây giờ chưa đủ mạnh, thì mô hình kế tiếp sẽ là, hoặc mô hình sau đó — đặc biệt khi các mô hình ngày càng hữu ích hơn trong việc tạo ra những người kế nhiệm.
Tuy nhiên, điều này đặt ra một câu hỏi khác — một câu hỏi dường như xác nhận quan điểm của những người chế giễu: Nếu Mythos nguy hiểm đến thế, sao ban đầu lại công bố Fable? Vì sao lại chống đối chính phủ để làm điều mà bạn tuyên bố muốn làm? Thực tế, tôi cho rằng hành vi của Anthropic hoàn toàn dễ hiểu; điều đặc biệt của công ty nằm ở cách họ biện minh cho những hành vi ấy — chính những lời biện minh này vừa cung cấp nhiên liệu cho giới chế giễu, vừa tạo nên “phép màu” cho Anthropic.
Tính tất yếu kinh tế
Trong những năm đầu của AI, giá trị kinh tế lớn nhất chảy về phía sức mạnh tính toán (compute), điều hiển nhiên vì: nguồn cung không đủ đáp ứng nhu cầu, dẫn đến giá tăng vọt; những bên hưởng lợi lớn nhất là NVIDIA, TSMC và các nhà sản xuất bộ nhớ (SK Hynix, Samsung và Micron). Trong khi đó, Anthropic và OpenAI cộng lại đã thua lỗ hàng chục tỷ đô la để xây dựng các mô hình tiên tiến, rồi sau khi công bố, các mô hình này nhanh chóng bị các mô hình mã nguồn mở “chưng cất” và trở thành hàng hóa, chủ yếu đến từ Trung Quốc.
Đây là kịch bản bi quan dành cho các phòng thí nghiệm — chúng sẽ mãi không thể bù đắp chi phí, bởi sự khác biệt hóa của chúng chỉ mang tính tạm thời, còn các lựa chọn miễn phí dần trở nên “đủ tốt” — theo tôi, đây là đánh giá hợp lý. Trong một thế giới nơi các mô hình có thể thay thế lẫn nhau, mô hình trở thành hàng hóa, và phần lớn giá trị chuyển sang nơi khác. Hiện tại là sức mạnh tính toán, nhưng theo thời gian, khi chúng ta có đủ sức mạnh tính toán, vị trí có giá trị nhất trong chuỗi giá trị sẽ luôn là vị trí vốn luôn có giá trị nhất: sở hữu điểm tiếp cận người dùng.
Vì vậy, các phòng thí nghiệm tiên tiến có tính tất yếu kinh tế phải tiến gần hơn tới người dùng — điều này từ lâu đã rất rõ ràng với tôi. Nếu bạn sở hữu điểm tiếp cận người dùng, bạn sẽ có mức độ khóa (lock-in) có ý nghĩa; và cách tốt nhất để sở hữu điểm tiếp cận người dùng là trở thành “bức tranh nền” (canvas) cho mọi việc họ cần làm. Điều này đồng nghĩa với việc các phòng thí nghiệm tiên tiến đang tiến tới xung đột với các công ty phần mềm: chính phần mềm nắm giữ điểm tiếp cận người dùng, còn lợi ích dài hạn của các phòng thí nghiệm tiên tiến không đơn thuần là trở thành đầu vào hàng hóa cho phần mềm, mà là thay thế trực tiếp phần mềm.
Đồng thời, các công ty phần mềm lại đang nỗ lực làm điều ngược lại. Satya Nadella trong một bài đăng trên X đã trình bày tầm nhìn về cách các công ty nên xây dựng trên nền tảng mô hình:
Mỗi công ty đều phải xây dựng cái tôi gọi là “vốn con người” và “vốn token”. Vốn con người bao gồm kiến thức, khả năng phán đoán, mối quan hệ, tính sáng tạo và khả năng nhận diện mẫu của nhân viên; còn vốn token là năng lực AI do công ty xây dựng và sở hữu. Điều quan trọng là khi vốn token tăng lên, vốn con người sẽ không trở nên kém giá trị hơn — mà ngược lại, sẽ càng trở nên quý giá hơn! Tôi tin rằng chủ động của con người sẽ là động lực thúc đẩy vốn token tăng trưởng. Con người sẽ đặt ra các mục tiêu đầy tham vọng, kết nối các điểm xuyên lĩnh vực, thiết lập mối quan hệ và nhận diện những mẫu quan trọng nhất. Không có sự hướng dẫn của con người, sức mạnh tính toán của bạn sẽ chỉ chạy “không tải”.
Điều này có nghĩa cơ hội thực sự không nằm ở việc chọn mô hình tốt nhất, mà ở việc xây dựng vòng lặp học tập trên nền tảng mô hình, để vốn con người và vốn token cùng tăng trưởng theo cấp số nhân. Bạn có thể thuê ngoài một nhiệm vụ, thậm chí cả một công việc, nhưng bạn không bao giờ có thể thuê ngoài quá trình học tập của mình. Tương lai của một công ty nằm ở khả năng để quá trình học tập này tăng trưởng theo cấp số nhân giữa con người và AI. Điều này đòi hỏi một phương pháp kiến trúc mới, giúp mỗi doanh nghiệp có thể xây dựng hệ thống tác tử thông minh ngày càng cải tiến theo thời gian, đồng thời vẫn duy trì quyền kiểm soát tài sản trí tuệ của mình. Các công ty nên có khả năng thay đổi mô hình “tổng quát”, mà không mất đi chuyên môn “lão làng” nội bộ đã được tích hợp vào hệ thống học tập của họ. Đây chính là “kiểm tra” then chốt về quyền kiểm soát và chủ quyền trong kỷ nguyên sắp tới.
Nadella mở đầu tầm nhìn này bằng một cảnh báo:
Điều mà chúng ta đều không mong muốn là một thế giới nơi mỗi công ty trong mọi ngành đều nhường toàn bộ giá trị cho một vài mô hình nuốt chửng tất cả. Nếu toàn bộ giá trị chỉ thuộc về một vài mô hình, nền kinh tế-chính trị sẽ không dung thứ điều đó. Xã hội sẽ không chấp nhận một tương lai AI làm tê liệt toàn bộ ngành công nghiệp.
Hãy nghĩ đến điều đã xảy ra trong giai đoạn đầu của toàn cầu hóa, khi toàn bộ nền kinh tế công nghiệp bị “ngoại xử” làm trống rỗng. Về mặt số liệu GDP trông có vẻ ổn, nhưng tình trạng thất nghiệp là có thật, và hậu quả vẫn còn cảm nhận đến ngày nay. Hãy đừng mang động lực này vào kỷ nguyên AI, để một vài hệ thống AI chiếm trọn mọi khoản lợi nhuận kinh tế, trong khi toàn ngành công nghiệp phát hiện tri thức của họ đang bị hàng hóa hóa ngay trước mắt.
Vấn đề của phép so sánh này là: toàn cầu hóa thực sự đã xảy ra, và nền kinh tế công nghiệp thực sự đã bị làm trống rỗng. Điều này có thể không phải là lời cảnh báo, mà là lời tiên tri; không ngạc nhiên khi Nadella đang gióng hồi chuông báo động, bởi Microsoft có thể là một trong những nạn nhân. Cũng tương tự, tính tất yếu kinh tế của các nhà sản xuất mô hình chính là hiện thực hóa điều này.
Tính tất yếu dữ liệu
Các mô hình này — thậm chí cả Mythos — vẫn chưa đạt đến bước đó. Ngoài nhu cầu về nhiều sức mạnh tính toán hơn, chúng còn cần nhiều dữ liệu tốt hơn. Việc cải thiện mô hình ngày càng phụ thuộc vào học tăng cường (reinforcement learning); một phần trong số đó có thể được tạo tổng hợp, nhưng đòn bẩy mạnh nhất đối với các phòng thí nghiệm tiên tiến chính là việc sử dụng trong thực tế.
Tôi cho rằng đây là lý do chính khiến cả OpenAI và Anthropic đều cung cấp các gói đăng ký được trợ giá mạnh. Gần đây SemiAnalysis ước tính rằng gói 200 đô la Mỹ sẽ mang lại cho bạn giá trị 8.000 đô la Mỹ token Claude và 14.000 đô la Mỹ token Codex. Dĩ nhiên cả hai đều đang cạnh tranh để giành thị phần người dùng và nhà phát triển, nhưng đồng thời họ cũng đang cạnh tranh để tiếp cận dữ liệu sử dụng thực tế nhằm cải thiện mô hình.
Anthropic đã tăng cường mạnh mẽ trên Fable, công bố sẽ lưu trữ toàn bộ dữ liệu sử dụng trong 30 ngày — ngay cả với các gói doanh nghiệp trước đây cam kết “không lưu trữ dữ liệu”. Công ty khẳng định sẽ không sử dụng dữ liệu này để huấn luyện, nhưng họ không đưa ra bất kỳ biện pháp đảm bảo nào để ngăn chặn khả năng làm như vậy trong tương lai (ví dụ như lưu trữ dữ liệu tại bên thứ ba). Nếu chính sách này (khi Fable được khôi phục) không dẫn đến việc mất đi lượng lớn khách hàng, tôi nghi ngờ việc họ bắt đầu sử dụng dữ liệu chỉ còn là vấn đề thời gian — bởi điều này quá quan trọng đối với mục tiêu cuối cùng của họ.
Cũng cần lưu ý vòng tuần hoàn tích cực khi tiến gần hơn tới điểm tiếp cận người dùng: càng nhiều luồng công việc được thực hiện trực tiếp bằng Claude hoặc Codex, mỗi công ty càng có nhiều dữ liệu thực tế để phản hồi vào quá trình huấn luyện, từ đó làm sản phẩm của họ mạnh hơn và hữu ích hơn, mở rộng số lượng luồng công việc có thể phục vụ, và mở rộng phạm vi tiếp cận dữ liệu.
Nadella nhấn mạnh tầm quan trọng của dữ liệu này trong bài viết, nhưng một cách tự nhiên ông cho rằng dữ liệu nên độc lập với mô hình:
Các công ty cần chuyển đổi luồng công việc, kiến thức chuyên ngành và phán đoán tích lũy thành các hệ thống AI ngày càng cải tiến sau mỗi lần sử dụng. Đánh giá riêng tư nên đo lường xem mô hình có thực sự cải thiện trên các kết quả quan trọng đối với hoạt động kinh doanh (không chỉ các tiêu chuẩn bên ngoài!). Môi trường học tăng cường riêng tư nên giúp mô hình trở nên mạnh hơn trên các hành trình thực tế trong nội bộ tổ chức. Cơ sở tri thức của nó làm cho ký ức tổ chức có thể truy vấn được, và việc sử dụng token hiệu quả hơn.
Vòng tuần hoàn này trở thành tài sản trí tuệ mới của công ty. Tôi coi nó như một “máy leo núi”. Khác với hầu hết tài sản, nó tăng trưởng theo cấp số nhân. Mỗi luồng công việc được cải tiến đều tạo ra tín hiệu huấn luyện tốt hơn, từ đó đẩy nhanh quá trình tích lũy tri thức ẩn (tacit knowledge) độc đáo của công ty. Những công ty sớm xây dựng được năng lực này sẽ có lợi thế khó sao chép, bất kể khả năng của bất kỳ mô hình đơn lẻ nào trong tương lai.
Vòng tuần hoàn này trở thành tài sản trí tuệ mới của công ty. Tôi coi nó như một “máy leo núi”. Khác với hầu hết tài sản, nó tăng trưởng theo cấp số nhân. Mỗi luồng công việc được cải tiến đều tạo ra tín hiệu huấn luyện tốt hơn, từ đó đẩy nhanh quá trình tích lũy tri thức ẩn (tacit knowledge) độc đáo của công ty. Những công ty sớm xây dựng được năng lực này sẽ có lợi thế khó sao chép, bất kể khả năng của bất kỳ mô hình đơn lẻ nào trong tương lai.
Tuy nhiên, nếu các công ty tuân thủ chính sách dữ liệu của Anthropic ngay từ bây giờ đã có thể đạt được kết quả tốt hơn thì sao? Hoặc nếu các công ty hiện tại kháng cự, thì cơ hội để các công ty mới — hoặc chính các nhà sản xuất mô hình — đánh bại họ trên thị trường sẽ mở ra? Anthropic thực sự đang thử thách quyết tâm mà Nadella kêu gọi.
Khát vọng quyền lực
Chính sách lưu trữ dữ liệu liên quan đến Fable/Mythos thậm chí còn chưa phải phần gây tranh cãi nhất trong đợt ra mắt. Thay vào đó, Anthropic tuyên bố trong thông báo rằng nếu Fable được sử dụng cho việc phát triển LLM, hiệu năng của nó sẽ bị giảm âm thầm; thẻ hệ thống (system card) ghi rõ:
Chúng tôi cũng bổ sung các biện pháp bảo vệ liên quan đến việc phát triển LLM tiên tiến. Như đã thảo luận trong Mục 6.1 của Báo cáo rủi ro tháng 2 năm 2026, chúng tôi lo ngại về rủi ro đẩy nhanh tốc độ phát triển AI nói chung, dù mức độ nghiêm trọng của những rủi ro này vẫn chưa được xác định rõ. Cụ thể, lo ngại của chúng tôi — như đã viết lúc đó — là “việc đẩy nhanh quá trình xây dựng các hệ thống AI mạnh mẽ có rủi ro tương tự hệ thống của chúng tôi bởi các nhà phát triển AI khác — trong khi họ có thể không áp dụng các biện pháp bảo vệ tương ứng.”
Xét đến khả năng gần đây của các mô hình trong việc đẩy nhanh chính quá trình phát triển của chúng, chúng tôi đã triển khai các can thiệp mới nhằm hạn chế hiệu quả của Claude khi xử lý các yêu cầu liên quan đến phát triển LLM tiên tiến (ví dụ như xây dựng đường ống huấn luyện sơ bộ, hạ tầng huấn luyện phân tán hoặc thiết kế bộ tăng tốc ML). Việc sử dụng Claude để phát triển mô hình cạnh tranh vốn đã vi phạm Điều khoản Dịch vụ của chúng tôi, nhưng việc thực thi giới hạn này thông qua các biện pháp bảo vệ giúp ngăn chặn việc đẩy nhanh tiến độ của những đối tượng sẵn sàng vi phạm các điều khoản này nhất.
Khác với các can thiệp của chúng tôi trong lĩnh vực an ninh mạng, hóa sinh học và nỗ lực chưng cất, những biện pháp bảo vệ này không hiển thị với người dùng. Fable-5 sẽ không tự động chuyển sang một mô hình khác. Thay vào đó, các biện pháp bảo vệ sẽ hạn chế hiệu quả thông qua việc sửa đổi prompt, điều hướng vector hoặc tinh chỉnh hiệu quả tham số (PEFT). Các can thiệp này sẽ không ảnh hưởng đến phần lớn công việc lập trình. Chúng tôi ước tính chúng sẽ ảnh hưởng khoảng 0,03% lưu lượng truy cập, tập trung ở dưới 0,1% tổ chức. Khi các can thiệp này có hiệu lực, chúng tôi dự kiến ngoài việc hạn chế hiệu quả phát triển LLM tiên tiến, ảnh hưởng của chúng tới hành vi mô hình là tối thiểu. Claude vẫn sẽ phản hồi hữu ích các yêu cầu của người dùng. Sau khi mô hình này được phát hành, chúng tôi sẽ tiếp tục nâng cao độ chính xác của các phương pháp phát hiện.
Anthropic đã rút lại thay đổi này — Fable sẽ chuyển các yêu cầu liên quan đến LLM sang Opus-4.8 và thông báo rõ việc chuyển tiếp này cho người dùng — nhưng tôi cho rằng chính sách ban đầu rất giàu tính minh họa. Một mặt, tôi thực sự không trách Anthropic vì không muốn hỗ trợ đối thủ; mặt khác, điều rất rõ ràng là Anthropic cho rằng ngoài họ ra, không ai khác nên được phép xây dựng LLM tiên tiến.
Chính sách này càng đáng chú ý hơn khi nó được ban hành chỉ hai tháng sau cuộc tranh cãi giữa Anthropic và Bộ Quốc phòng: bên phía Bộ Quốc phòng muốn sử dụng Claude cho mọi mục đích hợp pháp, trong khi Anthropic muốn áp đặt kiểm soát nghiêm ngặt hơn đối với giám sát và vũ khí tự chủ. Việc hạ cấp hiệu năng này vừa thể hiện khả năng của Anthropic trong việc thay đổi mô hình một cách âm thầm để hiện thực hóa thiên kiến chính sách của mình, vừa thể hiện ý muốn làm điều đó. Nói cách khác, Anthropic đã chủ động xác nhận nỗi lo lớn nhất của một số nhà phê bình về vai trò rủi ro trong chuỗi cung ứng của công ty.
Tuy nhiên, kết luận tổng quát hơn rút ra từ sự kiện này là Anthropic cho rằng họ nên có quyền quyết định cuối cùng về cách sử dụng Claude; và do họ tin rằng chỉ mình họ mới nên phát triển AI tiên tiến, nên thực chất họ cho rằng chỉ mình họ mới nên có quyền quyết định cuối cùng đối với toàn bộ AI. Khi kết hợp nhận thức này với tuyên bố của công ty rằng AI có khả năng thực hiện mọi hoạt động kinh tế, bạn sẽ nhận ra ban lãnh đạo Anthropic thực sự muốn nắm quyền lực đối với mọi thứ và mọi người.
Câu chuyện an ninh
Dĩ nhiên, Anthropic sẽ không bao giờ trình bày điều này một cách thẳng thừng; thay vào đó, câu chuyện được kể dưới góc độ an ninh:
Tôi dự đoán Anthropic sẽ ngày càng công khai khả năng mô hình của mình tới người dùng cuối thông qua các điểm cuối ngày càng được tùy chỉnh cho từng luồng công việc cụ thể, ngay cả khi họ bắt đầu hạn chế API. Việc thay thế phần mềm và hạn chế quyền truy cập này sẽ được thực hiện nhân danh an ninh, ngay cả khi Anthropic đang thực hiện nhu cầu kinh tế của mình nhằm tiến gần hơn tới người dùng cuối.
Giải thích của Anthropic cho việc thay đổi lớn trong chính sách lưu trữ dữ liệu là vì lý do an ninh. Cụ thể, công ty khẳng định việc lưu trữ toàn bộ dữ liệu người dùng trong 30 ngày là cần thiết để ngăn chặn các hành vi “jailbreak” mà chính phủ Mỹ lo ngại. Tôi hoàn toàn có thể hình dung một tương lai khi các yếu tố an ninh buộc họ cũng phải sử dụng dữ liệu này để huấn luyện, nhằm phòng chống tốt hơn các hành vi độc hại.
Toàn bộ câu chuyện khởi nguyên của Anthropic bắt nguồn từ niềm tin của các nhà sáng lập rằng OpenAI chưa coi trọng an ninh đủ nghiêm túc; công ty cho rằng chỉ mình họ mới có khả năng kiểm soát AI, và vì họ đặc biệt quan tâm đến an ninh, nên họ có lý do để cố gắng kiểm soát tất cả những bên khác — kể cả chính phủ Mỹ.
Vấn đề với những lý do an ninh này là: tôi cho rằng chúng hiệu lực, bởi vì với Anthropic, chúng không phải là “lý do”. Công ty thực sự tin rằng họ là những người duy nhất tin vào siêu trí tuệ, do đó là những người duy nhất quan tâm đúng mức đến các mối nguy hiểm. Điều này bào chữa cho từng quyết định, từng chính sách và từng cuộc đối đầu — trong khi đối với người ngoài, những điều này trông giống như sự kết hợp kỳ lạ giữa chủ nghĩa hoài nghi và sự ngây thơ.
Sự so sánh với OpenAI là rất lớn: tôi cho rằng một cách để hiểu OpenAI đã mất vị thế dẫn đầu như thế nào và vì sao, là trong vài năm sau khi ChatGPT ra mắt, công ty này rơi vào tình trạng nội chiến — một phòng thí nghiệm nghiên cứu từng thuần túy bỗng chốc phải gánh vác trọng trách trở thành một công ty công nghệ tiêu dùng bất ngờ; trong quá trình giải quyết xung đột nội bộ này, OpenAI đã để mất một lượng lớn nhân tài cho các công ty như Anthropic.
Ngược lại, Anthropic có sự nhất quán hoàn hảo giữa nhân tài, sứ mệnh và hoạt động kinh doanh. Công ty có thể bán cho các nhà nghiên cứu viễn cảnh tạo ra “thần máy”, kèm theo hào quang của những người quan tâm sâu sắc đến mối nguy hiểm và đủ thông minh để đại diện cho nhân loại đối phó với nó; và mỗi chính sách phát sinh từ đó tình cờ lại phù hợp với lợi ích kinh doanh — đó là sự trùng hợp tuyệt vời nhất trên thế giới.
Tôi vừa kính trọng sự nhất quán này, vừa lo ngại trước nó. Tôi kính trọng nó vì rõ ràng nó rất hiệu quả; ví dụ gần nhất là Apple, công ty luôn khoác áo “làm điều đúng đắn cho người dùng” cho mọi hành động ích kỷ — và thường thì họ thực sự làm như vậy. Anthropic cũng vậy. Tuy nhiên, tôi lo ngại rằng việc để những người thực sự tin rằng mình hiểu rõ nhất về điều gì là tốt cho bạn xây dựng một chiếc điện thoại thông minh mà bạn có thể chấp nhận hoặc từ chối là một chuyện; nhưng việc để họ xây dựng một siêu trí tuệ có tiềm năng sánh ngang hoặc vượt qua quyền lực của một quốc gia dân tộc, hoặc ít nhất là một tập đoàn lớn, thì đáng lo ngại hơn nhiều. Lịch sử của những người thông minh tin chắc rằng mình biết điều gì là cần thiết cho nhân loại vốn đầy rẫy những vết đen, chính bởi vì họ thuyết phục bản thân rằng ý định của mình là tốt đẹp, từ đó biện minh cho những hành động thực tế không hề tốt đẹp như vậy.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News













