
DeepSeek, tại sao khiến những người làm AI phương Tây ai nấy đều lo sợ?
Tuyển chọn TechFlowTuyển chọn TechFlow

DeepSeek, tại sao khiến những người làm AI phương Tây ai nấy đều lo sợ?
Đây sẽ không phải là mô hình AI Trung Quốc cuối cùng đe dọa vị thế thống trị của các gã khổng lồ Thung lũng Silicon.
Tác giả: Carl Franzen
Biên dịch: TechFlow
Chỉ vài ngày trước, DeepSeek – một công ty AI của Trung Quốc, là công ty con của High-Flyer Capital Management (một công ty phân tích định lượng được thành lập năm 2015) có cái tên khá độc đáo – chỉ được biết đến trong cộng đồng những người đam mê công nghệ chuyên sâu (và tôi cũng là một trong số đó). Tuy nhiên, trong vài ngày qua, nó có thể đã trở thành công ty được quan tâm nhất tại Thung lũng Silicon.
Điều này chủ yếu nhờ vào việc ra mắt DeepSeek-R1, một mô hình ngôn ngữ lớn (LLM) mới có khả năng "suy luận" tương tự như mô hình hàng đầu hiện nay của OpenAI, o1 – tức là dành ra vài giây hoặc vài phút để trả lời các câu hỏi khó và giải quyết các vấn đề phức tạp, thông qua việc suy nghĩ từng bước hay còn gọi là "chuỗi tư duy", tự phản ánh lại quá trình phân tích của chính mình.
Không chỉ vậy, DeepSeek-R1 đạt điểm bằng hoặc cao hơn so với o1 của OpenAI trên nhiều bài kiểm tra đánh giá độc lập (benchmark) đo hiệu suất trả lời câu hỏi của AI trên nhiều lĩnh vực khác nhau, trong khi chi phí huấn luyện được cho là chỉ khoảng 5 triệu USD và sử dụng số lượng bộ xử lý đồ họa (GPU) ít hơn rất nhiều so với số lượng bị cấm vận nghiêm ngặt bởi Mỹ (quê hương của OpenAI).
Tuy nhiên, khác với o1 – chỉ mở cho người dùng đăng ký trả phí ChatGPT Plus (20 USD/tháng) và các cấp độ cao hơn như Pro (200 USD/tháng), DeepSeek-R1 được phát hành hoàn toàn dưới dạng mã nguồn mở, điều này giải thích vì sao nó nhanh chóng vươn lên vị trí dẫn đầu về mức độ phổ biến và hoạt động tích cực nhất trên cộng đồng chia sẻ mã AI Hugging Face.
Hơn nữa, do được mở mã nguồn hoàn toàn, người dùng đã tinh chỉnh và huấn luyện lại mô hình này theo nhiều cách khác nhau để phục vụ các nhiệm vụ cụ thể, ví dụ như thu nhỏ kích thước mô hình để chạy được trên thiết bị di động, hoặc kết hợp với các mô hình mã nguồn mở khác. Ngay cả khi bạn muốn dùng cho mục đích phát triển, chi phí API của DeepSeek cũng thấp hơn 90% so với mô hình o1 tương đương của OpenAI.
Ấn tượng hơn cả là bạn thậm chí không cần phải là kỹ sư phần mềm để sử dụng nó: DeepSeek cung cấp miễn phí trang web và ứng dụng di động cho người dùng Mỹ, với giao diện chatbot do R1 điều khiển trông rất giống với ChatGPT của OpenAI. Tuy nhiên, DeepSeek một lần nữa vượt mặt OpenAI khi kết nối mô hình suy luận mạnh mẽ này với tìm kiếm trên mạng – điều mà OpenAI hiện chưa làm được (hiện tại tính năng tìm kiếm mạng chỉ khả dụng trên các mô hình GPT yếu hơn).
Một nghịch lý rõ ràng
Xét rằng ban đầu OpenAI đặt mục tiêu dân chủ hóa AI cho đại chúng, thì ở đây tồn tại một nghịch lý khá thú vị, hoặc có thể nói là đáng lo ngại. Như Jim Fan, nhà quản lý nghiên cứu cấp cao của Nvidia, đã viết trên X: “Chúng ta đang sống trong một dòng thời gian mà một công ty không phải của Mỹ đang tiếp nối sứ mệnh ban đầu của OpenAI – nghiên cứu tiên phong thực sự mở, trao quyền cho mọi người. Điều này thật vô lý. Nhưng những kết quả thú vị nhất thường lại là những điều có khả năng xảy ra cao nhất.”
Cũng như người dùng X @SuspendedRobot nhận xét (trích dẫn các báo cáo cho rằng DeepSeek dường như đã được huấn luyện trên dữ liệu đầu ra hỏi-đáp do ChatGPT tạo ra và các dữ liệu khác): “OpenAI ăn cắp dữ liệu từ toàn bộ internet để làm giàu cho bản thân, còn DeepSeek lại ăn cắp từ họ rồi trả lại miễn phí cho công chúng – điều này khiến tôi nhớ đến một truyện dân gian Anh.”
Meta rơi vào khủng hoảng vì Llama thua xa về mô hình mã nguồn mở?
Nhưng không chỉ riêng Jim Fan nhận thấy thành công của DeepSeek. Dựa trên những cuộc trò chuyện và đọc hiểu của tôi với nhiều kỹ sư, chuyên gia tư duy và lãnh đạo, tính sẵn có mã nguồn mở của DeepSeek-R1, hiệu suất cao và việc nó dường như "bỗng dưng xuất hiện" để thách thức vị thế dẫn đầu trước đây của các công ty AI tạo sinh đã gây chấn động khắp Thung lũng Silicon và cả bên ngoài. Nếu không phải tất cả mọi người đều điên cuồng như tiêu đề phóng đại của tôi, thì ít nhất đây cũng là chủ đề nóng trong giới công nghệ và kinh doanh.
Một tin nhắn được đăng trên Blind (ứng dụng chia sẻ tin đồn ẩn danh tại Thung lũng Silicon) đang lan truyền rộng rãi, ám chỉ rằng Meta đang rơi vào khủng hoảng vì thành công của DeepSeek đã nhanh chóng vượt qua nỗ lực của chính Meta nhằm trở thành ông vua AI mã nguồn mở thông qua mô hình Llama.

“Điều này thay đổi toàn bộ luật chơi”
Người dùng X @tphuang đưa ra quan điểm thuyết phục: “DeepSeek đã thực hiện việc hàng hóa hóa AI ở mức độ cao nhất ngoại trừ đỉnh cùng. Hình ảnh đầu tiên khiến tôi tỉnh ngộ. R1 rẻ hơn rất nhiều so với lao động ở Mỹ, điều này có nghĩa là trong vòng 5 năm tới, nhiều công việc sẽ bị tự động hóa thay thế.” Sau đó anh ấy còn chỉ ra lý do tại sao R1 của DeepSeek hấp dẫn người dùng hơn o1 của OpenAI:
“o1 có 3 vấn đề lớn:
1) Quá chậm
2) Quá đắt
3) Người dùng cuối thiếu quyền kiểm soát / phụ thuộc quá mức vào OpenAI.
R1 giải quyết được tất cả những vấn đề này. Các công ty có thể mua GPU của Nvidia để tự chạy các mô hình này, không lo về chi phí phát sinh hay tình trạng máy chủ OpenAI phản hồi chậm/chậm trễ.”
@tphaung còn đặt ra một câu hỏi so sánh đầy gợi mở: “Liệu DeepSeek có trở thành Android trong lĩnh vực LLM không?”
Doanh nhân mạng Arnaud Bertrand trên X đã thẳng thắn nói về tác động đáng kinh ngạc từ thành công của DeepSeek: “Mức độ thay đổi luật chơi mà điều này mang lại không thể nào nhấn mạnh quá mức. Đây không chỉ liên quan đến AI, mà còn là một sự mỉa mai to lớn đối với nỗ lực sai lầm của Mỹ nhằm ngăn chặn sự phát triển công nghệ của Trung Quốc – nếu không có những hạn chế này, DeepSeek có thể đã không xuất hiện (như câu tục ngữ nói: nhu cầu là mẹ của sáng chế).”
Vấn đề kiểm duyệt
Tuy nhiên, cũng có những cảnh báo về sự trỗi dậy nhanh chóng của DeepSeek, khi cho rằng với tư cách là một startup hoạt động tại Trung Quốc, công ty chắc chắn phải tuân thủ luật pháp và yêu cầu kiểm duyệt nội dung của nước này. Thực tế, khi tôi dùng phiên bản iOS của DeepSeek tại Mỹ, tôi nhận thấy nó từ chối trả lời một số câu hỏi.
Là một thành viên của giới truyền thông, tôi tất nhiên rất coi trọng quyền tự do ngôn luận và tự do biểu đạt – một trong những nguyên tắc cơ bản mà tôi kiên định ủng hộ.
Tuy nhiên, tôi cũng phải thừa nhận rằng các mô hình và sản phẩm của OpenAI (bao gồm cả ChatGPT) cũng từ chối trả lời một loạt câu hỏi – đặc biệt là các câu hỏi liên quan đến hành vi tình dục và nội dung người lớn/NSFW, ngay cả khi những câu hỏi đó rất bình thường.
Dĩ nhiên, đây không phải một phép so sánh hoàn toàn tương đương. Với một số người, sự e dè đối với việc phụ thuộc vào công nghệ nước ngoài có thể khiến họ nghi ngờ về giá trị và tính hữu ích cuối cùng của DeepSeek. Nhưng hiệu suất và chi phí thấp của nó là điều không thể chối cãi.
Trong thời đại 16,5% hàng hóa tại Mỹ được nhập khẩu từ Trung Quốc, tôi thấy khó có thể cảnh báo người dùng tránh xa DeepSeek-R1 chỉ dựa trên lo ngại kiểm duyệt hay rủi ro an ninh – đặc biệt khi mã mô hình có thể tải xuống miễn phí, sử dụng ngoại tuyến, chạy trên thiết bị trong môi trường an toàn và tùy ý tinh chỉnh.
Tôi thực sự cảm nhận được một chút tâm lý lo âu tồn tại về “sự suy tàn phương Tây” và “sự trỗi dậy của Trung Quốc” trong cuộc thảo luận sôi nổi xung quanh DeepSeek. Một số người đã liên hệ điều này với việc người dùng Mỹ chuyển sang dùng Xiaohongshu (tiểu hồng thư) khi TikTok tạm bị cấm, và họ bất ngờ trước chất lượng cuộc sống Trung Quốc được thể hiện qua các video chia sẻ tại đó. Sự xuất hiện của DeepSeek-R1 diễn ra đúng trong bối cảnh kể chuyện như vậy – nơi Trung Quốc trông có vẻ (và trên nhiều chỉ số thực tế đúng là) đang trỗi dậy, còn Mỹ trông có vẻ (và trên nhiều chỉ số thực tế đúng là) đang suy yếu.
Mô hình AI Trung Quốc đầu tiên nhưng chắc chắn không phải cuối cùng gây chấn động thế giới
Đây cũng sẽ không phải mô hình AI Trung Quốc cuối cùng đe dọa vị thế thống trị của các gã khổng lồ tại Thung lũng Silicon – ngay cả khi những gã khổng lồ này như OpenAI đang huy động nhiều vốn hơn bao giờ hết để phát triển trí tuệ nhân tạo tổng quát (AGI – chương trình vượt trội hơn con người trong hầu hết các công việc có giá trị kinh tế).
Chỉ mới hôm qua, một mô hình khác của Trung Quốc đến từ ByteDance – công ty mẹ của TikTok – Doubao-1.5-pro đã được ra mắt, đạt hiệu suất ngang bằng với mô hình GPT-4o (phiên bản không suy luận) của OpenAI trong các benchmark độc lập, nhưng với chi phí chỉ bằng 1/50.
Các mô hình Trung Quốc phát triển nhanh và tốt đến mức ngay cả những người ngoài ngành công nghệ cũng chú ý: Tạp chí The Economist vừa đăng một bài viết về thành công của DeepSeek và các nỗ lực AI khác của Trung Quốc, và bình luận viên chính trị Matt Bruenig đăng trên X: “Tôi đã dùng Gemini, ChatGPT và Claude để tóm tắt tài liệu NLRB gần một năm nay. Deepseek làm tốt hơn tất cả chúng. Phiên bản chatbot của nó miễn phí. Giá API thấp hơn 99,5% so với API của OpenAI. [biểu tượng耸肩]”
OpenAI sẽ phản ứng thế nào?
Không ngạc nhiên khi Sam Altman, đồng sáng lập và CEO của OpenAI, hôm nay tuyên bố rằng công ty sẽ đưa dòng mô hình suy luận thế hệ thứ hai chưa ra mắt – o3 – vào ChatGPT, thậm chí cả người dùng miễn phí cũng có thể dùng. OpenAI dường như vẫn đang đi theo con đường của riêng mình bằng các mô hình tiên tiến, độc quyền hơn – thiết lập tiêu chuẩn ngành.
Nhưng vấn đề nằm ở chỗ: Khi DeepSeek, ByteDance và các công ty AI Trung Quốc khác đang bám sát phía sau, OpenAI còn có thể dẫn đầu bao lâu trong việc tạo ra và phát hành các mô hình AI tiên phong? Và nếu thực sự bị vượt mặt, sự suy giảm của nó sẽ nhanh và nghiêm trọng đến mức nào?
Tuy nhiên, OpenAI thực sự có một tiền lệ lịch sử khác để tham khảo. Nếu DeepSeek và các mô hình AI Trung Quốc thực sự đóng vai trò như Android mã nguồn mở của Google trong lĩnh vực di động – chiếm phần lớn thị phần trong một thời gian – bạn chỉ cần nhìn vào cách iPhone của Apple đã chiếm lĩnh phân khúc cao cấp thị trường bằng phương pháp khép kín, độc quyền, nội bộ hoàn toàn, rồi từ đó dần mở rộng xuống dưới, đặc biệt tại Mỹ, đến mức hiện nay sở hữu gần 60% thị phần điện thoại thông minh trong nước.
Dù vậy, đối với tất cả những ai đang chi rất nhiều tiền để sử dụng các mô hình AI hàng đầu từ các phòng thí nghiệm tiên phong, DeepSeek cho thấy rằng chức năng tương tự có thể đạt được với chi phí thấp hơn nhiều và quyền kiểm soát lớn hơn. Trong môi trường doanh nghiệp, điều này có thể đủ để giành chiến thắng.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














