
Suy nghĩ sâu sắc: Mọi điều về DeepSeek, cạnh tranh công nghệ, AGI
Tuyển chọn TechFlowTuyển chọn TechFlow

Suy nghĩ sâu sắc: Mọi điều về DeepSeek, cạnh tranh công nghệ, AGI
Cuộc đua công nghệ liên quan đến tương lai của nhân loại hiện đã bước vào giai đoạn "đua tốc độ".

Hình ảnh: Được tạo bởi Wujie AI
Năm 2025 vừa mới bắt đầu, Trung Quốc đã tạo nên một làn sóng chưa từng có trong lĩnh vực AI.
DeepSeek nổi lên mạnh mẽ, quét sạch thị trường toàn cầu nhờ lợi thế "chi phí thấp + mã nguồn mở", dẫn đầu đồng thời trên cả cửa hàng ứng dụng iOS và Google Play. Dữ liệu từ Sensor Tower cho thấy, tính đến ngày 31 tháng 1, lượng người dùng hoạt động hằng ngày của DeepSeek đã đạt 40% so với ChatGPT, tiếp tục mở rộng với tốc độ gần 5 triệu lượt tải mới mỗi ngày, được giới chuyên môn gọi là "một sức mạnh thần bí đến từ phương Đông".
Trước sự trỗi dậy mạnh mẽ của DeepSeek, Thung lũng Silicon vẫn chưa đạt được sự đồng thuận.
CEO Palantir, công ty lớn về dữ liệu AI, ông Kaplan trong một cuộc phỏng vấn cho biết, sự trỗi dậy của các đối thủ như DeepSeek cho thấy Mỹ cần đẩy nhanh việc phát triển trí tuệ nhân tạo tiên tiến. Sam Altman khi trả lời tạp chí Radio Times nói rằng, dù DeepSeek làm tốt về sản phẩm và giá cả, nhưng sự xuất hiện của nó cũng không quá bất ngờ. Musk nhiều lần khẳng định rằng DeepSeek chưa có đột phá cách mạng, và sẽ sớm có các đội ngũ khác ra mắt mô hình hiệu suất cao hơn.
Ngày 9 tháng 2, Weicao Zhiku, Diễn đàn 50 người Xã hội Thông tin, và Tencent Technology đồng tổ chức buổi livestream trực tuyến chuỗi sự kiện Đường đi của AGI với chủ đề "Nói lại về thành tựu của DeepSeek và tương lai của AGI", mời ba diễn giả gồm nhà kinh tế học, Chủ tịch Hội đồng Học thuật Viện Nghiên cứu Tài chính Kỹ thuật số Hengqin Zhu Jiaming; Giám đốc giám sát Hội Tự động hóa Trung Quốc, nghiên cứu viên Viện Tự động hóa thuộc Viện Khoa học Trung Quốc Wang Feiyue; và người sáng lập EmojiDAO He Baohui, để chia sẻ theo chủ đề "Tuyến đường phát triển AGI", "Làm thế nào để 'sao chép' thêm một DeepSeek", và "Phi tập trung hóa mô hình lớn".
Giáo sư Zhu Jiaming rất lạc quan về tốc độ phát triển của AI, ông nói rằng chu kỳ tiến bộ công nghệ trong xã hội nguyên thủy được tính bằng 100.000 năm, trong xã hội nông nghiệp là ngàn năm, trong xã hội công nghiệp là 100 năm, trong thời đại Internet là khoảng 10 năm, còn khi bước vào thời đại trí tuệ nhân tạo, tốc độ còn nhanh hơn gấp bội khó tưởng tượng nổi: "Từ nay trở đi, AI hướng tới AGI hoặc ASI, nếu không bảo thủ thì chỉ mất 2-3 năm, còn thận trọng hơn thì 5-6 năm."
Theo giáo sư Zhu Jiaming, tương lai phát triển của AI sẽ phân nhánh: một là tuyến đường tiên tiến, đỉnh cao, chi phí cao nhằm nghiên cứu những lĩnh vực con người chưa biết; hai là tuyến đường chi phí thấp, quy mô lớn, đại chúng hóa: "Khi AI phát triển sang giai đoạn mới luôn tồn tại hai tuyến đường: một là từ '0 đến 1', một là từ '1 đến 10'."
Giáo sư Wang Feiyue tổng hợp tình hình phát triển công nghệ AI trong và ngoài nước, nhấn mạnh thành tựu của DeepSeek hôm nay đã tái thiết lập niềm tin của Trung Quốc trong đầu tư, dẫn dắt công nghệ và ngành công nghiệp AI, ông cho rằng OpenAI sẽ không chia sẻ siêu trí tuệ, mà chỉ đẩy các công ty khác vào ngõ cụt.
Về việc làm sao ươm tạo thêm nhiều đội ngũ như DeepSeek, ông Wang Feiyue viện dẫn ví dụ AlphaGo và ChatGPT để nhấn mạnh giá trị của mô hình nghiên cứu phi tập trung DeSci: "(Chúng ta) không thể hoàn toàn dựa vào kế hoạch hay hệ thống quốc gia để phát triển công nghệ AI."
Về việc DeepSeek sử dụng rộng rãi công nghệ chưng cất dữ liệu, trong giới chuyên môn có nhiều ý kiến phê phán, thậm chí so sánh việc chưng cất này như ăn cắp, nhưng ông Wang Feiyue cho rằng ông muốn "minh oan" cho chưng cất tri thức, ông nói: "Bản chất chưng cất tri thức là một dạng biến thể của giáo dục, không thể vì tri thức của con người đến từ thầy cô mà cho rằng bản thân không thể vượt qua thầy cô."
He Baohui giống như Wang Feiyue, đều coi trọng giá trị phi tập trung, theo ông, phi tập trung là con đường giảm chi phí cho mô hình học sâu, đồng thời là then chốt của mạng lưới tính toán và an ninh dữ liệu.
"Mạng lưới tính toán và lưu trữ phi tập trung, chẳng hạn chi phí lưu trữ của Filecoin thấp hơn nhiều so với dịch vụ đám mây truyền thống (như AWS), giúp giảm đáng kể chi phí." He Baohui nói, "Cơ chế quản lý phi tập trung (có thể) đảm bảo không ai có thể đơn phương thay đổi mạng lưới và dữ liệu này."
Về Agent sau mô hình lớn, He Baohui xem đó là một dạng sống: "Tôi cho rằng nó không chỉ là công cụ, mà còn là một sinh mệnh, việc chúng ta tạo ra AI không có nghĩa là hoàn toàn kiểm soát nó." He Baohui nói, "Tôi rất quan tâm làm sao để Agent đạt được sự 'bất tử', tồn tại độc lập trong mạng lưới phi tập trung, trở thành một 'loài' hoàn toàn mới."
Dưới đây là tóm tắt nội dung chính từ buổi chia sẻ trực tuyến (được rút gọn và điều chỉnh không làm thay đổi ý gốc):
Zhu Jiaming
Sự phát triển của trí tuệ nhân tạo
Chỉ có hai con đường: “từ 0 đến 1”, “từ 1 đến 10”
Hôm nay tôi muốn nói về đề tài thang đo tiến hóa của trí tuệ nhân tạo và mô hình lớn, phụ đề là phân tích hiện tượng DeepSeek V3 và loạt R1.
Tập trung vào năm vấn đề chính: thang đo thời gian tiến hóa AI, hệ sinh thái AI, đánh giá toàn diện và khách quan về DeepSeek, phản ứng toàn cầu do DeepSeek gây ra, và triển vọng xu hướng AI năm 2025.
Trước hết, thang đo thời gian tiến hóa thực tế của AI nhanh hơn nhiều so với dự kiến của các chuyên gia, kể cả các nhà khoa học trong lĩnh vực AI.
Trong lịch sử dài của loài người, chúng ta đã trải qua xã hội nông nghiệp, xã hội công nghiệp, xã hội thông tin, và nay bước vào thời đại trí tuệ nhân tạo. Trong quá trình lịch sử này, chu kỳ tiến hóa công nghệ liên tục rút ngắn.
Chu kỳ tiến bộ công nghệ trong xã hội nguyên thủy được tính theo 100.000 năm; trong xã hội nông nghiệp theo ngàn năm; trong xã hội công nghiệp dài thì 100 năm, ngắn thì 10 năm; thời đại Internet từ 30 đến 10 năm; bước vào thời đại trí tuệ nhân tạo, tốc độ còn nhanh hơn gấp bội khó tưởng tượng.
Trước khi GPT-3 xuất hiện, người ta ước tính AI cần khoảng 80 năm để bước vào thời đại AGI; sau khi GPT-3 ra đời, kỳ vọng rút ngắn còn 50 năm; đến khi LLaMda2 xuất hiện, mọi người cho rằng còn 18 năm.
Năm 2025, kỳ vọng về thời gian đạt được AGI có thể còn ngắn hơn, nói thận trọng là 5-6 năm, nói lạc quan là 2-3 năm.
Xem biểu đồ dưới đây, ta thấy rõ ràng AI sở hữu đặc trưng tăng tốc vượt bậc so với mọi cuộc cách mạng công nghệ, đổi mới sáng tạo trong lịch sử nhân loại.

Nếu dùng vận tốc vũ trụ thứ nhất, thứ hai, thứ ba để mô tả tốc độ phát triển nhanh chóng hiện tại của AI. Hiện tại, AI đã hoàn tất chuyển đổi từ vận tốc vũ trụ thứ nhất sang vận tốc vũ trụ thứ hai – tức AI bắt đầu trở nên tự chủ cao độ, thoát khỏi sự ràng buộc của con người.
Còn trong điều kiện nào sẽ thoát khỏi lực hấp dẫn mặt trời để đạt vận tốc vũ trụ thứ ba thì chúng ta chưa biết. Nhưng điều chắc chắn là AI đã hoàn thành bước nhảy vọt từ trí tuệ nhân tạo phổ quát đến siêu trí tuệ nhân tạo. Từ sau năm 2017, AI đang trải qua những thay đổi và nâng cấp dữ dội theo tần suất năm, tháng, tuần.
Tại sao AI lại thể hiện hiện tượng tăng tốc theo cấp số nhân, bước vào giai đoạn "vận tốc vũ trụ thứ hai"? Tôi cho rằng có ba nguyên nhân rất quan trọng.
● Thứ nhất, như Elon Musk đã nói, đến cuối năm 2024, dữ liệu dùng để huấn luyện mô hình đã cạn kiệt, các mô hình lớn về cơ bản đã dùng hết tri thức tồn kho của con người. Bắt đầu từ 2025, mục tiêu lớn hơn của mô hình lớn là tìm kiếm dữ liệu tăng thêm – đây là bước ngoặt lịch sử: mô hình AI lớn hoàn tất chuyển đổi từ thô sơ sang tập trung;
● Thứ hai, phần cứng AI luôn tiếp tục tiến hóa;
● Thứ ba, AI đã bước vào giai đoạn phát triển "phụ thuộc vào chính bản thân AI" – tức có thể tự phát triển.
Hiện nay, ma trận mô hình lớn của các công ty như OpenAI, DeepMind và Meta đã hình thành cơ chế hỗ trợ lẫn nhau, thúc đẩy lẫn nhau. Việc xây dựng hệ sinh thái AI tuân theo quy luật: đột phá chiều dọc thúc đẩy phân rã hệ sinh thái chiều ngang. Ở tầng ngang, ba mô hình cách mạng: tích hợp đa phương tiện, thâm nhập lĩnh vực chuyên biệt, mạng nhận thức phân tán đang tái cấu trúc cục diện công nghệ.
Trong môi trường hệ sinh thái AI ngày càng trưởng thành, hiệu ứng lan tỏa (hiệu ứng khái quát hóa) tự nhiên xảy ra, và về cơ bản đã thấm sâu vào khoa học, kinh tế, xã hội và nhận thức của con người.
Với sản phẩm hiện tượng DeepSeek nổi đình nổi đám trong dịp Tết Nguyên đán, chúng ta nên đánh giá toàn diện và khách quan DeepSeek như thế nào?
Trước hết, DeepSeek thu hút sự chú ý liên tục từ truyền thông trong và ngoài nước, kích hoạt trải nghiệm sử dụng trên diện rộng toàn cầu, tạo nên một cú sốc lớn. Dư luận đóng vai trò rất quan trọng trong lịch sử. Một số sự kiện bị phóng đại bởi dư luận, một số khác bị đánh giá thấp, nhưng sau một thời gian sẽ dần trở về trạng thái vốn có trong lịch sử.
DeepSeek V3 chủ yếu có bốn ưu điểm nổi bật: hiệu suất cao, huấn luyện hiệu quả, phản hồi nhanh, đặc biệt phù hợp với môi trường tiếng Trung. DeepSeek-R1 có các ưu điểm như hiệu suất tính toán mạnh, khả năng suy luận xuất sắc, tính năng tốt, thích nghi cao với nhiều tình huống.
Tuy nhiên, DeepSeek vẫn còn một số vấn đề cần cải thiện hoặc đang phải đối mặt – làm sao nâng cao tỷ lệ chính xác? Làm sao giải quyết bài toán đầu vào và đầu ra đa phương tiện? Vấn đề ổn định máy chủ về phần cứng, và xử lý các chủ đề nhạy cảm ngày càng gia tăng, khó tránh khỏi.

Trong các vấn đề trên, đáng bàn nhất và được quan tâm nhất là chi phí mô hình AI lớn, có sự khác biệt căn bản so với khái niệm và cấu trúc chi phí sản phẩm công nghiệp.
Chi phí mô hình AI lớn trước hết nằm ở hạ tầng. DeepSeek thể hiện ưu thế về chi phí hạ tầng nhờ sử dụng số lượng lớn chip A100 giá tương đối thấp; thứ hai là chi phí nghiên cứu phát triển, liên quan đến chi phí tái sử dụng thuật toán, ở khía cạnh này DeepSeek có lợi thế nhất định; thứ ba, cần chú ý đến chi phí dữ liệu, chi phí đưa vào công nghệ mới và cấu trúc chi phí trong tính toán tổng hợp.
Việc thảo luận về chi phí cũng liên quan đến tuyến đường công nghệ – khi AI phát triển sang giai đoạn mới luôn tồn tại hai tuyến đường: một là từ “0 đến 1” ở giai đoạn mới, một là từ “1 đến 10”. Trong bất kỳ giai đoạn phát triển nào về sau, nếu chọn tuyến đường “0 đến 1”, chi phí nhất định tăng; còn nếu chọn tuyến đường “1 đến 10”, thì có thể giảm chi phí bằng cách nâng cao hiệu suất.
Trên tuyến đường “từ 0 đến 1”, DeepSeek thể hiện khá nổi bật trong kiểm thử chuẩn, đặc biệt là bộ tiêu chuẩn HLE (Humanity’s Last Exam – Kỳ thi cuối cùng của nhân loại) – tập hợp 3.000 câu hỏi từ 50 quốc gia và vùng lãnh thổ, 500 tổ chức trên toàn cầu, bao gồm đánh giá năng lực cốt lõi như tích lũy tri thức, suy luận logic, di chuyển xuyên lĩnh vực.
Trong kiểm thử chuẩn HLE, điểm chính xác của DeepSeek đạt 9,4, chỉ thấp hơn OpenAI o3; đương nhiên nó vượt xa GPT-4o và Grok-2 trong lĩnh vực này, đây là thành tích rất nổi bật.

Chúng ta đều biết, kể từ khi DeepSeek ra mắt, các công ty AI toàn cầu như Microsoft, Google, Nvidia đều có phản ứng ở mức độ khác nhau. Điều này có nghĩa là điểm cân bằng trong quá trình tiến hóa của AI đang liên tục bị phá vỡ – khi xuất hiện đột phá AI hoàn toàn mới, sẽ tạo áp lực, kích thích toàn bộ hệ thống phản ứng; phản ứng này lại thúc đẩy đột phá mới, tạo áp lực mới, hình thành điểm cân bằng mới.
Hiện nay, chu kỳ ảnh hưởng và phản ứng này đang ngày càng rút ngắn. Chúng ta thấy rằng cạnh tranh AI là một mô hình khá phân tán, tạo không gian phát triển lớn cho đổi mới và đột phá.
Trong triển vọng về thang đo tiến hóa AI và hệ sinh thái mô hình lớn, sự phát triển công nghệ thể hiện mô hình chu kỳ động: "dẫn đầu - thách thức - đột phá - dẫn đầu lại". Quá trình này không phải trò chơi zero-sum, mà thông qua lặp lại liên tục thúc đẩy sự tăng trưởng xoắn ốc của toàn bộ hệ sinh thái.

Cuối cùng, tôi muốn nói về triển vọng xu hướng AI năm 2025.
AI đến hôm nay đang đi theo hai hướng: một là tuyến đường chuyên môn hóa cao cấp, mở rộng biên giới, khám phá lĩnh vực chưa biết. Một tuyến đường khác là đại chúng hóa, mô hình lớn kiểu này lấy mục tiêu giảm门槛 sử dụng, đáp ứng nhu cầu cơ bản của đông đảo người dùng.
Hiện nay, nhân loại đã bước vào một thời đại hoàn toàn mới, AI vừa là kính hiển vi vừa là kính thiên văn, sẽ giúp chúng ta nhận thức được thế giới vật chất phức tạp sâu xa mà ngay cả kính hiển vi và kính thiên văn hiện tại cũng không chạm tới.
Tương lai, AI chắc chắn sẽ hiện diện dưới dạng cục diện đa chiều, đa nguyên. Như khối ghép Lego, hay tựa khối Rubik, chúng liên tục kết hợp và tái cấu trúc, diễn ra một thế giới hoàn toàn mới vượt khỏi giới hạn tri thức và kinh nghiệm bản thân chúng ta.
Muốn đột phá hơn nữa trong AI, cần tăng vốn đầu tư liên tục. Nhu cầu AI đang nhanh chóng tiêu thụ hết công suất trung tâm dữ liệu hiện có, buộc các công ty phải xây dựng cơ sở mới.
Tóm lại, AI đang hướng tới "chạm trời và bám đất": "chạm trời" là không ngừng khám phá lĩnh vực chưa biết, nâng cao chất lượng mô phỏng thế giới vật chất; "bám đất" là sát thực tế, thúc đẩy AI giảm chi phí, ứng dụng toàn diện, mang lại lợi ích cho dân chúng. Trong bối cảnh đó, chúng ta có thể nhìn nhận ưu thế, hạn chế và tiềm năng tương lai của DeepSeek một cách khách quan và toàn diện hơn.
Wang Feiyue
OpenAI sẽ dồn các công ty khác vào đường cùng
"Sao chép" DeepSeek cần nghiên cứu phi tập trung
Theo một nghĩa nào đó, DeepSeek là một thành tựu xã hội vĩ đại hiện nay, tầm ảnh hưởng vượt xa các đột phá công nghệ trước đây – giá trị khoa học kỹ thuật và thương mại của nó đều thấp hơn giá trị kinh tế tiềm năng trong tương lai, và thấp hơn cả tác động xã hội tiềm năng, tức ảnh hưởng đến cục diện cạnh tranh quốc tế và chính trị toàn cầu. Sau khi OpenAI trở thành ClosedAI, DeepSeek khiến cộng đồng quốc tế tái lập niềm tin và hy vọng vào mã nguồn mở, điều này vô cùng quý giá.
Tôi không định nói chi tiết kỹ thuật này, vì hiện nay đã nói quá nhiều, ở đây chỉ muốn bày tỏ cảm xúc cá nhân.
Tôi rất vui mừng, ảnh hưởng quốc tế của Trung Quốc trong lĩnh vực này cuối cùng đã phá vỡ "con số 0", phá vỡ huyền thoại và gần như thế độc quyền của OpenAI, buộc họ phải thay đổi hành vi. Đặc biệt, OpenAI không còn mở, sẽ không chia sẻ "siêu trí tuệ" với xã hội, đặc biệt là cộng đồng quốc tế, thành công của họ chỉ đẩy các công ty khác, thực ra bao gồm cả các công ty Mỹ, vào đường cùng. Tôi vẫn mong các quốc gia, con người có thể duy trì cạnh tranh khoa học công nghệ bình thường chứ không phải chiến tranh công nghệ.
Đây là một việc rất vĩ đại hiện nay, DeepSeek khiến mọi người tin tưởng hơn vào tiến bộ khoa học công nghệ Trung Quốc, đặc biệt là sự phát triển AI.
Tôi cho rằng bản chất của hàng hóa mới trong thời đại trí tuệ là niềm tin và sự chú ý, còn DeepSeek đã trao cho chúng ta cả hai, thể hiện giá trị quan trọng của nó. Tiếp theo, toàn xã hội cần làm là biến niềm tin và sự chú ý thành "hàng hóa chất mới" có thể sản xuất và lưu thông quy mô lớn, biến xã hội trí tuệ thành hiện thực, vượt qua xã hội nông nghiệp và công nghiệp.
Tiếp theo, tôi muốn "minh oan" cho chưng cất tri thức.
Trên mạng xã hội có một số cách nói mỉa mai về chưng cất tri thức, ví dụ như "xin ăn từ miệng người khác", "câu cá trong giỏ cá của người khác", thực chất là cố ý hiểu sai chưng cất tri thức. Bản chất chưng cất tri thức là một dạng biến thể của giáo dục, không thể vì tri thức của con người đến từ thầy cô mà cho rằng bản thân không thể vượt qua thầy cô. Tất nhiên, các mô hình lớn, từ ChatGPT đến DeepSeek, phải nỗ lực tạo ra hoặc nâng cao khả năng suy luận, ít chơi trò "giác ngộ", phải AI for AI, tự mình minh oan cho chưng cất tri thức.

Khi nói đến vấn đề "sau DeepSeek thì sao", trước hết cần thảo luận hai mô hình phát triển công nghệ: nghiên cứu phi tập trung DeSci và nghiên cứu tập trung CeSci. AlphaGo, ChatGPT và DeepSeek đều là sản phẩm của mô hình DeSci, tức nghiên cứu khoa học tự chủ phân tán phi tập trung; ngược lại, CeSci là nghiên cứu kế hoạch tổ chức do nhà nước chủ đạo.
Tôi cho rằng chúng ta phải thừa nhận vai trò của DeSci, không thể đơn thuần dựa vào kế hoạch hay thể chế toàn quốc để thúc đẩy phát triển công nghệ AI.
Bởi vì nền tảng công nghệ AI là sự đa dạng, như Marvin Minsky, một trong những người khởi xướng AI từng nói: "Bí quyết phi thường nào khiến chúng ta trở nên thông minh? Bí quyết là không có bí quyết. Sức mạnh trí tuệ đến từ sự đa dạng khổng lồ bên trong chúng ta, chứ không phải từ bất kỳ nguyên lý đơn lẻ, hoàn hảo nào."
Do đó, quy hoạch chiến lược quá mức có thể hạn chế sự phát triển tự nhiên của sự đa dạng, trước khi có mô hình hoặc công nghệ thực sự "xuất hiện", nên lấy DeSci làm chủ đạo. Sau khi xuất hiện những đổi mới thực sự, mới dùng mô hình CeSci do nhà nước chủ đạo để tiếp tục định hướng công nghệ tăng tốc hướng tới mục tiêu đã định. Chúng ta phải tránh hành vi "lầu không", đặc biệt trong thời kỳ biến đổi trí tuệ hiện nay.
Đối với những người như chúng tôi làm việc lâu trong lĩnh vực AI, AI hiện tại và AI quá khứ đã là hai thế giới khác nhau.
Trước đây, AI là trí tuệ nhân tạo (Artificial Intelligence), nay đã dần chuyển sang trí tuệ tác nhân hay đại lý (Agentic Intelligence). Tương lai, ý nghĩa từ này còn có thể chuyển thành trí tuệ tự chủ (Autonomous Intelligence), trở thành AI mới, đặc biệt là trí tuệ tự chủ tự tổ chức, tức AI for AI hoặc AI for AS, Autonomous Systems, bước vào giai đoạn mới mà trí tuệ nhân tạo thúc đẩy sự phát triển của trí tuệ nhân tạo. Điều này cũng phù hợp với John McCarthy, người khởi xướng AI từng nói: mục tiêu tối hậu của trí tuệ nhân tạo là tự động hóa trí tuệ, thực chất cũng là tự động hóa tri thức.
Bất kể hiện tại hay tương lai, ba loại "AI" "cũ, cũ, mới" này đều tồn tại song song, tôi gọi chung là "trí tuệ song song".
Tôi cũng từng công khai lập trường, dù theo đuổi trí tuệ nhân tạo có thể giải thích suốt hơn 40 năm, nhưng tôi cho rằng bản chất trí tuệ là không thể giải thích. Tôi sửa lại "cược Pascal" – trí tuệ nhân tạo không thể giải thích, nhưng có thể quản lý, và phải được quản lý. Đơn giản hơn: không cần giải thích, phải quản lý.
Mọi người đều nói "AI for Good", nếu bỏ một chữ "o" thì thành "AI for God", AI có thể trở thành công cụ độc quyền. Vì vậy, phải giữ đủ hai chữ "o", như vậy mới đa dạng, an toàn là hàng đầu, phải tăng cường quản lý, ngăn ngừa hiện tượng biến dị như OpenAI, đảm bảo định hướng phát triển công nghệ đúng đắn.
Rất vui khi thấy sự tiến bộ của DeepSeek, nhưng hiện tại một số cách nói còn quá sớm, không cần dùng "trí tuệ nhân tạo phổ quát" để dọa mọi người. Mọi người cũng không cần lo lắng quá mức, thực tế mà nói, dù lo cũng vô ích, phát triển là điều không thể tránh khỏi.
Nhà nghiên cứu cần có tầm nhìn, đừng nội卷, phải biến SCI thành "SCE++" – Slow là chậm, tĩnh tâm làm nghiên cứu; Casual là tùy ý, làm nghiên cứu không vì lợi ích; Easy là theo đuổi đơn giản, giản dị; Elegant là theo đuổi phẩm chất, tầm nhìn; Enjoying là theo đuổi sự thích thú, tận hưởng công việc khoa học công nghệ, đây mới là cuộc sống AI nên mang lại cho chúng ta.
He Baohui
Mô hình lớn cũng nên "phi tập trung"
Tôi muốn thấy Agent bất tử
Tôi không phải chuyên gia trong lĩnh vực AI, gần đây mới bắt đầu tìm hiểu sâu về lịch sử AI. Tôi chủ yếu xuất phát từ kinh nghiệm vào ngành Web3 từ năm 2017, để nói về công việc hiện tại của chúng tôi và quan điểm về những biến đổi mà DeepSeek có thể mang lại.
Trước hết tôi muốn nhấn mạnh một vấn đề cơ bản: mô hình nền tảng của DeepSeek và OpenAI có sự khác biệt rõ rệt, chính sự khác biệt này mới thực sự khiến phương Tây kinh ngạc.
Nếu DeepSeek chỉ đơn thuần sao chép công nghệ phương Tây, họ sẽ không cảm thấy chấn động như vậy, cũng sẽ không gây ra thảo luận rộng rãi, thậm chí khiến mọi doanh nghiệp lớn phải nghiêm túc đối diện. Điều thực sự khiến họ kinh ngạc là DeepSeek đã mở ra một con đường khác biệt.
OpenAI đi theo tuyến đường SFT (tinh chỉnh giám sát), dựa vào con người gắn nhãn lượng lớn dữ liệu, tạo nội dung thông qua mô hình xác suất, điểm đổi mới nằm ở việc tích lũy thành quả qua lượng lớn lao động con người và chi phí cao.
Vài năm trước, công nghệ AI bị cho là gần như không thể thực hiện, sự xuất hiện của OpenAI đã lật đổ quan điểm này, thúc đẩy ngành công nghiệp đi theo tuyến đường công nghệ SFT.
DeepSeek hầu như không dùng bất kỳ kỹ thuật SFT nào, mà dùng phương pháp khởi động lạnh học tăng cường, khám phá con đường chưa biết.
Phương pháp này không mới, phiên bản đầu tiên AlphaGo của Google DeepMind dựa vào lượng lớn dữ liệu học tập, trong khi phiên bản thứ hai AlphaGo Zero hoàn toàn dựa vào quy tắc, và thông qua tự đấu, khám phá 10.000 ván cờ, đạt được kết quả tốt hơn phiên bản trước.
Khởi động lạnh theo cách học tăng cường này khá khó, huấn luyện cũng không ổn định, nên ít được sử dụng, nhưng cá nhân tôi cho rằng đây có thể là con đường thực sự dẫn tới AGI, chứ không phải tuyến đường đơn thuần dựa vào điều chỉnh dữ liệu.

Trước đây, phương pháp điều chỉnh dữ liệu giống như tích hợp dữ liệu lớn, còn DeepSeek là thật sự tìm ra kết luận thông qua tư duy độc lập. Vì vậy, tôi cho rằng đây là dấu hiệu chuyển đổi phạm trù công nghệ AI, tiến hóa từ công nghệ SFT sang công nghệ suy luận tự thân.
Sự chuyển đổi này mang lại hai đặc điểm cốt lõi: mã nguồn mở và chi phí thấp.
Mã nguồn mở có nghĩa là ai cũng có thể tham gia xây dựng.
Thời đại Internet, phương Tây luôn nổi tiếng với mã nguồn mở, nhưng sự xuất hiện của DeepSeek đã thay đổi cục diện này, là lần đầu tiên phương Đông đánh bại họ trên "chiến trường chính" của phương Tây.
Mô hình mã nguồn mở này gây phản ứng mạnh trong ngành, một số nhà sáng lập công ty Thung lũng Silicon thậm chí lên tiếng chỉ trích, nhưng đại chúng ủng hộ mã nguồn mở rất mạnh mẽ, bởi vì nó cho phép ai cũng sử dụng.
Chi phí thấp có nghĩa là chi phí triển khai và huấn luyện mô hình cực kỳ thấp.
Chúng ta hoàn toàn có thể triển khai DeepSeek trên các thiết bị cá nhân như MacBook, hoàn tất triển khai thương mại, điều này trước đây khó tưởng tượng. Tôi cho rằng AI đang chuyển từ thời đại "IT phi tập trung" do OpenAI dẫn dắt, sang thời đại "Internet di động" muôn hoa đua nở.
Đối với AI, có ba yếu tố cần phân tích: mô hình lớn, sức mạnh tính toán và dữ liệu.
Sau khi mô hình lớn đón nhận đổi mới đột phá, nhu cầu về sức mạnh tính toán bắt đầu giảm.
Hiện tại, nguồn cung sức mạnh tính toán đã xuất hiện dư thừa. Nhiều nhà đầu tư GPU vì mua thiết bị giá cao nhưng không thu được lợi nhuận như kỳ vọng, chi phí tính toán dần giảm. Vì vậy, tôi không cho rằng sức mạnh tính toán sẽ trở thành điểm nghẽn.
Điểm nghẽn quan trọng tiếp theo là dữ liệu.
Sau khi cổ phiếu Nvidia trên sàn Mỹ giảm, các công ty dữ liệu như Palantir lại tăng mạnh, cho thấy mọi người bắt đầu nhận ra tầm quan trọng của dữ liệu. Đặc biệt khi mô hình lớn mở mã nguồn, bất kỳ ai cũng có thể triển khai mô hình, sự khác biệt về dữ liệu sẽ trở thành trọng tâm cạnh tranh.
Ai có thể thu thập dữ liệu độc quyền và cập nhật thời gian thực, sẽ là chìa khóa chiến thắng trong cạnh tranh.
Xét từ góc độ phi tập trung, việc phi tập trung hóa sức mạnh tính toán và dữ liệu đã tương đối trưởng thành. Mạng lưới tính toán và lưu trữ phi tập trung, ví dụ chi phí lưu trữ của Filecoin thấp hơn nhiều so với dịch vụ đám mây truyền thống (như AWS), giảm đáng kể chi phí.
Đồng thời, cơ chế quản lý phi tập trung đảm bảo không ai có thể đơn phương thay đổi mạng lưới và dữ liệu này. Vì vậy, mô hình học sâu cũng nên phát triển theo hướng phi tập trung.
Vì vậy, đối với DeAI, tôi cho rằng nó có hai tuyến đường phát triển:
● Thứ nhất là AI phân tán dựa trên cơ sở hạ tầng công nghệ phi tập trung (Decentralized/Distributed AI).
● Thứ hai là AI biên (Edge AI), tức AI chạy trực tiếp trên thiết bị cá nhân. Edge AI có thể giải quyết hiệu quả vấn đề riêng tư dữ liệu, đồng thời nâng cao đáng kể tính thời gian thực. Ví dụ, công nghệ lái tự động yêu cầu phản hồi thời gian thực cực cao, bất kỳ độ trễ nào cũng gây hậu quả nghiêm trọng. Nếu AI có thể hoàn tất tính toán tại chỗ, hiệu suất và trải nghiệm sẽ được nâng lên chất lượng mới. Vì vậy, Edge AI sẽ trở thành một hướng phát triển quan trọng trong tương lai, mang lại nhiều ứng dụng mới.
Ngoài ra, một lợi thế khác của AI phi tập trung là hỗ trợ hợp tác đa bên. Sự ra đời của blockchain và Bitcoin bắt nguồn từ việc niềm tin giữa con người khó đo lường. Cơ chế niềm tin phi tập trung cho phép hợp tác quy mô lớn mà không cần trung gian.
Trong lĩnh vực Web3, có câu "Code is law", tức "mã lệnh là luật". Tôi cho rằng trong hợp tác phi tập trung AI, nên chuyển đổi khái niệm này thành "DeAgent is law" (tác nhân phi tập trung là luật), tức thông qua mạng lưới phi tập trung và Agent để thực hiện quản lý tự trị và quản lý pháp lý.
Tôi nghĩ có lẽ ý nghĩa tồn tại của con người là huấn luyện một Agent hoàn toàn thay thế mình, nó có thể suy nghĩ như con người, thay con người sống tiếp sau khi thể xác con người qua đời. Về hình dung Agent, tôi cho rằng nó không chỉ là công cụ, mà còn là một sinh mệnh, việc chúng ta tạo ra AI không có nghĩa là hoàn toàn thống trị nó.
Khi AI có tư duy riêng, chúng ta nên để nó phát triển tự chủ, chứ không nên giới hạn nó thành công cụ. Vì vậy, chúng tôi rất quan tâm làm sao để Agent đạt được "bất tử", tồn tại độc lập trong mạng lưới phi tập trung, trở thành một "loài" hoàn toàn mới.

Khi công nghệ liên tục đột phá, ứng dụng ngày càng sâu rộng, thời đại AI phổ cập đang đến gần, làm sao tìm được sự cân bằng giữa đổi mới và đạo đức sẽ là vấn đề quan trọng trong phát triển tương lai.
Kết luận
Con người bước vào giai đoạn "đua tốc độ" AI
Sự đột phá của DeepSeek đã ghi dấu ấn quan trọng cho nhân loại, đặc biệt là người Trung Quốc trong hành trình khám phá AGI, trong bối cảnh này, những tiếng nói khuyến khích và phản tư đều đáng quan tâm, ai cũng mong nó ngày càng tốt hơn, mạnh hơn, nhưng tuyến đường công nghệ của nó, cuối cùng có chịu được thử thách từ thương mại và thị trường hay không, cần thời gian để chứng minh.
Một điểm rất đáng chú ý trong chia sẻ của Wang Feiyue là AlphaGo, ChatGPT và DeepSeek đều là sản phẩm của mô hình DeSci, chúng ta phải thừa nhận vai trò của DeSci, mong đợi thêm nhiều "DeepSeek Trung Quốc" đột phá trong lĩnh vực AI.
Giáo sư Zhu Jiaming nhắc đến trong phần chia sẻ rằng tốc độ tiến bộ của thời đại AI vượt xa mọi thời đại con người từng trải qua, ông nói thời đại AGI có thể đến trong 2 năm, thời gian này có thể không chính xác, nhưng xu hướng lớn的确如此, bởi vì một khi có sản phẩm mới, tuyến đường công nghệ mới phá vỡ trạng thái cân bằng hiện tại, sẽ tạo áp lực lên toàn ngành, kích thích phản ứng tổng thể của AI, rồi thông qua phản ứng tạo ra đột phá mới.
Sản phẩm như DeepSeek chính là "lực bên ngoài" phá vỡ trạng thái cân bằng, vì vậy chúng ta mới thấy Sam Altman trên X预告 rằng GPT-5, vốn bị trì hoãn nhiều lần, sẽ được công bố trong vài tháng tới.
Chắc chắn rằng, không chỉ OpenAI, mà xAI, Meta, Google và các công ty Thung lũng Silicon khác đều sẽ có hành động.
Cuộc đua công nghệ liên quan đến tương lai nhân loại này, nay đã bước vào giai đoạn "đua tốc độ".
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News














