Vượt qua Web3, chuyến phiêu lưu kỳ ảo của AIGC - ngôi sao mới nổi trong làng vốn
Tuyển chọn TechFlowTuyển chọn TechFlow
Vượt qua Web3, chuyến phiêu lưu kỳ ảo của AIGC - ngôi sao mới nổi trong làng vốn
Nếu nói blockchain là sự đổi mới và tối ưu hóa quan hệ sản xuất, thì AI chính là bước nhảy vọt của lực lượng sản xuất.

Tác giả: 0xmin
Gần đây, nhân lúc rảnh rỗi, tôi hỏi một vài nhà đầu tư Internet tại Thung lũng Silicon rằng họ đang tập trung vào lĩnh vực nào?
Tôi tưởng sẽ lại nghe những từ quen thuộc như “SaaS”, “Web3”, nhưng bất ngờ thay, “AI” đã trở thành từ khóa xuất hiện dày đặc; nhiều quỹ VC hàng đầu tại Thung lũng Silicon bắt đầu nhắm tới các startup AI, và các khoản gọi vốn khổng lồ liên tục được công bố.
Ví dụ, Lin Qiao, kỹ sư từng làm việc tại Meta (trước đây là Facebook), sau khi nghỉ việc đã khởi nghiệp dựa trên framework học sâu mã nguồn mở PyTorch, nhằm hỗ trợ tạo hình ảnh AI như Stable Diffusion.
Nhiều quỹ VC hàng đầu cạnh tranh theo đuổi dự án này. Dù chỉ có một bản thuyết trình PowerPoint và một giấc mơ, dự án vẫn huy động được hàng chục triệu USD với định giá lên tới hàng trăm triệu USD. Các quỹ Benchmark và Sequoia Capital đều tham gia vòng gọi vốn này.
Đây chỉ là một bức tranh thu nhỏ trong cơn sốt FOMO về AI.
Ngày 17 tháng 10, công ty trí tuệ nhân tạo mã nguồn mở của Anh Stability AI tuyên bố gọi vốn 101 triệu USD, định giá đạt mức 1 tỷ USD, chính thức gia nhập hàng ngũ kỳ lân, với sự tham gia đầu tư từ Coatue, Lightspeed Venture Partners và O'Shaughnessy Ventures LLC.
Khi nhắc đến nghệ thuật do AI tạo ra gần đây gây bão, không thể không nói đến công ty này. Stability AI đã phát hành mô hình chuyển đổi văn bản sang hình ảnh bằng học sâu mang tên Stable Diffusion, cho phép tạo ra hình ảnh chi tiết theo mô tả bằng văn bản. Sự ra đời của Stable Diffusion khiến lĩnh vực hội họa AI ngày càng sôi động.
Theo bức thư gửi nhà đầu tư mới nhất của Tiger, họ đã âm thầm đầu tư vào gã khổng lồ AI OpenAI.
Một cơn cuồng phong AI đang quét qua giới công nghệ và đầu tư mạo hiểm, và làn sóng FOMO này cũng gắn liền với một bài viết của Sequoia Capital.
Ngày 23 tháng 9 năm 2022, trang web chính thức của Sequoia Mỹ đăng bài viết mới mang tựa đề "AI sinh nội dung: Một thế giới sáng tạo mới", cho rằng AIGC (Nội dung do AI tạo ra) sẽ đại diện cho bước khởi đầu của một cuộc chuyển dịch mô hình (paradigm shift) mới.
Tác giả bài viết là hai đối tác của Sequoia, Sonya Huang và Pat Grady. Điều thú vị là ở vị trí tác giả thứ ba, rõ ràng ghi tên GPT-3, mô hình dự đoán ngôn ngữ dựa trên nguyên lý học sâu của OpenAI, hiểu đơn giản là một hệ thống AI sinh nội dung dựa trên ngữ cảnh.
Khi bạn cung cấp gợi ý hoặc ngữ cảnh cho GPT-3, nó có thể tự hoàn thiện phần còn lại – nghĩa là bạn đưa dữ liệu cho GPT-3, nó sẽ giúp bạn viết bài.
Hơn nữa, các hình minh họa trong bài viết này cũng được tạo bởi Midjourney: chỉ cần nhập từ khóa, bạn sẽ nhận được một bức tranh minh họa đẹp mắt. Điều này khiến nhiều họa sĩ lo lắng, thậm chí trên Weibo đã xuất hiện chủ đề hot "Liệu AI có thay thế được hội họa không?", thu hút đông đảo họa sĩ tham gia tranh luận.

Nguồn ảnh: Zhizhuwang
Văn bản, hình ảnh có thể do AI tạo ra, âm thanh và video cũng không ngoại lệ.
Trong tập đầu tiên của podcast.ai, Steve Jobs – người sáng lập Apple quá cố – bất ngờ trở thành khách mời đầu tiên, có buổi trò chuyện dài 20 phút cùng Joe Rogan, MC podcast nổi tiếng tại Mỹ, thảo luận về quan điểm của Jobs về đại học, máy tính, trạng thái làm việc, niềm tin tôn giáo, v.v.
Người chết không thể sống lại, tất nhiên phía sau là AI.
Podcast.ai là một podcast hoàn toàn do AI tạo nên. Bằng cách sử dụng tiểu sử của Jobs và thu thập mọi bản ghi âm về ông trên mạng, họ dùng mô hình ngôn ngữ Play.ht để huấn luyện quy mô lớn, cuối cùng tạo ra nội dung âm thanh podcast "Joe Rogan phỏng vấn Jobs giả".
Tất cả những điều trên đều thuộc về AIGC (Nội dung do trí tuệ nhân tạo tạo ra). Trước kia, AI chỉ là công cụ hỗ trợ sáng tạo nội dung, còn hôm nay, AI đã có thể trở thành chủ thể sáng tạo nội dung, có khả năng độc lập hoàn thành các công việc sáng tạo như viết lách, thiết kế, vẽ tranh, sản xuất video, v.v.
Từ PGC đến UGC, ngành công nghiệp nội dung đã phát triển mạnh mẽ. Trong khi đó, sự trỗi dậy của AIGC sẽ mang lại bước đột phá cách mạng cho ngành công nghiệp nội dung, thậm chí ảnh hưởng đến tiến trình lịch sử xã hội.
Play.ht cho biết: “Chúng tôi tin rằng trong tương lai, mọi sáng tạo nội dung sẽ do trí tuệ nhân tạo thực hiện, nhưng dưới sự hướng dẫn của con người. Công việc sáng tạo nhất sẽ phụ thuộc vào khả năng của con người trong việc truyền đạt mong muốn sáng tạo của mình vào mô hình.”
AIGC và Metaverse
Khi nói đến sự kết hợp giữa AIGC và Web3, tác giả bài viết nghĩ ngay đến metaverse. Lý do rất đơn giản: một metaverse thực sự cần lượng khổng lồ nội dung chất lượng cao để lấp đầy.
Dưới mô hình kinh doanh PGC, quyền sản xuất nội dung và kiếm tiền nằm trong tay một nhóm nhỏ, đồng thời sức người có hạn, khó đáp ứng nhu cầu tạo nội dung quy mô lớn cho metaverse.
UGC cho phép ai cũng có thể trở thành người sáng tạo, giải quyết phần nào nghẽn cổ chai về năng suất, đáp ứng nhu cầu đa dạng của người dùng trong môi trường phi tập trung, nhưng chất lượng nội dung không đồng đều, lượng lớn “nội dung rác” thậm chí gây hại, vẫn chưa đủ đáp ứng nhu cầu nội dung của metaverse.
Chỉ có AIGC mới giúp con người phá vỡ xiềng xích năng suất, tạo ra nội dung chất lượng cao một cách hiệu quả, đưa con người bước vào metaverse thực sự.
Lấy một ví dụ dễ hình dung nhất là game: đồ họa, lồng tiếng, kịch bản trong game lý thuyết có thể được AI hỗ trợ hoặc tự hoàn thành. Ví dụ, gần đây, một YouTuber trên Bilibili có tên “Nhóm sản xuất chanh đường kéo sợi” đã dùng AI, mất 6 giờ để tạo ra bản demo đơn giản của một game galgame anime.

Tốc độ phát triển của lĩnh vực này sẽ vượt xa kỳ vọng của phần lớn mọi người.
Điểm giao giữa AI và Web3
Nếu nói nội hàm của Web3 là “phi tập trung”, thì AIGC hiện nay rõ ràng mang tính tập trung.
Trước đây, các mô hình AI thường tồn tại dưới dạng mã nguồn mở, nhưng trong vài năm gần đây, các mô hình lớn ngày càng đóng kín hơn và gắn bó chặt chẽ hơn với các gã khổng lồ Internet.
Lấy OpenAI – ông vua của AIGC – làm ví dụ: được thành lập năm 2015, OpenAI do Elon Musk sáng lập, ngay từ ngày đầu tiên đã tự xác định là một “tổ chức phi lợi nhuận”, với mục tiêu hiện thực hóa trí tuệ nhân tạo tổng quát một cách an toàn, mang lại lợi ích bình đẳng cho toàn nhân loại, chứ không phải tạo lợi nhuận cho cổ đông công ty.
Tuy nhiên, vào năm 2019, OpenAI đi ngược lại lý tưởng ban đầu, chuyển thành một công ty lợi nhuận có tên “OpenAI LP”, do công ty mẹ “OpenAI Inc” kiểm soát.
Chỉ vài tháng sau khi thay đổi cơ cấu, Microsoft đã đầu tư 1 tỷ USD vào OpenAI, với điều kiện là Microsoft có quyền thương mại hóa một phần công nghệ của OpenAI, chẳng hạn như GPT-3 và Codex.
Phê bình đổ dồn về: Giám đốc Viện Nghiên cứu Trí tuệ Nhân tạo Allen, Oren Etzioni, nói: “Tôi không đồng ý với quan điểm cho rằng tổ chức phi lợi nhuận không có khả năng cạnh tranh... Nếu quy mô lớn hơn, vốn nhiều hơn thì sẽ phát triển tốt hơn, vậy IBM đã không bị đẩy khỏi vị trí số một.”
Ngay cả đồng sáng lập OpenAI, Elon Musk, cũng phê bình sau khi tin tức “Microsoft giành quyền độc quyền GPT-3”: “Quyết định kiểu này dường như trái ngược với khái niệm ‘mở’. Thực tế là OpenAI đã bị Microsoft kiểm soát.” (Ghi chú: Musk rời khỏi hội đồng quản trị OpenAI vào năm 2019)

Nếu OpenAI là ông vua về năng suất, thì nó lại gặp vấn đề về quan hệ sản xuất: sản phẩm công cộng hay tổ chức lợi nhuận? Làm sao duy trì phát triển lâu dài…?
Theo chúng tôi, Web3 mang lại cơ hội để phát triển mô hình sản phẩm công cộng và tài sản chung. Trước đây, các sản phẩm công cộng tạo ra giá trị to lớn nhưng không có phương pháp nào để thu lại giá trị nhằm tự duy trì. Hệ thống kinh tế Web3 có thể giúp các sản phẩm công cộng định nghĩa các con đường mới để thu nhận giá trị, đồng thời đảm bảo rằng giá trị thu được được phân bổ tối ưu trở lại cho sản phẩm và tài nguyên công cộng.
Thứ nhất, dữ liệu cần thiết để huấn luyện mô hình AI có thể được tập hợp thông qua hình thức tổ chức của Web3.
Một mô hình AI trưởng thành và mạnh mẽ cần được “nuôi dưỡng” bằng lượng dữ liệu khổng lồ để tự học, đồng thời cần huấn luyện và hiệu chỉnh từ bên ngoài, từ đó hình thành nghề “giáo viên huấn luyện AI”.
Dữ liệu vốn mang tính “độc quyền”. Hiện tại, lượng dữ liệu khổng lồ đang thuộc sở hữu của các công ty công nghệ lớn, và hầu như không có động lực mở quyền truy cập vào việc sản xuất hoặc phân phối dữ liệu của họ.
Tuy nhiên, chúng ta cũng thấy một số cộng đồng mã nguồn mở trên thế giới đang mở cửa dữ liệu và huấn luyện mô hình cho các nhà nghiên cứu toàn cầu.
-
Common Crawl, kho lưu trữ dữ liệu internet trong mười năm, có thể dùng để huấn luyện AI nói chung.
-
LAION, một tổ chức phi lợi nhuận, nhằm cung cấp mô hình và bộ dữ liệu học máy quy mô lớn cho công chúng, đã phát hành LAION5B, bộ dữ liệu hình ảnh-văn bản gồm 5,85 tỷ cặp đã lọc qua CLIP, ngay khi phát hành đã trở thành bộ dữ liệu hình ảnh-văn bản công khai lớn nhất thế giới.
-
EleutherAI, một cộng đồng phi tập trung, đã phát hành một trong những bộ dữ liệu văn bản mã nguồn mở lớn nhất thế giới, The Pile, một bộ dữ liệu ngôn ngữ tiếng Anh 825,18 GiB, dùng để mô hình hóa ngôn ngữ từ 22 nguồn dữ liệu khác nhau.
Hiện tại, các tổ chức này vẫn mang tính phi lợi nhuận, chủ yếu dựa vào tình nguyện viên “làm vì đam mê”.
Vậy làm thế nào để dùng Web3 tối ưu hóa việc sản xuất và truy cập dữ liệu AI?
CoinFund từng đề xuất một số ý tưởng, ví dụ như Token có thể được dùng làm cơ chế khuyến khích để thúc đẩy việc tạo bộ dữ liệu mã nguồn mở, phân bổ theo mức đóng góp dữ liệu – ví dụ như gắn nhãn cho các bộ dữ liệu hình ảnh-văn bản lớn để huấn luyện AI. Cộng đồng mã nguồn mở như vậy cũng có thể chuyển thành cộng đồng DAO. Một bộ dữ liệu mã nguồn mở được biên soạn tốt là yếu tố then chốt để mở rộng khả năng tiếp cận nghiên cứu mô hình lớn và cải thiện hiệu suất mô hình.
Một mô hình AI lớn chất lượng có thể có Token riêng, và doanh thu từ các sản phẩm xây dựng trên mô hình đó có thể tích lũy vào giá trị Token. Như vậy, người đóng góp dữ liệu sẽ nhận được phần thưởng phân bổ hợp lý. Tóm lại, Web3 có thể giúp thương mại hóa dữ liệu tốt hơn và xây dựng các sản phẩm công cộng tốt hơn.
Thứ hai, việc huấn luyện mạng thần kinh quy mô lớn đòi hỏi lượng khổng lồ năng lực tính toán. Trong thập kỷ qua, nhu cầu tính toán để huấn luyện mô hình AI cứ khoảng 3-4 tháng lại tăng gấp đôi.
Ví dụ, GPT-3 của OpenAI có 175 tỷ tham số, thời gian huấn luyện là 3640 petaFLOPS-day. Dùng siêu máy tính nhanh nhất thế giới cũng cần hai tuần, trong khi một laptop thông thường cần hơn một nghìn năm để tính toán.
Do đó, việc huấn luyện AI thường cần phần cứng chuyên biệt được tối ưu cho các phép toán, như GPU, ASIC – những thiết bị này chủ yếu bị kiểm soát bởi một nhóm nhỏ các nhà cung cấp dịch vụ đám mây như Google Cloud, AWS, Microsoft Azure và IBM.
Đây có thể là một điểm giao khác giữa mô hình thị trường/quản trị phi tập trung của Web3 và tính toán AI.
Ví dụ, hệ thống quản trị và khuyến khích phi tập trung có thể được dùng để kích thích và phân bổ tài nguyên tính toán. Hãy tưởng tượng một hệ thống tiền thưởng gọi vốn cộng đồng thông qua Token, người gọi vốn thành công sẽ nhận được quyền ưu tiên xử lý mô hình.
Hiện tại, thị trường đã có những người tham gia tương tự, ví dụ như Gensyn, sử dụng blockchain để xác minh nhiệm vụ học sâu đã được thực hiện đúng, và kích hoạt thanh toán qua Token, biến khả năng tính toán chưa dùng thành tài sản có giá trị.
Nếu nói blockchain là sự đổi mới và tối ưu hóa quan hệ sản xuất, thì AI chính là bước nhảy vọt về năng suất. Sự kết hợp giữa hai lĩnh vực này có thể tạo ra những tia lửa, và đây cũng là lĩnh vực thu hút sự chú ý của nhiều tổ chức đầu tư. Ví dụ, Rishin Sharma, nhà đầu tư tại CoinFund, khẳng định đang tìm kiếm ba loại nhóm làm việc tại điểm giao giữa AI và Web3:
1. Các nhóm lấy nhiệm vụ cốt lõi là AI mở
2. Các cộng đồng quản lý tốt tài nguyên công cộng (như dữ liệu và tính toán) để hỗ trợ xây dựng mô hình AI
3. Các sản phẩm ứng dụng AI để mang tính sáng tạo, an ninh và đổi mới vào các ứng dụng phổ biến
TechFlow cũng đánh giá cao cơ hội khởi nghiệp và đầu tư trong lĩnh vực liên quan. Nếu bạn có ý định thử nghiệm trong AIGC hoặc Web3, hãy liên hệ trao đổi qua Twitter (@TechFlowPost) hoặc thêm Weixin: Mintomoon để thảo luận.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












