
Phía sau thương vụ Meta thâu tóm gần một nửa cổ phần của Scale AI với giá khổng lồ, Web3 AI sẽ thoát khỏi định kiến ra sao?
Tuyển chọn TechFlowTuyển chọn TechFlow

Phía sau thương vụ Meta thâu tóm gần một nửa cổ phần của Scale AI với giá khổng lồ, Web3 AI sẽ thoát khỏi định kiến ra sao?
Dù là Web3 AI hay Web2 AI, đều đã đi đến ngã rẽ từ "cạnh tranh năng lực tính toán" sang "cạnh tranh chất lượng dữ liệu".
Bài viết: Haotian
Một bên là Meta chi 14,8 tỷ USD mua gần một nửa cổ phần của Scale AI, cả thung lũng Silicon đang kinh ngạc trước việc các gã khổng lồ định giá lại "gán nhãn dữ liệu" bằng mức giá kỷ lục; bên kia là
@SaharaLabsAI, vẫn bị mắc kẹt trong cái nhãn định kiến Web3 AI là "ăn theo xu hướng, không thể tự chứng minh". Đằng sau sự tương phản lớn lao này, thị trường đã bỏ qua điều gì?
Trước hết, gán nhãn dữ liệu là một lĩnh vực có giá trị hơn so với tập hợp năng lực tính toán phi tập trung.
Câu chuyện dùng GPU nhàn rỗi thách thức các ông lớn điện toán đám mây quả thật hấp dẫn, nhưng về bản chất năng lực tính toán là hàng hóa tiêu chuẩn hóa, khác biệt chủ yếu nằm ở giá cả và khả năng tiếp cận. Lợi thế về giá cả dường như có thể tìm thấy kẽ hở trong độc quyền của các gã khổng lồ, nhưng khả năng tiếp cận lại bị giới hạn bởi phân bố địa lý, độ trễ mạng và động lực người dùng chưa đủ mạnh — chỉ cần các ông lớn giảm giá hoặc tăng cung, lợi thế này lập tức bị xóa sạch.
Gán nhãn dữ liệu thì hoàn toàn khác biệt — đây là lĩnh vực đòi hỏi trí tuệ con người và phán đoán chuyên môn. Mỗi lần gán nhãn chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, hoàn toàn không thể sao chép như năng lực tính toán GPU.
Một nhãn chính xác cho chẩn đoán hình ảnh ung thư cần trực giác chuyên môn từ bác sĩ ung thư giàu kinh nghiệm; một phân tích tâm lý thị trường tài chính sắc sảo không thể thiếu kinh nghiệm thực chiến từ các trader Phố Wall. Sự khan hiếm tự nhiên và không thể thay thế này khiến "gán nhãn dữ liệu" sở hữu hào thành sâu rộng mà năng lực tính toán mãi mãi không thể đạt tới.
Ngày 10 tháng 6, Meta chính thức thông báo mua 49% cổ phần của công ty gán nhãn dữ liệu Scale AI với giá 14,8 tỷ USD — đây là khoản đầu tư đơn lẻ lớn nhất trong lĩnh vực AI năm nay. Điều đáng chú ý hơn nữa là Alexandr Wang, nhà sáng lập đồng thời CEO của Scale AI, sẽ kiêm luôn vị trí lãnh đạo phòng thí nghiệm nghiên cứu "siêu trí tuệ" mới thành lập tại Meta.
Nhà doanh nhân gốc Hoa 25 tuổi này khi sáng lập Scale AI vào năm 2016 còn là sinh viên bỏ học đại học Stanford, giờ đây công ty do ông điều hành đã đạt định giá 30 tỷ USD. Danh sách khách hàng của Scale AI giống như đội hình ngôi sao của làng AI: OpenAI, Tesla, Microsoft, Bộ Quốc phòng Mỹ… đều là đối tác lâu dài. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao phục vụ huấn luyện mô hình AI, sở hữu hơn 300.000 người gán nhãn đã qua đào tạo chuyên nghiệp.
Bạn thấy đấy, khi mọi người còn đang tranh cãi kịch liệt ai có điểm số mô hình cao hơn, những tay chơi thực sự đã âm thầm chuyển chiến trường về nguồn dữ liệu.
Một "cuộc chiến ngầm" về quyền kiểm soát tương lai AI đã bắt đầu.
Thành công của Scale AI vén mở một sự thật bị lãng quên: năng lực tính toán không còn khan hiếm, kiến trúc mô hình ngày càng đồng nhất, thứ thực sự quyết định giới hạn trí tuệ AI chính là những dữ liệu được "đào tạo kỹ lưỡng". Meta chi tiền khủng không phải để mua một công ty gia công, mà là mua quyền "khai thác dầu mỏ" trong thời đại AI.
Những câu chuyện độc quyền luôn có kẻ nổi dậy.
Cũng như các nền tảng tập hợp năng lực điện toán đám mây phi tập trung cố gắng lật đổ dịch vụ điện toán tập trung, Sahara AI muốn dùng blockchain viết lại hoàn toàn quy tắc phân phối giá trị trong gán nhãn dữ liệu. Khiếm khuyết chết người của mô hình gán nhãn truyền thống không phải là vấn đề kỹ thuật, mà là thiết kế cơ chế khuyến khích.
Một bác sĩ mất vài giờ để gán nhãn hình ảnh y tế, có thể chỉ nhận được vài chục đô la thù lao, trong khi mô hình AI được huấn luyện từ dữ liệu đó có giá trị hàng tỷ đô la — bác sĩ chẳng nhận được đồng nào. Sự bất công cực đoan trong phân phối giá trị này nghiêm trọng kìm hãm mong muốn cung cấp dữ liệu chất lượng cao.
Với cơ chế khuyến khích bằng token web3, họ sẽ không còn là những "công nhân dữ liệu" rẻ mạt, mà trở thành những cổ đông thực sự của mạng lưới AI LLM. Rõ ràng, lợi thế của web3 trong việc cải tổ quan hệ sản xuất phù hợp với lĩnh vực gán nhãn dữ liệu hơn nhiều so với năng lực tính toán.
Thú vị thay, Sahara AI lại vừa đúng lúc TGE ngay tại thời điểm Meta chi tiền khủng để mua Scale AI — là trùng hợp hay sắp đặt tinh tế? Theo tôi, điều này phản ánh một bước ngoặt thị trường: dù là Web3 AI hay Web2 AI, tất cả đều đã đi đến ngã rẽ từ "cạnh tranh năng lực tính toán" sang "cạnh tranh chất lượng dữ liệu".
Khi các gã khổng lồ truyền thống dựng nên bức tường dữ liệu bằng tiền bạc, Web3 đang dùng Tokenomics xây dựng một thí nghiệm "dân chủ hóa dữ liệu" lớn hơn.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News












