
「DouBao」hạ giá, các mô hình lớn toàn cầu cạnh tranh về hiệu quả chi phí
Tuyển chọn TechFlowTuyển chọn TechFlow

「DouBao」hạ giá, các mô hình lớn toàn cầu cạnh tranh về hiệu quả chi phí
Trước khi DouBao xuất hiện với mức giá hiệu quả cao, nhiều mô hình lớn trong nước như Thông Nghĩa Thiên Vấn, Trí Phổ AI, DeepSeek, v.v. đã bắt đầu "cạnh tranh khốc liệt" về giá cả.
Tác giả: Mộc Mục
Các mô hình lớn cũng bắt đầu cạnh tranh về giá.
Ngày 15 tháng 5, Volcano Engine thuộc ByteDance đã ra mắt mô hình lớn DouBao. Ngoài ứng dụng DouBao miễn phí dành cho người dùng C, mô hình này còn đưa mức giá dành cho doanh nghiệp (B) xuống thấp nhất ngành.
Theo ông Đàm Đãi, Tổng giám đốc Volcano Engine, giá của mô hình chính DouBao (≤32K) trên thị trường doanh nghiệp chỉ ở mức 0,0008 nhân dân tệ/1.000 Tokens, chỉ với 0,8 phân có thể xử lý hơn 1.500 ký tự Hán, rẻ hơn 99,3% so với mặt bằng chung trong ngành.
Trước khi DouBao xuất hiện với mức giá hấp dẫn, các mô hình lớn trong nước như Thông Nghĩa Thiên Vấn, Trí Phổ AI, DeepSeek... đều đã bắt đầu "cuộn" về giá. Cuộc chiến trăm mô hình cũng vì thế bước sang giai đoạn mới khi đồng loạt giảm giá.
DouBao đưa giá sử dụng cho doanh nghiệp xuống mức thấp kỷ lục
Mô hình DouBao trước đây là mô hình Yunque, mô hình lớn đầu tiên dựa trên kiến trúc Transformer do ByteDance công bố vào tháng 8 năm 2023. Chỉ nửa năm sau, mô hình DouBao không chỉ ra mắt đầy đủ bộ sản phẩm mà còn giảm giá mạnh cho khách hàng doanh nghiệp.
Giá mô hình chính DouBao trên thị trường doanh nghiệp chỉ 0,0008 nhân dân tệ/1.000 Tokens, 0,8 phân có thể xử lý hơn 1.500 ký tự Hán, rẻ hơn 99,3% so với thị trường. Theo đó, chỉ cần 1 nhân dân tệ đã có thể dùng đến 1,25 triệu Tokens của mô hình chính DouBao, tương đương khoảng 2 triệu ký tự Hán, bằng ba cuốn Tam Quốc Diễn Nghĩa. Trong khi đó, mô hình phổ thông DouBao 128K cũng chỉ cần 0,005 nhân dân tệ/1.000 Tokens, thấp hơn 95,8% so với giá thị trường.
Cần biết rằng, GPT-4 Turbo có giá 0,01 USD cho mỗi 1.000 Tokens đầu vào và 0,21 nhân dân tệ cho mỗi 1.000 Tokens đầu ra. So sánh, ByteDance trực tiếp "đập nát" giá, xứng danh Pinduoduo trong lĩnh vực AI.
Không chỉ DouBao, nhiều mô hình lớn trong nước cũng đang giảm giá.
Gần đây, Baidu đã ra mắt phiên bản nhẹ của mô hình lớn Văn Tâm, trong đó phiên bản ERNIE Tiny được hạ giá xuống còn 0,001 nhân dân tệ/1.000 Tokens, tương đương 1 nhân dân tệ cho 1 triệu Tokens.
Tháng 5 năm nay, giá thương mại mô hình lớn của Zhipu AI cũng giảm mạnh. Giá gọi mô hình cấp入门 GLM-3 Turbo giảm 80%, từ 5 nhân dân tệ/mỗi triệu Tokens xuống còn 1 nhân dân tệ/mỗi triệu Tokens, giúp nhiều doanh nghiệp và cá nhân có thể tiếp cận dễ dàng hơn.
Giá mô hình lớn của Zhipu AI
Ngày 6 tháng 5, công ty AI DeepSeek thuộc Quant Fund - quỹ đầu tư tư nhân nổi tiếng tại Trung Quốc - đã ra mắt MoE thế hệ thứ hai hoàn toàn mới DeepSeek-V2, với giá API định mức 1 nhân dân tệ cho mỗi triệu Tokens đầu vào và 2 nhân dân tệ cho mỗi triệu Tokens đầu ra (bối cảnh 32K).
Ngày 9 tháng 5, Alibaba Cloud chính thức ra mắt Thông Nghĩa Thiên Vấn 2.5. Theo kết quả đánh giá từ OpenCompass, Thông Nghĩa Thiên Vấn 2.5 đạt điểm ngang GPT-4 Turbo, đồng thời người dùng cá nhân có thể sử dụng miễn phí qua ứng dụng, trang web chính thức và mini program.
Ngày 14 tháng 5, mô hình tạo hình ảnh từ văn bản HunYuan của Tencent được mở mã nguồn hoàn toàn, cho phép sử dụng miễn phí trong mục đích thương mại.
Ở nước ngoài, GPT-4o vừa được OpenAI ra mắt cũng giảm giá mạnh, không chỉ cung cấp miễn phí cho mọi người dùng mà còn giảm một nửa chi phí API so với GPT-4-turbo ra mắt tháng 11 năm ngoái, dù tốc độ tăng gấp đôi. Đây là lần giảm giá thứ ba đối với sản phẩm mô hình lớn của OpenAI.
Hiện tại, giá đầu vào và đầu ra của mô hình lớn Mistral Large thuộc công ty AI Pháp Mistral AI cũng rẻ hơn khoảng 20% so với GPT-4 Turbo, từng gây chú ý rộng rãi.
Dù trong nước hay nước ngoài, các mô hình lớn đang đồng loạt giảm giá.
Giảm chi phí mô hình lớn, tăng hiệu quả triển khai ứng dụng
Cuộc chiến giá giữa các nhà sản xuất đã bắt đầu, nhưng cách đây chưa đầy nửa năm, điều mọi người biết là việc huấn luyện mô hình lớn rất tốn kém. Vì sao chỉ trong nửa năm, các hãng đã có thể "hạ giá" mạnh mẽ và đua nhau cạnh tranh?
Ông Đàm Đãi, Tổng giám đốc Volcano Engine cho rằng, giảm chi phí là yếu tố then chốt thúc đẩy mô hình lớn nhanh chóng tiến vào "giai đoạn tạo giá trị". Đối với khách hàng doanh nghiệp vừa và nhỏ, chi phí là yếu tố quan trọng khi sử dụng mô hình lớn. Ông Đàm tiết lộ, ByteDance đã áp dụng nhiều phương pháp tối ưu hóa về cấu trúc mô hình, huấn luyện, sản xuất... để đạt được mức giá thấp.
CEO OpenAI Sam Altman cũng tự hào khi người dùng có thể sử dụng ChatGPT mà không cần xem quảng cáo: "Một trong những sứ mệnh then chốt của chúng tôi là cung cấp miễn phí sản phẩm AI cho mọi người."
Thật vậy, giá thấp đang giúp các doanh nghiệp phát triển mô hình lớn nắm bắt cơ hội thị trường, giành lấy chỗ đứng. Đồng thời, lượng người dùng tăng lên cũng ngược lại hỗ trợ quá trình nghiên cứu và huấn luyện mô hình tốt hơn. Liệu chi phí huấn luyện mô hình lớn thực sự đã giảm?
Khi GPT-4 ra mắt năm ngoái, Sam Altman từng tiết lộ chi phí huấn luyện mô hình lớn nhất của OpenAI "vượt xa 50 triệu USD". Theo ước tính trong báo cáo Chỉ số Trí tuệ Nhân tạo 2024 của Đại học Stanford, chi phí huấn luyện GPT-4 của OpenAI là 78 triệu USD.
Chi phí huấn luyện cao ngất ngưởng của các mô hình lớn đã trực tiếp đẩy giá sử dụng lên cao, khiến nhiều doanh nghiệp phải e ngại.
Tuy nhiên, các nhà nghiên cứu đang tìm kiếm phương pháp huấn luyện với chi phí thấp hơn. Năm ngoái, các nhà nghiên cứu từ Đại học Quốc gia Singapore và Đại học Thanh Hoa đã đề xuất khung VPGTrans, cho phép huấn luyện mô hình đa phương thức hiệu suất cao với chi phí cực thấp. So với việc huấn luyện module thị giác từ đầu, khung VPGTrans có thể giảm chi phí huấn luyện BLIP-2 FlanT5-XXL từ hơn 19.000 nhân dân tệ xuống dưới 1.000 nhân dân tệ.
Trong các mô hình lớn nội địa, các kỹ sư cũng tìm ra nhiều cách giảm chi phí và tăng hiệu quả. Sau khi nâng cao chất lượng tập dữ liệu và tối ưu hóa kiến trúc, nền tảng tính toán dị biệt AI "Bách Các" giúp tăng sản lượng xử lý cao nhất 30% trong huấn luyện và 60% trong suy luận.
Ngoài quá trình huấn luyện, các cơ sở hạ tầng phục vụ huấn luyện mô hình lớn—như chip—cũng đang giảm giá. Ví dụ, việc giảm giá chip AI Nvidia A100 của NVIDIA đã trực tiếp làm giảm khoảng 60% chi phí huấn luyện mô hình lớn.
Ảnh hưởng trực tiếp nhất của cuộc chiến giá mô hình lớn là việc triển khai ứng dụng bắt đầu tăng tốc. Trên nền tảng DouBao, đã có hơn 8 triệu agent thông minh được tạo ra. Cửa hàng GPT đã có hơn 3 triệu ứng dụng dựa trên mô hình GPT được tạo.
Chỉ trong nửa năm, thời đại đốt tiền để chạy theo hiệu năng mô hình dường như đã trở thành quá khứ. Hiện nay, người dùng thị trường ngày càng quan tâm đến mô hình nào vừa rẻ vừa hiệu quả. Điều này sẽ thúc đẩy việc ứng dụng mô hình lớn nhanh chóng đi vào hiện thực trong các tình huống cụ thể và thương mại hóa.
Chào mừng tham gia cộng đồng chính thức TechFlow
Nhóm Telegram:https://t.me/TechFlowDaily
Tài khoản Twitter chính thức:https://x.com/TechFlowPost
Tài khoản Twitter tiếng Anh:https://x.com/BlockFlow_News










