TechFlow đưa tin, ngày 30 tháng 3, theo báo cáo của dữ liệu JINSHI, Qwen (Thiên Vấn) thuộc Alibaba đã công bố ra mắt mô hình đa phương thức lớn Qwen3.5-Omni. Dòng Qwen3.5-Omni bao gồm ba phiên bản Instruct với kích thước khác nhau: Plus, Flash và Light, hỗ trợ ngữ cảnh dài tới 256K token; mô hình có khả năng xử lý đầu vào âm thanh kéo dài hơn 10 giờ và đầu vào đa phương thức âm thanh–hình ảnh độ phân giải 720P (1 khung hình/giây) kéo dài hơn 400 giây. Mô hình được huấn luyện tiên nghiệm đa phương thức gốc trên lượng dữ liệu khổng lồ gồm văn bản, hình ảnh và hơn 100 triệu giờ dữ liệu âm thanh–hình ảnh, từ đó thể hiện khả năng cảm nhận và tạo sinh toàn phương thức vượt trội. So với Qwen3-Omni, khả năng đa ngôn ngữ của Qwen3.5-Omni được cải thiện đáng kể, hỗ trợ nhận dạng giọng nói cho 113 ngôn ngữ và phương ngữ, đồng thời hỗ trợ tổng hợp giọng nói cho 36 ngôn ngữ và phương ngữ.
Chuyên sâu báo cáo Web3
Tôi muốn đăng bài
Yêu cầu phỏng vấn
Theo dõi chúng tôi
Cảnh báo rủi ro: mọi nội dung trên website này không cấu thành tư vấn đầu tư và chúng tôi không cung cấp bất kỳ dịch vụ tín hiệu hay dẫn dắt giao dịch nào. Theo thông báo của PBoC và 10 bộ ngành về việc tăng cường phòng ngừa rủi ro đầu cơ tiền mã hóa, xin hãy nâng cao ý thức rủi ro. Liên hệ: support@techflowpost.com Mã ICP: 琼ICP备2022009338号




