深潮 TechFlow 消息,4 月 30 日,阿里千問宣佈開源 Qwen-Scope——基於 Qwen3 系列和 Qwen3.5 系列模型訓練所得的可解釋性模塊,應用場景包括推理結果定向控制、數據分類與合成、模型訓練與優化、評估樣本分佈分析與對比等。本次 Qwen-Scope 開源的權重涉及 7 個大模型,覆蓋 Qwen3及 Qwen3.5 系列的稠密模型和混合專家模型,共有 14 組稀疏自編碼器權重。(金十)
添加收藏
分享社交媒體
深潮 TechFlow 消息,4 月 30 日,阿里千問宣佈開源 Qwen-Scope——基於 Qwen3 系列和 Qwen3.5 系列模型訓練所得的可解釋性模塊,應用場景包括推理結果定向控制、數據分類與合成、模型訓練與優化、評估樣本分佈分析與對比等。本次 Qwen-Scope 開源的權重涉及 7 個大模型,覆蓋 Qwen3及 Qwen3.5 系列的稠密模型和混合專家模型,共有 14 組稀疏自編碼器權重。(金十)
阿里千問宣佈開源 Qwen-Scope——基於 Qwen3 系列和 Qwen3.5 系列模型訓練所得的可解釋性模塊,應用場景包括推理結果定向控制、數據分類與合成、模型訓練與優化、評估樣本分佈分析與對比等。本次 Qwen-Scope 開源的權重涉及 7 個大模型,覆蓋 Qwen3及 Qwen3.5 系列的稠密模型和混合專家模型,共有 14 組稀疏自編碼器權重。(金十)