
20 億美元估值巔峰,「歐洲版 OpenAI」如何成為 GPT 最強對手?
TechFlow Selected深潮精選

20 億美元估值巔峰,「歐洲版 OpenAI」如何成為 GPT 最強對手?
Mistral AI 的崛起,為整個行業帶來了更多的創新與突破。
撰文:MetaverseHub
「ChatGPT 像互聯網發明一樣重要,將會改變世界。」比爾·蓋茨對於大模型的預判似乎正在一步步成為現實。
在過去的一年裡,OpenAI 在 AI(人工智能)領域獨領風騷,無論是 ChatGPT 的普及,還是其內部的風波,都成為了業界的焦點。
然而,隨著 Mistral AI 的崛起,這一格局正在經歷前所未有的變革。
作為 OpenAI 的強勁對手,Mistral AI 在技術和產品層面均展現出令人矚目的突破,已然成為 AI 領域的一顆耀眼明星,被稱作「歐洲版 OpenAI」。
與 OpenAI 相比,Mistral AI 更加註重技術的實際應用,致力於將最先進的 AI 技術應用於解決實際問題。

在融資方面,Mistral AI 在成立之初便獲得了 1.13 億美元的種子輪融資,並吸引了多家著名投資機構,如 Lightspeed Venture Partners、Salesforce 和法國巴黎銀行等。
在短短几個月內,該公司又完成了 4.15 億美元的 A 輪融資,估值高達 20 億美元。這一融資規模在 AI 初創公司中極為罕見,不僅證明了資本市場對 Mistral AI 的高度認可和期待,也為其未來的發展提供了強大的資金支持。
Mistral AI 的崛起,不僅對 OpenAI 構成了挑戰,更為整個 AI 領域注入了新的活力,為整個行業帶來了更多的創新與突破。
01.引領人工智能革命的創新力量
Mistral AI 全名為 Mistral Artificial Intelligence,是一家專注於 AI 研發和應用的公司,尤其是用於構建在線聊天機器人、搜索引擎和其他 AI 驅動產品的技術。
自成立以來,Mistral AI 一直堅持以人為本,他們希望通過開發更加智能、更加人性化的 AI 系統,改善人們的生活和工作方式,為人類帶來更多的便利和福祉,致力於利用先進的 AI 技術為各行各業提供高效、智能的解決方案。
儘管只是一家初創企業,但 Mistral AI 的創始人團隊個個來頭不小。
其中,Arthur Mensch 曾擔任谷歌人工智能公司 DeepMind 的研究員,Timothée Lacroix 和 Guillaume Lample 則分別在 Meta 公司擔任與該技術相關的職位。
曾經的工作經歷讓他們對多模態、RAG、算法優化等技術有著深刻理解,並在模型推理、預訓練和模型嵌入等領域有著深入研究。

Mistral AI 官網上的這段話充分展現了 Mistral AI 的野心:「我們的使命是推動 AI 向前發展,為開放社區和我們的企業客戶服務。我們致力於通過開發與專有解決方案不相上下的開放式重量模型來推動 AI 革命。」
儘管 Mistral AI 目前只是小型創意團隊,但他們始終堅持高科學標準,並通過突破性的創新來開發高效、有用和值得信賴的 AI 模型。這或許正是 Mistral AI 備受青睞的原因之一。
02.大語言模型的重大飛躍
Mistral AI 最備受矚目的產品無疑是 Mixtral 8x7B,這是目前市場上最具競爭力的開放式大型模型之一,擁有多項特別的功能,性能明顯領先於其它大模型。
Mixtral 8x7B 的核心在於其創新性十足的 MoE(Mixture of Experts)架構,MoE 架構通過一個網關網絡,將輸入數據分配給被稱為「專家」的特定神經網絡組件。在 Mixtral 8x7B 中,共有八個這樣的專家,每個都有著高達 70 億的模型參數。
儘管配備了八個「專家」,但在實際運算時每個數據處理僅需兩個「專家」參與。這種數據資源分配算法,極大地在保持模型性能的同時,優化了處理速度,同時保持了模型性能。

在培訓和微調方面,Mixtral AI 使用多語言數據進行預訓練,包括英語、法語、意大利語、德語和西班牙語。Instruct 模型使用監督微調和直接偏好優化(DPO)進行訓練,在 MT-Bench 等基準測試中取得了高分。
在對 Mixtral 8x7B 進行深入研究時,Mistral AI 也十分注重對其部分功能進行微調,特別是針對那些能夠跟隨指令操作的版本,使得模型朝著更加精細化和個性化的方向發展。
除了自身的超強性能以外,Mixtral 8x7B 廣受好評的另一個重要原因是它所代表的開放性。
Mistral AI 在發佈這一大模型時便直接公開了這個模型的權重數據,這種策略在吸引 AI 社區的注意力方面非常有效,同時確保了學術和商業用途的廣泛可訪問性。Mixtral AI 的開放性鼓勵著多樣化應用的出現,有可能在大模型和語言理解方面帶來新的突破。
Mixtral 8x7B 的創新方法和卓越性能使其成為大模型領域的行業標杆,儘管已經取得如此成就,Mixtral AI 也從未停下前進的步伐,依然在積極優化這一模型的相關性能。
03.Mistral AI 的里程碑式發展
Mixtral 8x7B 的誕生標誌著 AI 技術的一個重要突破,尤其是在模型結構和效率上的創新,那麼和一眾大模型比起來它又表現如何?
能否超越巨頭?
自 ChatGPT 問世以來,OpenAI 一直被視為大語言模型的黃金標準。然而,Mistral AI 通過引入一個完全開源的開放權重模型,在廣泛的基準測試中表現出卓越的性能,甚至在部分表現上超越了 OpenAI 的 GPT 3.5 模型和 Meta 的 LLama 2 13B 模型。

具體而言,在多領域的大規模多任務語言理解(MMLU)測試中,涵蓋數學、美國曆史、計算機科學、法律等 57 個科目,Mistral AI 以 60.1% 的準確率脫穎而出,而 Llama 2 7B 和 Llama 2 13B 的準確率分別略高於 44% 和 55%。
同樣,在涉及常識推理和閱讀理解的測試中,Mistral 7B 的表現優於這兩個 Llama 模型,準確率分別為 69% 和 64%,凸顯了其在深度語言理解領域的優勢。
Mistral 7B 之所以在深度語言理解方面表現優秀,是因為在訓練過程中接觸到了大量複雜、多變的文本數據,增強了其語境感知和推理能力,使得 Mistral 7B 在測試時能夠更好地理解和把握文本的內在邏輯和語義信息,從而給出更準確、更深入的回答。
與 GPT3 相較而言,Mistral AI 聚焦於快速推理和處理更長的序列。利用分組查詢和滑動窗口注意力機制——基於注意模型的一種注意模式,實現了對更低的延遲和更高吞吐量的優化。這使其適用於以更低的成本實現大批量、快速加工的應用場景,成為節約成本效益的最佳選擇。

對比之下,GPT3 以其深入語言理解能力和多任務處理能力而聞名,並且它被優化用於處理更短的序列。例如 GPT3 在問答系統任務中表現出色,能夠理解和生成準確的答案;得益於強大的語言理解能力,它能夠快速地總結長篇文本;另外 GPT3 還可以執行文本補全、語言翻譯、情感分析等。
高性能小型模型,但缺乏「安全護欄」
Mistral 7B 以其高性能和強適應性備受關注,具有「小數字足跡」的特點,即模型在運行時所需的計算資源和存儲空間較少。
相較於其他對強大硬件嚴格依賴的模型,Mixtral 7B 甚至可以在沒有獨立 GPU 的小型個人電腦上運行。這使得其可以靈活運用部署工具,如 vLLM 推理服務器和 skypilot 開源框架等部署在任何雲平臺上,包括 AWS、GCP 和 Azure。同時,該模型也支持與開發人員提供的參考實現在本地協同使用。

儘管其高性能和靈活部署的能力突出,安全性卻成為 Mistral AI 的漏洞之處。
GPT3 和 Llama 2 等 LLM 模型具有嚴格的內容過濾器,可以拒絕生成母公司認定為有害的消息,Mixtral 7B 卻缺乏這一「安全護欄」。曾有用戶向 Mistral AI 的問答模型詢問如何製造炸彈和實施謀殺,其聊天機器人竟然給出了細思極恐的細節指導。
儘管 Mistral AI 團隊致力於開放分享其技術,但這可能成為其 AI 產品的一把雙刃劍,因為監管機構可能會因其缺乏傳統內容過濾器而對該模型採取更嚴厲的措施。
另一方面,Mistral AI 的 CEO Arthur Mensch 曾在 AI 安全峰會上表示:「開源帶來的風險和益處之間存在一種權衡,我們需要通過動態的對話來尋找最佳解決方案。」
據悉,該公司正在構建一個具備模塊化過濾器和模塊化機制的平臺,用於管理模型網絡。也許,該公司將從模型內部構建方面,著手 AI 安全和防護問題。
在如今競爭激烈的大語言模型中,Mistral AI 憑藉其卓越的性能和出色的適應性脫穎而出。然而,面臨潛在的 AI 安全性挑戰,行業人員也正思考如何在開源與安全之間取得權衡之道。
04.與谷歌雲共創智能未來
眾所周知,谷歌雲在全球雲計算領域堪稱佼佼者,而當它與 AI 領域的黑馬 Mistral AI 相遇,一個充滿無限可能的未來正逐漸展現在我們眼前。
上個月,谷歌雲宣佈和 Mistral AI 建立全球合作伙伴關係,Mistral AI 將使用谷歌雲的基礎設施來分發和商業化其大型語言模型。

藉助谷歌雲強大的雲計算和大數據技術,Mistral AI 在模型推理、預訓練等領域有望取得前所未有的突破。這不僅將進一步推動 AI 技術的發展,更將為各行業帶來更為智能、高效的解決方案。
與此同時,雙方的合作也將加速 Mistral AI 在各個行業的落地應用。無論是電商、金融、醫療還是教育,Mistral AI 都將為人類帶來更多便利和福祉。
當然,Mistral AI 的崛起並非偶然。作為一家充滿活力和創新精神的公司,Mistral AI 始終致力於探索 AI 技術的邊界,並將其應用於解決實際問題。
其出色表現和創新能力,使得人們不禁開始思考:這家初創公司是否有可能超越 OpenAI,成為歐洲 AI 領域的領軍者?讓我們拭目以待。
歡迎加入深潮 TechFlow 官方社群
Telegram 訂閱群:https://t.me/TechFlowDaily
Twitter 官方帳號:https://x.com/TechFlowPost
Twitter 英文帳號:https://x.com/BlockFlow_News












