
20億ドルの評価額の頂点に立った「ヨーロッパ版OpenAI」は、いかにしてGPT最強のライバルへと成長したのか?
TechFlow厳選深潮セレクト

20億ドルの評価額の頂点に立った「ヨーロッパ版OpenAI」は、いかにしてGPT最強のライバルへと成長したのか?
Mistral AIの台頭は、業界全体にもっと多くの革新と飛躍をもたらした。
執筆:MetaverseHub
「ChatGPTはインターネットの発明と同じくらい重要であり、世界を変えるだろう」。ビル・ゲイツによる大規模モデルに対する予測が、少しずつ現実になりつつある。
過去1年間、AI(人工知能)分野においてOpenAIは圧倒的な存在感を示してきた。ChatGPTの普及から内部の混乱に至るまで、そのすべてが業界の注目を集めた。
しかし、Mistral AIの台頭により、この構図はかつてないほどの変化を迎えている。
OpenAIの強力なライバルとして、Mistral AIは技術面および製品面で目覚ましい進展を遂げており、すでにAI分野における輝かしい星となり、「ヨーロッパ版OpenAI」と称されている。
OpenAIと比較して、Mistral AIは技術の実用性により重点を置いており、最先端のAI技術を実際の問題解決に応用することを目指している。

資金調達面では、Mistral AIは設立直後に1.13億ドルのシードラウンドを獲得し、Lightspeed Venture PartnersやSalesforce、BNPパリバなど複数の著名な投資機関を引き付けた。
そしてわずか数ヶ月後、同社はさらに4.15億ドルのシリーズA資金調達を完了し、評価額は高達20億ドルに達した。これはAIスタートアップとしては極めて稀な規模であり、資本市場がMistral AIに対して高い評価と期待を寄せていることを示しており、今後の発展に強力な資金的支援を提供している。
Mistral AIの台頭は、OpenAIに対抗するだけでなく、AI分野全体に新たな活力を注入し、業界にもっと多くの革新と飛躍をもたらしている。
01.人工知能革命を牽引する革新勢力
Mistral AIの正式名称はMistral Artificial Intelligenceであり、オンラインチャットボットや検索エンジン、その他AI駆動型製品の構築に特化したAI研究開発企業である。
設立以来、Mistral AIは一貫して人間中心のアプローチを堅持しており、よりインテリジェントでより人間らしいAIシステムを開発することで、人々の生活や働き方を改善し、より多くの利便性と幸福をもたらすことを目指している。先進的なAI技術を活用して、あらゆる産業分野に効率的かつスマートなソリューションを提供することに尽力している。
まだスタートアップ企業に過ぎないが、Mistral AIの創業チームはいずれも並外れた経歴を持つ。
Arthur MenschはかつてGoogle傘下の人工知能企業DeepMindのリサーチャーを務め、Timothée LacroixとGuillaume LampleはそれぞれMetaで関連技術職に従事していた。
これらの勤務経験を通じて、彼らはマルチモーダル、RAG、アルゴリズム最適化などの技術に対して深い理解を持ち、モデル推論、事前学習、モデル埋め込みなどの分野でも深く研究を行っている。

Mistral AIの公式サイトにある以下の言葉は、その野心を如実に表している。「われわれの使命は、オープンコミュニティおよび企業顧客のためにAIを前進させることです。専有型ソリューションに劣らないオープンウェイトモデルの開発を通じて、AI革命を推進することを誓います。」
現在のMistral AIはまだ小規模なクリエイティブチームだが、常に高い科学的基準を堅持し、画期的な革新によって効率的で有用かつ信頼できるAIモデルを開発している。これが同社が高く評価される理由の一つであろう。
02.大規模言語モデルにおける重大な飛躍
Mistral AIで最も注目されている製品は間違いなくMixtral 8x7Bであり、現在市場で最も競争力のあるオープン型大規模モデルの一つで、多数の特別な機能を持ち、性能面で他の大規模モデルを明確にリードしている。
Mixtral 8x7Bの中核は、革新的なMoE(Mixture of Experts)アーキテクチャにある。MoEアーキテクチャは、入力データを「エキスパート」と呼ばれる特定のニューラルネットワークコンポーネントに割り当てるゲートウェイネットワークを使用する。Mixtral 8x7Bには合計8人のエキスパートがおり、それぞれが70億ものモデルパラメータを持っている。
8人のエキスパートを備えているものの、実際の計算時には各データ処理に2人のエキスパートしか参加しない。このデータリソース配分アルゴリズムは、モデル性能を維持しつつ処理速度を大幅に最適化している。

トレーニングおよびファインチューニングに関して、Mixtral AIは英語、フランス語、イタリア語、ドイツ語、スペイン語など多言語データを用いて事前学習を行う。Instructモデルは監視付きファインチューニングと直接嗜好最適化(DPO)で訓練され、MT-Benchなどのベンチマークテストで高得点を記録している。
Mixtral 8x7Bの詳細な研究において、Mistral AIは特に指示に従って操作するバージョンの一部機能に対してファインチューニングを行い、モデルをより精緻化・個別化する方向へと進化させている。
優れた性能だけでなく、Mixtral 8x7Bが広く称賛されるもう一つの重要な理由は、それが象徴する開放性にある。
Mistral AIはこの大規模モデルを公開する際に、モデルの重みデータをそのまま公開した。この戦略はAIコミュニティの注目を集めると同時に、学術的および商用利用の幅広いアクセスを保証している。Mixtral AIの開放性は多様な応用の出現を促進し、大規模モデルおよび言語理解の分野で新たなブレークスルーをもたらす可能性を秘めている。
Mixtral 8x7Bの革新的なアプローチと卓越した性能により、大規模モデル分野の業界標準となっている。これほどの成果を挙げてもなお、Mixtral AIは前進を止めず、モデルの性能最適化に積極的に取り組んでいる。
03.Mistral AIのマイルストーン的発展
Mixtral 8x7Bの誕生は、モデル構造および効率性における革新という点で、AI技術の重要なブレークスルーを意味している。では、他の大規模モデルと比べてどのような結果を見せているのか?
巨人を超えることは可能か?
ChatGPT登場以降、OpenAIは常に大規模言語モデルのゴールドスタンダードとされてきた。しかしMistral AIは完全にオープンソース化されたオープンウェイトモデルを導入し、さまざまなベンチマークテストで卓越した性能を示しており、一部の指標ではOpenAIのGPT-3.5モデルやMetaのLLaMA 2 13Bモデルを上回っている。

具体的には、数学、アメリカ史、コンピュータサイエンス、法律など57の科目をカバーする大規模マルチタスク言語理解(MMLU)テストにおいて、Mistral AIは60.1%の正確率を達成し、Llama 2 7BとLlama 2 13Bの約44%、55%を大きく上回った。
また、常識推論および読解力を問うテストでも、Mistral 7Bは両Llamaモデルを上回り、それぞれ69%および64%の正答率を記録した。これは深層言語理解分野での優位性を浮き彫りにしている。
Mistral 7Bが深層言語理解において優れた性能を発揮するのは、トレーニング中に大量の複雑で多様なテキストデータに触れることで、文脈把握能力と推論能力が強化されているためである。これにより、テスト時にテキストの内在的論理と意味情報をより適切に理解・把握でき、より正確かつ深い回答を導き出すことができる。
GPT-3と比較すると、Mistral AIは高速推論およびより長い系列の処理に焦点を当てている。グループ化クエリとスライディングウィンドウ注意機構(アテンションモデルに基づく一種の注意パターン)を活用することで、遅延の低減とスループットの向上を最適化している。これにより、大量かつ高速な処理を低コストで実現できるため、コストパフォーマンスに優れた選択肢となる。

対照的に、GPT-3は深い言語理解能力とマルチタスク処理能力で知られており、短い系列の処理に最適化されている。例えば、質問応答システムのタスクで優れた性能を発揮し、正確な答えを理解・生成できる。強力な言語理解能力のおかげで、長文の要約も迅速に可能である。また、テキスト補完、言語翻訳、感情分析なども実行できる。
高性能な小型モデルだが、「安全柵」に欠ける
Mistral 7Bはその高性能と高い適応性から注目を集めている。「小さなデジタルフットプリント」、つまり実行時に必要な計算資源やストレージ容量が少ないという特徴を持つ。
強力なハードウェアに依存する他のモデルとは異なり、Mixtral 7Bは独立したGPUのない小型PC上でも動作可能である。そのため、vLLM推論サーバーやskypilotオープンソースフレームワークなどの柔軟な展開ツールを使い、AWS、GCP、Azureなど任意のクラウドプラットフォームに展開できる。また、開発者が提供するリファレンス実装とローカルで共同使用することも可能だ。

高性能と柔軟な展開が可能である一方で、安全性がMistral AIの弱点となっている。
GPT-3やLlama 2などのLLMモデルは厳格なコンテンツフィルターを持ち、企業が有害と認定したメッセージの生成を拒否できるが、Mixtral 7Bにはこのような「安全柵」が欠けている。実際にユーザーがMistral AIのQ&Aモデルに対し「爆弾の作り方」や「殺人実行方法」を尋ねたところ、詳細な手順が驚くほど具体的に提示された事例がある。
Mistral AIチームは技術のオープン共有を重視しているが、これがAI製品にとって逆に二面性を持つ可能性がある。規制当局は伝統的なコンテンツフィルターの不在を理由に、このモデルに対してより厳しい措置を取る恐れもある。
一方で、Mistral AIのCEO Arthur MenschはAIセキュリティサミットで次のように述べている。「オープンソースにはリスクと利点があり、そのバランスを取ることが必要。ダイナミックな対話を通じて最善の解決策を見出したい。」
報道によれば、同社はモジュール型フィルターとモジュール型メカニズムを備えたプラットフォームを構築中であり、モデルネットワークの管理に活用する予定だ。おそらく、AIの安全性・保護に関する課題に対して、モデル内部の構造からアプローチしようとしているのであろう。
激しい競争が繰り広げられる大規模言語モデル市場において、Mistral AIは卓越した性能と高い適応性で差を付けている。しかし、潜在的なAI安全性の課題に直面しており、業界関係者はオープンソースと安全性の間でいかにバランスを取るかを模索している。
04.グーグルクラウドとともに知能の未来を創造
周知の通り、グーグルクラウドは世界のクラウドコンピューティング分野でトップクラスの存在である。そんなグーグルクラウドとAI分野のダークホースMistral AIが提携したことで、無限の可能性を秘めた未来が徐々に姿を現しつつある。
先月、グーグルクラウドはMistral AIとのグローバルパートナーシップ締結を発表。Mistral AIはグーグルクラウドのインフラを利用して、自社の大規模言語モデルを配布および商用化する。

グーグルクラウドの強力なクラウドコンピューティングおよびビッグデータ技術を活用することで、Mistral AIはモデル推論や事前学習などの分野でかつてない突破を達成できる可能性がある。これはAI技術のさらなる発展を推し進めるとともに、各産業分野にさらにスマートで効率的なソリューションを提供するだろう。
同時に、双方の協力はMistral AIの各業界への実装を加速させる。eコマース、金融、医療、教育など、Mistral AIはあらゆる分野で人々にもっと多くの利便性と幸福をもたらすだろう。
もちろん、Mistral AIの台頭は偶然ではない。活力と革新精神に満ちた企業として、Mistral AIは常にAI技術の境界を探求し、それを実際の問題解決に応用することに尽力している。
その優れた成果と革新能力により、人々はついに考えるようになる:このスタートアップはOpenAIを追い抜き、ヨーロッパのAI分野をリードする存在になる可能性があるのか? その行方に注目しよう。
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News












