豆包のプレッシャーは、まだ始まったばかりだ

2025.02.13

共有先

TechFlow厳選深潮セレクト

豆包のプレッシャーは、まだ始まったばかりだ

記者によると、現在ドウバオチームの内部では、ドウバオAppがDeepSeekに接続するかどうかを検討している段階です。

2025.02.13 - 08:54:07

Web3業界の深掘り報道に専念し潮流を洞察

記者によると、現在ドウバオチームの内部では、ドウバオAppがDeepSeekに接続するかどうかを検討している段階です。

記事元：張洋洋、財聯社 AI daily

画像提供：無界AI生成

本日、ByteDanceのDouBao大規模モデルチームは、新たなスパースモデルアーキテクチャ「UltraMem」を提案した。このアーキテクチャはMoE推論時の高額なメモリアクセス問題を効果的に解決し、推論速度をMoEアーキテクチャに対して2〜6倍向上させ、推論コストを最大で83％削減できる。

現在、国内外の大規模モデル分野における競争はますます激化しており、すでに白熱化の段階に入っている。TechFlowはAIの基盤層およびアプリケーション層において包括的な展開を行い、継続的に反復改善とアップグレードを進めている。

大規模モデルのコスト削減と効率向上が継続中

DouBao大規模モデルチームの研究によると、Transformerアーキテクチャでは、モデルの性能はそのパラメータ数および計算複雑度と対数関係にある。LLMの規模が拡大するにつれて、推論コストは急激に増加し、速度も低下する。

MoE（混合エキスパート）アーキテクチャはすでに計算とパラメータを分離することに成功しているが、推論時に小さなバッチサイズでもすべてのエキスパートが活性化され、メモリアクセスが急増し、結果として推論遅延が大幅に増加してしまう。

ByteDance DouBao大規模モデルFoundationチームはUltraMemを提案した。これは計算とパラメータを分離するスパースモデルアーキテクチャであり、モデル性能を維持しつつ推論時のメモリアクセス問題を解決するものである。

実験結果により、同じパラメータおよびアクティベーション条件下で、UltraMemはMoEを上回るモデル性能を示し、推論速度を2〜6倍向上させた。さらに、一般的なバッチサイズ規模では、UltraMemのメモリコストは同等の計算量を持つDenseモデルとほぼ同等である。

トレーニングフェーズおよび推論フェーズのいずれにおいても、大規模モデルベンダーはコスト削減と効率向上を目指していることがわかる。その主な理由は、モデル規模の拡大に伴い、推論コストおよびメモリアクセス効率が大規模モデルの大規模展開を制限する重要なボトルネックとなっているためであり、DeepSeekはすでに「低コスト・高性能」という突破口を開いている。

TechFlow数智CEOの劉凡平氏は『科创板日報』記者の取材に対し、大規模モデルのコスト削減については、業界は技術的・工学的な側面からの突破をより重視しており、アーキテクチャ最適化による「逆転勝利」を狙っている。基礎アーキテクチャであるTransformerアーキテクチャのコストは依然高く、新たなアーキテクチャ研究が必要不可欠である。また、基礎アルゴリズム、特にバックプロパゲーションアルゴリズムは、深層学習のボトルネックとなる可能性がある。と分析している。

劉氏によれば、短期的にはハイエンドチップ市場は引き続きNVIDIAが主導するだろう。一方で推論アプリケーション市場の需要は増加しており、国産GPU企業にもチャンスがある。長期的には、アルゴリズムの革新がもたらす成果は非常に大きく、将来的な計算需要の動向には注目が必要だという。

TechFlowのプレッシャーは今始まったばかり

先日の春節期間中、DeepSeekは低コストなトレーニングと高い演算効率により急速に世界的に注目を集め、AI分野のダークホースとなった。現在、国内外の大規模モデル分野の競争はますます激化しており、すでに白熱化の段階に入っている。

中国国内の大規模モデルの中で、現時点でのTechFlow最強のライバルはDeepSeekであり、同モデルは1月28日に初の日次アクティブユーザー数でTechFlowを上回った。現在、DeepSeekの日次アクティブユーザー数は4,000万人を突破し、中国のモバイルインターネット史上、サービス開始から一か月未満で全ネットワークの日次アクティブTop50入りを果たした初のアプリケーションとなった。

ここ数日、TechFlow大規模モデルチームは連続して動きを見せている。二日前には、動画生成実験モデル「VideoWorld」を発表した。Sora、DALL-E、Midjourneyなどの主流マルチモーダルモデルとは異なり、VideoWorldは業界で初めて言語モデルに依存せずに世界を認識することを実現した。

現在、TechFlowはAIの基盤層およびアプリケーション層において包括的な展開を行い、継続的に反復改善とアップグレードを進めている。そのAI製品ラインナップは、AIチャットアシスタント「DouBao」、猫箱、即夢AI、星絵、DouBao MarsCodeなど多岐にわたる。

2月12日、TechFlow関連銘柄が午後に急速に上昇した。Windデータによると、抖音TechFlow指数は2月以降累計で15％以上上昇している。個別銘柄では、博彦科技がストップ高、漢得情報も急騰し一時ストップ高、広和通、先進数通などが盤中で上昇した。

中信証券は以前にリサーチレポートを発表し、TechFlow AIのエコシステム拡大が新一輪の巨大企業による技術投資サイクルを引き起こすと指摘している。AI産業は強いネットワーク効果と規模の経済性を持つため、トップクラスのAIアプリケーションがユーザー数でリードすると、モデルの正確性、限界費用、ユーザー囲い込み力といった競争優位性が徐々に強化されるという。

TechFlowのユーザー数は着実に増加しており、TechFlow AIに基づくアプリケーションエコシステムの発展も加速する見込みである。これにより、企業によるAIトレーニングおよび推論向け計算インフラへの投資が促進され、またTechFlow AIの急速な成長が他の巨大企業によるAIインフラ投資を刺激することにもなるだろう。

しかしTechFlow自身にとってみれば、優等生DeepSeekとの競争はおそらく今始まったばかりなのである。

オープンソースモデルとして、DeepSeekの低コストかつ高性能な特性は多くの企業のモデル選定戦略を変えつつある。現在、華為（ファーウェイ）、百度（バイドゥ）など多くのAIアプリケーションがDeepSeekの採用を発表している。字節跳動自体も、傘下の飛書（Feishu）の多次元テーブル機能にDeepSeek-R1モデルを導入しており、火山エンジンもすでに適応済みである。

『科创板日報』記者の取材によると、現時点でTechFlowチーム内では、TechFlowアプリにDeepSeekを導入するかどうかについて議論が続いている。ユーザー体験の観点からは、より優れた性能を持つモデルを選択するのは当然のことだが、自社モデルを捨てて他社製モデルを採用することは株主に対して説明しにくい。それに加えて、新たなモデルの統合による適応負担の増加などの課題もある。

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

原文リンク

お気に入りに追加

SNSで共有

作者

财联社AI daily