DeepSeekの計算能力の制約により、大学のAI研究が壁にぶつかる？

2025.02.12

共有先

TechFlow厳選深潮セレクト

DeepSeekの計算能力の制約により、大学のAI研究が壁にぶつかる？

華為は15の大学と連携し、最強のソリューションを提示。

2025.02.12 - 10:52:47

DeepSeekAI

Web3業界の深掘り報道に専念し潮流を洞察

華為は15の大学と連携し、最強のソリューションを提示。

記事元：新智元

画像提供：無界AI生成

全米TOP5の大学院で機械学習の博士課程に在籍しているにもかかわらず、研究室には大量の計算能力を提供できるGPUが一枚もない？

2024年中頃、あるネットユーザーがRedditに投稿した内容は、すぐにコミュニティ内で大きな議論を巻き起こした――。

年末にはNatureの報道が、学術界がGPU取得において直面する厳しい課題をさらに明らかにした――研究者が学校のGPUクラスタ使用時間の申請のために列をなして待つという状況である。

同様に、中国国内の大学研究室でもGPUが深刻に不足している問題は非常に一般的である。大学が学生自身にコンピューティングリソースを持参させるという信じがたいニュースさえあったほどだ。

このように、「計算能力」というボトルネックは、AIそのものを極めて高いハードルを持つ分野にしてしまっている。

AI人材不足と計算能力不足

一方で、大規模モデルや具身知能などの先端技術の急速な発展により、世界的に人材不足が生じている。

オックスフォード大学教授の試算によると、米国ではAIスキルを求める職種の割合が5倍に増加した。

世界的に見れば、テクノロジーAI（Tech-AI）の職種は9倍、広義のAI（Broad-AI）の職種は11.3倍に増加している。

特にアジアにおける成長は顕著である。

世界各地の大学が学生に重要なAIスキルを習得させようとしているが、前述の通り、現在の計算能力は一種の「贅沢品」になってしまっている。

このギャップを埋めるため、企業と大学の協力が重要な手段となっている。

Kunpeng Ascend 科教イノベーション・インキュベーションセンター、大学研究の布陣開始

幸いなことに、中国の大学に同様のイノベーション体制を構築するために、ファーウェイはすでに動き出している！

現在、ファーウェイは北京大学、清華大学、上海交通大学、浙江大学、中国科学技術大学の5つのトップクラス大学と、「Kunpeng Ascend 科教イノベーション卓越センター」の共同運営契約を締結している。

また、ファーウェイは復旦大学、ハルビン工業大学、華中科技大学、西安交通大学、南京大学、北京航空航天大学、北京理工大学、電子科技大学、東南大学、北京郵電大学など10の大学とも「Kunpeng Ascend 科教イノベーション・インキュベーションセンター」の協力を進めている。

卓越センターおよびインキュベーションセンターの設立は、産業と教育の融合の模範例である：

Ascendエコシステムの導入により、大学の計算能力不足を補い、多くの研究成果の創出を大きく促進している；
カリキュラム改革を通じて、研究課題、産業課題、コンテスト課題を駆動力として、コンピューティング産業の頂点人材を育成している；
アーキテクチャ、計算加速能力、アルゴリズム能力、システム能力の攻堅により、世界レベルのイノベーション成果の創出を目指している；
多数の「AI+X」クロスディシプリナリー分野を形成し、知能化エコシステムの発展を牽引している。

AI研究のための完全自主的な国産計算能力の構築

今日、「Science for AI」の意義は言うまでもない。

Google DeepMindの最新調査によると、ポスドク研究者の3人に1人が大規模言語モデルを活用し、文献レビュー、プログラミング、論文執筆などを支援している。

今年のノーベル物理学賞および化学賞も、いずれもAI分野の研究者に授与された。

AIが研究を支援するプロセスにおいて、GPUは高性能計算を必要とする分野での優れた性能、およびLLMのトレーニングと推論に対する強力な能力により、「黄金」として極めて貴重なものとなり、Microsoft、xAI、OpenAIなどの大手企業が争奪戦を繰り広げている。

しかし、米国によるGPUへの輸出規制により、中国のAIおよび研究分野の進展は困難を極めている。

この溝を越えるために、我々は自らの独立かつ完備したエコシステムを構築し、発展させていかなければならない。

計算能力の面では、ファーウェイのAscendシリーズAIプロセッサが、中国の競争力再構築の重任を担っている。

そして、計算能力の上位層では、NPU/AIプロセッサの利点を最大限に引き出すために、独自開発の計算フレームワークが必要となる。

ご存知の通り、NVIDIA GPU向けに設計されたCUDAアーキテクチャは、AIおよびデータサイエンス分野で一般的に利用されている。

中国国内でこれに対抗し、代替可能な存在として真に位置づけられるのはCANNだけである。

CANNは、ファーウェイがAI用途向けに開発した異種計算アーキテクチャであり、上位ではPyTorch、TensorFlow、MindSporeなどの業界主流AIフレームワークをサポートし、下位ではAscend AIプロセッサを有効化するものであり、Ascend AIプロセッサの計算効率を向上させるための重要なプラットフォームである。

そのため、CANNは技術的に先天的に多くの優位性を持っている。とりわけ重要なのは、AI計算に対するより深いソフトウェア・ハードウェア統合最適化と、よりオープンなソフトウェアスタックである：

まず、自社のMindSporeだけでなく、第三者のPyTorch、TensorFlowなど複数のAIフレームワークをサポートできる；
次に、多様な応用シナリオに対応して、階層的なプログラミングインターフェースを提供し、ユーザーがAscendプラットフォームに基づくAIアプリケーションおよび業務を迅速に構築できる；
さらに、モデル移行ツールを提供しており、開発者がプロジェクトをAscendプラットフォームへ迅速に移行できるようにしている。

現在、CANNはすでに独自のエコシステムを初步的に構築している。技術的には、CANNは多数のアプリケーション、ツール、ライブラリを包含し、整った技術エコシステムを有しており、ユーザーにワンストップの開発体験を提供している。同時に、Ascend技術基盤に基づく開発者コミュニティも徐々に拡大しており、将来の技術応用およびイノベーションの土壌を築いている。

CANNのような異種計算アーキテクチャの上に、AIモデル構築のためのディープラーニングフレームワークが必要となる。

ほぼすべてのAI開発者はディープラーニングフレームワークを使用しており、ほぼすべてのディープラーニングアルゴリズムおよびアプリケーションも、このフレームワークを通じて実装される。

現在、市場には既にGoogleのTensorFlowやMetaのPyTorchといった主要フレームワークがあり、巨大なエコシステムを形成している。

大規模モデルのトレーニング時代に入り、ディープラーニングフレームワークは数千台のコンピュータ規模での効果的なトレーニング能力がさらに求められている。

2020年3月に正式にオープンソース化された全シーン対応のディープラーニングフレームワーク――ファーウェイ昇思MindSporeは、国内におけるこの分野の空白を埋め、真の自律的コントロールを実現した。

MindSporeは、クラウド・エッジ・エンドデバイス全シーンでの展開、大規模モデルトレーニングのネイティブサポート、AI＋科学計算などの主要機能を備え、全シーン連携かつ全プロセス簡素化されたネイティブ開発環境を構築し、国内の研究イノベーションおよび産業応用を加速している。

特筆すべきは、Ascend AIプロセッサの「最適なパートナー」として、MindSporeは「端末・エッジ・クラウド」全シーンをカバーし、統一アーキテクチャのもとで一度のトレーニングで複数箇所への展開が可能であることだ。

地球システムシミュレーションや自動運転から、タンパク質構造予測まで、すべて昇思MindSporeで実現できる。

オープンソースのディープラーニングフレームワークは、幅広い開発者エコシステムがあってこそ、その完成度が高まり、より大きな価値を発揮できる。

調査機関Omdiaが2023年に発表した『中国人工知能フレームワーク市場調査報告』によると、MindSporeはAIフレームワーク利用率の第一グループにランクインしており、TensorFlowに次ぐ位置にある。

さらに、千差万別の業界における推論アプリケーションこそがAI価値を解放する鍵である。GenAIの加速的発展の中で、大学も企業も、推論速度の高速化に対する需要が急務となっている。

例えば、高性能最適化コンパイラTensorRTは、大規模モデルの推論性能を高める強力なツールである。量子化およびスパーシティを活用することで、モデルの複雑さを低減し、ディープラーニングモデルの推論速度を効率的に最適化できる。だが問題は、これがNVIDIA GPUにしか対応していないことだ。

同様に、我々は計算アーキテクチャ、ディープラーニングフレームワークを有している以上、それに対応する推論エンジンも必要となる――それがファーウェイAscend MindIEである。

MindIEは、全シーン対応のAI推論高速化エンジンであり、業界最先端の推論高速化技術を統合し、オープンソースのPyTorchの特性を継承している。

柔軟性と実用性を両立させ、複数の主要AIフレームワークとシームレスに接続でき、さまざまなタイプのAscend AIプロセッサをサポートし、ユーザーにマルチレイヤーのプログラミングインターフェースを提供する。

スタック全体の共同最適化、階層的開放型AI機能によって、MindIEはAscendハードウェアの極限の計算能力を解放し、ユーザーに効率的で迅速なディープラーニング推論ソリューションを提供する。これにより、モデル推論およびアプリケーション開発における技術的難易度の高さ、開発手順の多さという課題を解決し、モデルのスループット性能を向上させ、アプリケーションの上市時間を短縮し、「百モデル千態」を可能にし、多様なAIビジネスニーズに応える。

CANN、MindSpore、MindIEなどの自主的イノベーション技術は、国産計算能力の弱点を補うだけでなく、モデルトレーニング、フレームワークの使いやすさ、推論性能の面で飛躍的な突破を遂げており、国外の先進技術スタックに直接対抗できるレベルに達していることがわかる。

世界級のインキュベーションセンターの構築

技術的優位性に加えて、今後数十年間において、Ascend計算能力の利用は国情に適合していると言える。

国産自社開発の計算能力のみが、変化に富む外部環境の影響から脱却し、研究基盤の安定性を保証できる。

さて、プラットフォームは整ったが、大学の教員や学生がどのようにしてその使い方を学べばよいのか？

昨年9月6日から、ファーウェイは北京大学、上海交通大学、浙江大学、中国科学技術大学の4大学で第1期Ascend AI特別トレーニングキャンプを開催している。数百名の応募者の中、修士・博士課程の学生が90%を占め、コース内容にはAscend領域のCANN、MindSpore、MindIE、MindSpeed、HPC、Kunpeng開発ツールなどが含まれる。

トレーニングキャンプでは、学生たちはコア技術を詳細に学ぶだけでなく、実践的な演習の機会も得られる。このような構成は、学生たちが新しい知識を段階的に理解する特徴に非常に合致している。

例えば、上海交通大の会場では、初日の講義は「移行」をテーマとし、学生たちにAscend AIの基礎ソフトウェア・ハードウェアソリューション、PyTorchモデルのAscendネイティブ開発ケース、MindIE推論ソリューションの特徴および移行情報などを学ばせる。

2日目は「最適化」をテーマとし、Ascend異種計算アーキテクチャCANN、Ascend Cオペレータ開発、大規模モデル長系列推論最適化の実践などを含む。

移行および最適化コースの設定は、長期的視野に立ったものである。

現在、多くの大学の実習コースは基本的にCUDA/X86に基づいて設定されているが、制裁の影響により、計算能力不足の問題はますます顕在化している。この状況下で、移行方法を習得すれば、プロジェクトをAscendプラットフォームに移すことで、学術活動を継続できる。

基本知識を習得した後、学生たちは実践的なケースで実際に手を動かすことができる。ファーウェイの専門家が学生たちにマンツーマンで指導し、大規模モデルの量子化、推論、Codelabsのコード実装などを通じて、Ascend技術スタックを学び、大規模モデル推論の全プロセスを体験する。

実践を経ることで、学生たちはAscendエコシステムについてより深く理解し、将来の技術分野でのキャリアに堅固な基盤を築くことができる。

上海交通大学第1期特別トレーニングキャンプにて、学生たちが実践演習中

コース以外にも、ファーウェイは大学開発者を対象にオペレータチャレンジコンテストを開催し、オペレータ開発のエリートを発掘する。

コンテストでは、開発者がAscend計算リソースおよびCANNの基本機能を活用して深いイノベーションと実践を行うことを奨励し、AIと産業の融合を加速し、開発者能力の向上を促進する。

さらに、インキュベーションセンターは学術成果にも大きな重視を置いている。

KunpengまたはAscendのキーテクノロジーおよびツールを用いて学術研究を行う学生は、大学院生奨学金の申請も可能である。期間中に国際トップカンファレンスや国内トップジャーナルに論文を発表した場合、相応の報奨もある。

同時に、ファーウェイはKunpeng & Ascendエコシステムパートナーと協力し、「優秀人材育成プログラム」を立ち上げた。

このプログラムは、学生が理論から実践へと進み、企業の実際の職場環境に触れることを可能にし、優秀な学生が早期に企業とつながることを支援する。

現在、この優秀人材育成プログラムは15都市で200以上の企業と連携し、2,000以上の技術職を提供しており、10,000人以上の大学生が就職活動を行っている。

要するに、これらの教育実践およびインセンティブプログラムを通じて、学生の参加意欲を大幅に高めることができる。学術経験の向上、研究成果の創出だけでなく、経歴やバックグラウンドも輝かしくなり、就職市場での評価が上がり、国内外のトップ企業からの注目を得やすくなる。

では、最新の技術とその活用方法を習得した後、AIが日々進化する今日、どのようにして本当に画期的な研究成果を育成できるだろうか？

Soraが2024年のテキストから動画生成AIブームを巻き起こして以来、テキストから動画生成の大規模モデルが次々と登場している。北京大学とトゥージャンが共同でオープンソース化したテキストから動画生成プロジェクトOpen-Sora Planは、業界で大きな衝撃を与えた。

実はSoraが登場した時点で、チームはすでにオープンソース版Soraの準備を始めていたが、計算能力とデータ要件が満たせず、プロジェクトは一時中断していた。幸い、北京大学とファーウェイが共同でKunpeng Ascend科教イノベーション卓越センターを設立したことで、チームはすぐに計算能力の支援を得た。

元々チームはNVIDIA A100を使用していたが、Ascendエコシステムに移行した後、いくつもの驚きの発見があった――。

CANNのサポートにより、高効率の並列計算が可能になり、大規模データセットの処理速度が著しく向上した。Ascend Cインターフェースライブラリは、AIアプリケーションの開発プロセスを簡略化した。オペレータ高速化ライブラリは、アルゴリズムの実行性能をさらに最適化した。

さらに重要なのは、オープンなAscendエコシステムにより、大規模モデルおよびアプリケーションの迅速な適応が可能になったことである。

そのため、チームメンバーはAscendエコシステムをゼロから学び始めたにもかかわらず、短期間で迅速に習得できた。

その後のトレーニングでは、さらなる驚きが続いた。例えば、torch_npuを使って開発する際、全体のコードがそのままAscend NPU上でトレーニングおよび推論できた。

モデル分割が必要な場合は、Ascend MindSpeed分散高速化キットが、豊富な大規模モデル分散アルゴリズムおよび並列戦略を提供した。

また、大規模トレーニングでは、MindSpeedとAscendハードウェアの安定性が他の計算プラットフォームよりもはるかに高く、1週間連続稼働が可能だった。

そのため、わずか1ヶ月後、Open-Sora Planが正式にリリースされ、業界から極めて高い評価を受けた。

Open-Sora Planが生成した『黒神話：悟空』の映像はまるで映画のようで、多くのネットユーザーを驚嘆させた

また、Ascend計算能力を活用して、東南大学はマルチモーダル交通大規模モデルMT-GPTを開発した。

以前、交通大規模モデルの実用化は非常に困難だった。理由としては、異なる政府部門がデータを収集することによるデータサイロ問題、データ形式や基準の不統一、交通データの異種多源性などがある。

これらの問題を解決するため、チームはMT-GPT（Multimodal Transportation Generative Pre-trained Transformer）というマルチモーダル交通大規模モデルの概念フレームワークを考案し、マルチモーダル交通システムにおける多角的・多粒度の意思決定問題にデータ駆動型の支援を提供した。

しかし、大規模モデルの開発・トレーニングには、当然ながら計算基盤への要求が極めて高い。

そこで、チームはAscend AIの能力を活用して、交通大規模モデルの開発、トレーニング、チューニング、展開を加速することを選択した。

開発段階では、Transformer大規模モデル開発キットが、多源異種の知識コーパスとマルチモーダル特徴符号化を組み合わせ、マルチモーダル生成問題の理解精度を共同で向上させた。

トレーニング段階では、Ascend MindSpeed分散トレーニング加速キットが、交通大規模モデルに多次元・マルチモーダル・マルチモーダルの加速アルゴリズムを提供した。

チューニング段階では、Ascend MindStudioフルプロセスツールチェーンが、交通分野の専門知識を微調整してトレーニングを最適化した。

展開段階では、Ascend MindIE推論エンジンが、交通大規模モデルの一括推論を支援するとともに、都市間の移行分析、開発、デバッグ、チューニングをサポートした。

まとめると、北京大学のOpen-SoraはSoraの移植プロジェクトであり、オープンソースプロジェクトとしても、グローバルな開発者がさまざまなシーンに応用できるよう支援している。

一方、東南大学のマルチモーダル交通大規模モデルMT-GPTは、Ascend計算能力が研究成果の実用化において持つ実際の力を示しており、都市交通産業に直接貢献している。

これにより、産学研の完全なサイクルが形成された。

これらの豊かな成果はさらに、卓越センター／インキュベーションセンターが大学に学術研究および科学的イノベーションの肥沃な土壌を提供できるだけでなく、多数のAIトップ人材を育成し、世界をリードする研究成果を孵化できることを証明している。

例えば、北京大学チームがOpen-Sora Planを開発している間、袁粒先生は毎日学生たちとファーウェイAscendチームとともにコードやアルゴリズムの開発についてブレインストーミングを行っていた。

試行錯誤の過程で、北京大学チームの多くの学生が高品質な研究実践に直接参加し、非常に高い研究創造性を示した。

平均年齢23歳のこのチームは、中国製AI動画アプリケーションの推進力となった。

この過程で、Kunpeng Ascendエコシステムを習得した若手人材の集団も着実に拡大している。

したがって、大学が国産計算能力およびプラットフォームを用いて研究を行うことは、トップレベルの知性の支援を得るだけでなく、同時にファーウェイ技術エコシステムおよび応用の拡大にも寄与している。

中国はどのようなイノベーション体制を築くべきか？

このように、企業と大学の協力という新しいモデルにおいて、ファーウェイはすでに本格的にスタートしている。

2019年にコンピューティング製品ラインを設立してすぐ、ファーウェイは2020年に教育部と「スマートベース」協働プロジェクトを締結し、全国のトップ72大学で教育協力を展開した。

当時、Kunpeng/Ascendの技術知識はすでに一部の大学学部必修科目に組み込まれていた。

しかし、大学への投資は中長期的な育成プロセスである。学生や教員が関連技術を優先的に理解することが、数年後の大きな価値につながる。

そのため、ファーウェイは毎年10億元を投入し、KunpengおよびAscendのネイティブエコシステムおよび人材育成を推進する計画である。この戦略の実施により、大学の人材および開発者にさらに豊かなリソースと広い発展空間が提供され、すでに10万枚のKunpeng開発ボードおよびAscend推論開発ボード贈呈計画も開始され、教育実験、コンテスト実践、科学技術イノベーションにおいてKunpengおよびAscend技術の積極的な探索と応用を奨励している。

この計画により、教員や学生は開発ボードを身近に触れ、試用できる。教員の教育でも研究実験でも、彼らは自由に新たなアイデアを試すことができ、新たなインスピレーションを生み出せる。

OrangePiとファーウェイAscendが共同開発したOrangePi AIpro開発ボードは、ほとんどのAIアルゴリズムプロトタイピング検証および推論アプリケーション開発のニーズを満たし、AIエッジコンピューティング、ディープビジョンラーニング、ドローン、クラウドコンピューティングなどの幅広い分野に適用可能で、強力な性能と広範な汎用性を示している

一方、中国が現在置かれている特殊な状況――外部からの技術封鎖は、残された時間が少ないことを意味している。我々には独立かつ管理可能な技術スタックが不可欠である。

ネイティブ開発は、未来において避けられない必然である。Made in Chinaこそが、中国の将来の大国情勢に最もふさわしい。

国産化が大勢となるにつれ、Kunpeng/Ascendのような国産技術スタックは、あらゆるITインフラに広がっていくだろう。

卓越センターおよびインキュベーションセンターの始動により、業界の期待も高まっている。

数年のインキュベーションを経て、国産技術基盤を掌握した研究人材が、次々とKunpeng/Ascend技術路線を発展させ、世界をリードする研究成果を生み出していくことが予想される。

TechFlow公式コミュニティへようこそ

Telegram購読グループ：https://t.me/TechFlowDaily

Twitter公式アカウント：https://x.com/TechFlowPost

Twitter英語アカウント：https://x.com/BlockFlow_News

原文リンク

お気に入りに追加

SNSで共有