
OpenAI初の開発者会議:エコシステム構築を先取り、誰もが自分専用のGPTを作成可能に
TechFlow厳選深潮セレクト

OpenAI初の開発者会議:エコシステム構築を先取り、誰もが自分専用のGPTを作成可能に
開発者ツールを提供し、世界を変える。
初のAI春節晚会とも称されるOpenAI DevDayがサンフランシスコで開催された。一連の新製品や新機能の発表とともに、OpenAIは大規模モデル時代におけるエコシステム構想の第一歩を示した。
発表会の冒頭で、AltmanはOpenAIプラットフォームおよび製品に関するいくつかのデータを報告した:週間利用者数は1億人、開発者数は200万人に達し、Fortune 500企業の92%がOpenAI製品を利用している。
価格引き下げ より安価で高速なGPT-4 Turbo
OpenAIは新しいGPT-4 Turboを発表した。現在のGPT-4よりも強力な性能を持つ。
-
2023年4月までのインターネット知識を把握している。
-
128Kのコンテキストウィンドウを持ち、300ページ以上のテキストを処理可能。
-
価格引き下げ:従来のGPT-4よりも安価で、入力側はGPT-4の1/3、出力側はGPT-4の1/2の価格。
-
関数呼び出しが強化され、複数の関数を一度に呼び出せるようになり、正確性も向上。新たなJSON出力モードも追加。
-
GPT-4 Turboはチャット中に画像を入力できるようになり、これは現在BeMyEyesが使用している技術でもある。開発者はAPIを通じてこの機能を利用でき、gpt-4-vision-previewの料金は入力画像のサイズに依存する。例えば、1080×1080ピクセルの画像をGPT-4 Turboに送信するコストは0.00765米ドル。
-
ファインチューニング(fine-tune)が開放され、モデル訓練プロセスの各ステップをカスタマイズ可能。トレーニング済みモデルは企業専用となる。
-
出力速度が向上し、毎分の出力量が倍増。

Assistants API / アシスタントAPI
OpenAIが発表したエージェント型アプリケーション。開発者はAssistants APIを使用して特定の指示を実行し、追加のナレッジベースを読み取り、モデルやツールを呼び出してタスクを完了できる。コードインタプリタ、情報検索、関数呼び出しなどのツールを備える。
-
アシスタントAPIは永続的で無制限のスレッドを提供し、開発者がスレッド状態管理をOpenAIに委譲でき、コンテキストウィンドウの制約を解決できる。
-
コードインタプリタ:サンドボックス実行環境でPythonコードを記述・実行でき、グラフやチャートを生成したり、複数のデータ形式を持つファイルを処理可能。アシスタントが反復的にコードを実行して難解なプログラミングや数学問題を解決できる。
-
情報検索(Retrieval):モデル外の知識(例:独自ドメインデータ、製品情報、ユーザー提供文書など)を活用してアシスタントを強化。ユーザーは文書の埋め込み計算やストレージ、チャンキングや検索アルゴリズムの実装を行う必要がない。
-
関数呼び出し:アシスタントが定義済み関数を呼び出し、その応答をメッセージに統合できるようにする。
16KコンテキストのGPT-3.5 Turbo
OpenAIは同時にGPT-3.5 Turboもアップグレードし、コンテキストウィンドウを16Kまで拡張。
-
入力側の価格は従来のGPT-3.5 16Kの1/3、出力価格はGPT-3.5 16Kと同等。ファインチューニング価格も同様に引き下げ。
-
改善された命令追跡、JSONモード、並列関数呼び出しがサポートされる。
DALL·E 3、TTSのAPI公開、開発者向けに提供
Snapやコカ・コーラなどの企業がDALL·E 3のAPIを使用して顧客向けに画像を生成。このAPIには審査機能が内蔵されており、開発者がプログラムの悪用を防げるようになっている。
開発者はTTS APIを簡単に使い、テキストから自然な人間の音声を生成できる。TTSモデルは6種類のプリセット音声と2つの性別オプションを提供。
Whisper v3およびConsistency Decoderをオープンソース化
Whisperは音声認識ソフトウェアの代表的存在であり、今回v3バージョンがオープンソース化された。まもなくWhisper v3のAPIも公開予定。Consistency DecoderはStable Diffusion VAEの代替品で、Stable Diffusion 1.0+ VAEと互換性のあるすべての画像を改善し、テキスト、顔、直線表現において顕著な向上を実現。
エコシステム構築 誰もが参加可能なGPTsとGPT Store
今回の発表で最も注目を集めたのはGPTsの機能リリースだ。誰でもChatGPTのカスタム版を作成でき、日常生活、仕事、家庭での利用が可能になる。作成者は自分専用または企業内限定のGPTを作成し、他の人と共有することもできる。
作成プロセスはコード不要で、自然言語による対話形式。簡単な指示と追加のナレッジベーステキストを組み合わせるだけで、ネット検索、画像作成、データ分析ができるGPTを迅速に作成できる。
さらに重要なのは、OpenAIが後日GPT Storeをリリースする予定であること。App Storeのように、ユーザーが作成したGPT作品を審査・掲載し、検索可能にする。生産性、教育、娯楽などの優れた作品をおすすめ表示し、作成者は自身のGPTの利用者数に応じて収益分配を受けられる。
プラグイン機能と同様に、ユーザー作成のGPTsは外部データ連携、インターネット接続などの機能をサポート。GPTsをデータベース、メール、ショッピングアシスタントなどに接続可能。Zapierを利用すれば、カレンダーの予約・同期、SMS機能などを簡単に実装できる。
ChatGPTの企業ユーザーは、社内専用のGPTsを構築できる。
真のOpenAI開発者エコシステムが、目前に迫っている。

開発者にツールを そして世界を変える
開発者会議の基調講演の最後に、Sam Altmanは開発者たちへのメッセージを述べた。
「最後に、このすべてを創り出したチームに感謝したいと思います。OpenAIには非常に高い水準の才能が集まっていますが、それでもなお、これらを現実にするには膨大な努力と協働が必要でした。私は本当に、世界で最高の同僚たちと共に働けており、それを誇りに思います。
私たちがこれらすべてを行っているのは、AIが科学技術と社会の革命になると信じているからです。それは多くの面で世界を変えるでしょう。私たちもまた、こうした仕事を通じて価値を提供し、あなた方がさらに多くの価値を創造してくれることを嬉しく思います。
以前も言いましたが、人々にツールを与えれば、彼らは世界を変えることができるのです。私たちは、AIが個人や組織に、かつてない規模で新たな能力を与えると信じています。それによって人類全体が、かつてない規模へと引き上げられると。
私たちはより多くを成し遂げ、創造し、所有できるようになります。知能がどこにでも存在するようになれば、誰もが望むものをすぐに手に入れる超能力を持つことになるのです。」
TechFlow公式コミュニティへようこそ
Telegram購読グループ:https://t.me/TechFlowDaily
Twitter公式アカウント:https://x.com/TechFlowPost
Twitter英語アカウント:https://x.com/BlockFlow_News













