OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

2024.07.15

分享至

TechFlow Selected深潮精選

OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

該項目旨在實現迄今為止 AI 模型無法實現的深度研究。

2024.07.15 - 11:12:55

專注 Web3 行業深度報導，洞察潮水流動的方向

該項目旨在實現迄今為止 AI 模型無法實現的深度研究。

撰文：Samuel Nwite

編譯：MetaverseHub

為了在飛速發展的人工智能領域保持領先地位，OpenAI 正在秘密研發一種新的 AI 模型，代號為「草莓」。

這一消息來自路透社和一位知情人士透露的內部文件。這家由微軟支持的初創公司以其 ChatGPT 產品而聞名，目前正全力展示其模型具備的高級推理能力，這可能會成為 AI 技術的一大飛躍。

01.「草莓」項目內部一覽

根據路透社 5 月份看到的一份最新內部文件，OpenAI 團隊正在深入研究「草莓」項目。雖然該文件的確切時間線尚不清楚，但它概述了 OpenAI 利用「草莓」進行高級人工智能研究的計劃。

該項目被稱為「正在進行中」，即使在公司內部也一直處於保密狀態。「草莓」的目標是讓人工智能不僅能生成答案，還能自主、可靠地瀏覽互聯網，進行 OpenAI 所稱的「深度研究」。

「這是迄今為止人工智能模型無法實現的。」消息人士指出了該項目的雄心勃勃。

在被問及「草莓」和這篇報道中的細節時，OpenAI 的一位發言人在一份聲明中說道：「我們希望我們的人工智能模型能像我們一樣看待和理解這個世界。持續研究新的 AI 能力是業界的普遍做法，我們的共同信念是，隨著時間的推移，這些系統的推理能力將不斷提高。」

但這位發言人沒有直接回答有關「草莓」的問題。

02.從 Q 到「草莓」推理新時代

有消息稱，「草莓」是前一個名為 Q 的項目的繼任者。

據兩位知情人士透露，OpenAI 內部已將 Q 視為一項突破，因為它能夠回答複雜的科學和數學問題，超越了目前大多商業化模型的能力。

據彭博社報道，在今年的一次內部全體會議上，OpenAI 展示了一個研究項目，展示了新的類人推理能力。

雖然路透社無法證實所展示的項目是否為「草莓」，但這與該公司一直以來為增強人工智能推理能力所做的努力不謀而合。

OpenAI 首席執行官奧特曼強調了推理在 AI 中的重要性，他在今年早些時候表示，「最重要的進步領域將圍繞推理能力展開」。

03.人工智能推理的挑戰

研究人員認為，提高人工智能模型的推理能力是實現人類或超人級智能的關鍵。雖然大型語言模型可以高效地總結文本和撰寫文章，但它們在常識性問題和邏輯任務上會經常失誤，導致所謂的「幻覺」或生成錯誤信息。

根據 AI 研究人員的描述，推理涉及人工智能規劃、理解物理世界和解決多步驟問題的能力。

OpenAI 的「草莓」項目旨在通過採用專門的後期訓練過程來克服這些挑戰。這包括在大量數據集上對人工智能模型進行預訓練後，對其進行微調。

據一位知情人士透露，「草莓」的方法與斯坦福大學的「自學推理」（STaR）有相似之處，後者允許人工智能模型迭代地創建自己的訓練數據，有可能使它們達到更高的智能水平。

STaR 的創造者之一、斯坦福大學教授 Noah Goodman 評論說：「我認為這既令人興奮，又令人恐懼......如果事情繼續朝著這個方向發展，作為人類，我們就有一些嚴肅的事情需要思考了。」

04.長任務規劃和自主研究

「草莓」項目雄心勃勃的目標之一是能夠執行長期任務（LHT），這要求人工智能在較長時間內計劃並執行一系列行動。

內部文件顯示，OpenAI 正在一個「深度研究」數據集上訓練和評估模型，以實現這些能力。

雖然該數據集的具體內容和延長時間仍未披露，但目標很明確：讓人工智能能夠在計算機使用代理（CUA）的幫助下自主開展研究，並根據研究結果採取行動。

05.競爭激烈的人工智能產業

在增強人工智能推理能力方面，OpenAI 並非孤軍奮戰。谷歌、Meta 和微軟等大型科技公司以及眾多學術實驗室也在探索各種技術，以提高人工智能的推理能力。

然而，對於大型語言模型能否在預測中納入長期規劃和高級推理，人們的看法卻不盡相同。Meta 的現代人工智能先驅 YannLeCun 就經常對大語言模型（LLM）能否實現類人推理的能力表示懷疑。

「草莓」代表了 OpenAI 戰略的重要組成部分，旨在解決當前 AI 模型的侷限性。通過開發更先進的推理能力，OpenAI 旨在為人工智能開啟新的可能性，從科學發現到創建新的軟件應用。

同時，該公司一直在向開發者和合作夥伴發出信號，表示即將發佈推理能力顯著增強的技術。

「草莓」的開發包括微調等後期訓練方法，其中涉及人類反饋和迭代學習過程。這些技術旨在完善人工智能模型，提高它們在特定任務中的表現。

通過「草莓」技術取得的進步可以重新定義人工智能的能力，併為這些模型所能達到的目標設定新的標準。

雖然前進的道路充滿挑戰，但潛在的回報也是巨大的，預示著一個智能、自主的人工智能系統的新時代即將到來。

用 OpenAI 發言人的話來說，「我們希望我們的人工智能模型能像我們一樣看待和理解這個世界。如果‘草莓’項目取得成功，我們就離實現這一願景更近了一步。」

OpenAI 引入了一個五級系統來跟蹤其在實現通用人工智能（AGI）的進展。這些等級從代表當前對話式人工智能的第 1 級，到設想能夠管理和執行整個組織工作的第 5 級，涵蓋了不同層次的 AI 能力。

下面是 OpenAI 劃定的五個人工智能等級：

1.聊天機器人：具備對話語言的 Al

2.推理者：具備人類水平的問題解決能力

3.代理者：能夠採取行動的系統

4.創新者：能夠幫助發明創造的 AI

5.組織者：能夠完成組織工作的 Al

OpenAI 認為「草莓」正在接近第 2 級，這一級涉及解決問題，類似於不借助工具的博士水平。該框架旨在提供一種結構化的方法來理解和開發人工智能系統，從而最終超越人類智能。

歡迎加入深潮 TechFlow 官方社群

Telegram 訂閱群：https://t.me/TechFlowDaily

Twitter 官方帳號：https://x.com/TechFlowPost

Twitter 英文帳號：https://x.com/BlockFlow_News

原文連結

添加收藏

分享社交媒體

作者

元宇宙之心

OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

TechFlow Selected深潮精選

OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

01.「草莓」項目內部一覽

02.從 Q 到「草莓」推理新時代

03.人工智能推理的挑戰

04.長任務規劃和自主研究

05.競爭激烈的人工智能產業

相關文章

文章內容

華爾街分析師被收買了？SpaceX 萬億估值背後的利益交換

Robinhood Chain 全景覆盤：除了 cashcat 等 meme，還有哪些項目值得關注？

市值前 1000 加密項目僅 67 個有維基百科頁面，ChatGPT 對加密行業的「理解」正在被扭曲

摩根士丹利研報解讀：蘋果的漲價遊戲，本質上是在對沖芯片成本爆炸

WebX Tokyo：HashKey 機構論壇與黑客松雙線發力，加速鏈上金融生態落地

加密企業優先股交易額飆升至 130 億美元，Strategy 和 Alphabet 領銜“新融資工具”破圈

OpenUSD 圍剿 USDC，Circle 的護城河還穩嗎？

韓國股市暴跌引發 2.86 億美元強平，但 Upbit 交易量暴漲 1426%

比特幣國庫抵押品爆倉倒計時：有些貸款只給 12 小時救命

摩根士丹利研報解讀：排名第三卻訂單排滿 7.7 年，NTT 碾壓科技巨頭

深潮精選
更多>

OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

TechFlow Selected深潮精選

OpenAI 正在悄悄研發代號「草莓」的神秘項目，其能力或已達到博士水平

01.「草莓」項目內部一覽

02.從 Q 到「草莓」推理新時代

03.人工智能推理的挑戰

04.長任務規劃和自主研究

05.競爭激烈的人工智能產業

相關文章

文章內容

華爾街分析師被收買了？SpaceX 萬億估值背後的利益交換

Robinhood Chain 全景覆盤：除了 cashcat 等 meme，還有哪些項目值得關注？

市值前 1000 加密項目僅 67 個有維基百科頁面，ChatGPT 對加密行業的「理解」正在被扭曲

摩根士丹利研報解讀：蘋果的漲價遊戲，本質上是在對沖芯片成本爆炸

WebX Tokyo：HashKey 機構論壇與黑客松雙線發力，加速鏈上金融生態落地

加密企業優先股交易額飆升至 130 億美元，Strategy 和 Alphabet 領銜“新融資工具”破圈

OpenUSD 圍剿 USDC，Circle 的護城河還穩嗎？

韓國股市暴跌引發 2.86 億美元強平，但 Upbit 交易量暴漲 1426%

比特幣國庫抵押品爆倉倒計時：有些貸款只給 12 小時救命

摩根士丹利研報解讀：排名第三卻訂單排滿 7.7 年，NTT 碾壓科技巨頭

深潮精選更多>

深潮精選
更多>