今日运势评分

-6

本月运势

甲申月

震荡偏多

甲克戊,寅冲申
癸不词讼理弱敌强
丑不冠带主不还乡

祭祀,塞穴,入殓,破土,安葬,移柩,馀事勿取

诸事不宜

月相

寝待

底部反弹

日冲

Powered by RitMEX

TRUMP9.29 5.02%

SUI3.89 6.24%

TON3.45 2.20%

TRX0.35 2.23%

DOGE0.24 6.44%

XRP3.23 3.46%

SOL197.44 13.26%

BNB836.15 3.89%

ETH4649.22 8.73%

BTC119200.23 0.60%

ETH Gas0.70 Gwei

贪婪
68

OpenAI 正在悄悄研发代号「草莓」的神秘项目,其能力或已达到博士水平

该项目旨在实现迄今为止 AI 模型无法实现的深度研究。

撰文:Samuel Nwite

编译:MetaverseHub

为了在飞速发展的人工智能领域保持领先地位,OpenAI 正在秘密研发一种新的 AI 模型,代号为「草莓」

这一消息来自路透社和一位知情人士透露的内部文件。这家由微软支持的初创公司以其 ChatGPT 产品而闻名,目前正全力展示其模型具备的高级推理能力,这可能会成为 AI 技术的一大飞跃。

01.「草莓」项目内部一览

根据路透社 5 月份看到的一份最新内部文件,OpenAI 团队正在深入研究「草莓」项目。虽然该文件的确切时间线尚不清楚,但它概述了 OpenAI 利用「草莓」进行高级人工智能研究的计划。

该项目被称为「正在进行中」,即使在公司内部也一直处于保密状态。「草莓」的目标是让人工智能不仅能生成答案,还能自主、可靠地浏览互联网,进行 OpenAI 所称的「深度研究」。

「这是迄今为止人工智能模型无法实现的。」消息人士指出了该项目的雄心勃勃。

在被问及「草莓」和这篇报道中的细节时,OpenAI 的一位发言人在一份声明中说道:「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。持续研究新的 AI 能力是业界的普遍做法,我们的共同信念是,随着时间的推移,这些系统的推理能力将不断提高。」

但这位发言人没有直接回答有关「草莓」的问题。

02.从 Q 到「草莓」推理新时代

有消息称,「草莓」是前一个名为 Q 的项目的继任者。

据两位知情人士透露,OpenAI 内部已将 Q 视为一项突破,因为它能够回答复杂的科学和数学问题,超越了目前大多商业化模型的能力。

据彭博社报道,在今年的一次内部全体会议上,OpenAI 展示了一个研究项目,展示了新的类人推理能力。

虽然路透社无法证实所展示的项目是否为「草莓」,但这与该公司一直以来为增强人工智能推理能力所做的努力不谋而合。

OpenAI 首席执行官奥特曼强调了推理在 AI 中的重要性,他在今年早些时候表示,「最重要的进步领域将围绕推理能力展开」

03.人工智能推理的挑战

研究人员认为,提高人工智能模型的推理能力是实现人类或超人级智能的关键。虽然大型语言模型可以高效地总结文本和撰写文章,但它们在常识性问题和逻辑任务上会经常失误,导致所谓的「幻觉」或生成错误信息。

根据 AI 研究人员的描述,推理涉及人工智能规划、理解物理世界和解决多步骤问题的能力

OpenAI 的「草莓」项目旨在通过采用专门的后期训练过程来克服这些挑战。这包括在大量数据集上对人工智能模型进行预训练后,对其进行微调。

据一位知情人士透露,「草莓」的方法与斯坦福大学的「自学推理」(STaR)有相似之处,后者允许人工智能模型迭代地创建自己的训练数据,有可能使它们达到更高的智能水平。

STaR 的创造者之一、斯坦福大学教授 Noah Goodman 评论说:「我认为这既令人兴奋,又令人恐惧......如果事情继续朝着这个方向发展,作为人类,我们就有一些严肃的事情需要思考了。」

04.长任务规划和自主研究

「草莓」项目雄心勃勃的目标之一是能够执行长期任务(LHT),这要求人工智能在较长时间内计划并执行一系列行动。

内部文件显示,OpenAI 正在一个「深度研究」数据集上训练和评估模型,以实现这些能力。

虽然该数据集的具体内容和延长时间仍未披露,但目标很明确:让人工智能能够在计算机使用代理(CUA)的帮助下自主开展研究,并根据研究结果采取行动。

05.竞争激烈的人工智能产业

在增强人工智能推理能力方面,OpenAI 并非孤军奋战。谷歌、Meta 和微软等大型科技公司以及众多学术实验室也在探索各种技术,以提高人工智能的推理能力。

然而,对于大型语言模型能否在预测中纳入长期规划和高级推理,人们的看法却不尽相同。Meta 的现代人工智能先驱 YannLeCun 就经常对大语言模型(LLM)能否实现类人推理的能力表示怀疑。

「草莓」代表了 OpenAI 战略的重要组成部分,旨在解决当前 AI 模型的局限性。通过开发更先进的推理能力,OpenAI 旨在为人工智能开启新的可能性,从科学发现到创建新的软件应用。

同时,该公司一直在向开发者和合作伙伴发出信号,表示即将发布推理能力显著增强的技术。

「草莓」的开发包括微调等后期训练方法,其中涉及人类反馈和迭代学习过程。这些技术旨在完善人工智能模型,提高它们在特定任务中的表现。

通过「草莓」技术取得的进步可以重新定义人工智能的能力,并为这些模型所能达到的目标设定新的标准。

虽然前进的道路充满挑战,但潜在的回报也是巨大的,预示着一个智能、自主的人工智能系统的新时代即将到来。

用 OpenAI 发言人的话来说,「我们希望我们的人工智能模型能像我们一样看待和理解这个世界。如果‘草莓’项目取得成功,我们就离实现这一愿景更近了一步。」

OpenAI 引入了一个五级系统来跟踪其在实现通用人工智能(AGI)的进展。这些等级从代表当前对话式人工智能的第 1 级,到设想能够管理和执行整个组织工作的第 5 级,涵盖了不同层次的 AI 能力。

下面是 OpenAI 划定的五个人工智能等级:

1.聊天机器人:具备对话语言的 Al

2.推理者:具备人类水平的问题解决能力

3.代理者:能够采取行动的系统

4.创新者:能够帮助发明创造的 AI

5.组织者:能够完成组织工作的 Al

OpenAI 认为「草莓」正在接近第 2 级,这一级涉及解决问题,类似于不借助工具的博士水平。该框架旨在提供一种结构化的方法来理解和开发人工智能系统,从而最终超越人类智能

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
作者元宇宙之心
相关文章
2025.08.13 - 2 小时前
当预测市场遇上永续合约,又一个万亿市场值得发掘
通过合理设计,HIP-3 可以成为 Kalshi 和 Polymarket 的补充和替代方案。
2025.08.13 - 2 小时前
以太坊财库公司:链上生态的「搅局者」还是「建设者」?
尽管目前仍处于积累阶段,但更高的链上参与度可能在增强以太坊流动性和安全性的同时,加大其对企业资金风险的敞口。
2025.08.13 - 4 小时前
Zora 迎来新高,是真有内容还是 Coinbase 发力?
Jesse 和 Toly 吵完架后 Zora 迎来了新高。
2025.08.13 - 4 小时前
稳定币新战场:Stripe 和 Circle 的 Layer 1 之争
这不是速度与功能之争,而是“开放协议”与“品牌铁轨”的再选择。
2025.08.13 - 5 小时前
加密早报:ETH 突破 4,600 美元,复星国际拟申请香港稳定币牌照
Grayscale 在特拉华州注册成立 Cardano 与 Hedera 信托 ETF。
2025.08.12 - 19 小时前
京东招聘 DeFi 专家:稳定币只是冰山一角,PayFi 才是深海蓝图
一份招聘广告,有时比一份年度财报更能揭示一家公司的战略意图。
2025.08.12 - 19 小时前
PUMP 反弹超 60%,Group Coins 或成这场 Meme 竞赛的胜负手
PumpFun 正在迅速采取措施试图夺回市场份额。
2025.08.12 - 20 小时前
美国劳工统计局的新局长人选,特朗普选择了「MAGA 派」
一个政治色彩浓厚的人选执掌 BLS,可能进一步动摇市场对美国核心经济指标的信心。
2025.08.12 - 23 小时前
解码香港反洗钱蓝图:稳定币的合规革命
嵌入代码实现稳定币合规。
2025.08.12 - 23 小时前
资本驱动合规?洞悉 Polymarket 全球监管困境与生存之道
Polymarket 的故事揭示了一种资本驱动合规的合规路径。