今日运势评分

-3

本月运势

丁亥月

震荡偏多

丁破格,未害子
丁不剃头头必生疮
未不服药毒气入肠

订盟,纳采,会亲友,祭祀,祈福,修造,动土,安机械,破土,安葬

嫁娶,移徙,出火,开市,入宅

月相

日冲

Powered by RitMEX

ONDO0.49 -3.96%

TRUMP5.96 -2.25%

SUI1.63 -2.48%

TON1.59 -2.59%

TRX0.29 2.36%

DOGE0.15 -2.48%

XRP2.09 -4.45%

SOL138.77 -3.78%

BNB903.43 -1.19%

ETH3164.78 -1.37%

BTC92108.66 -1.13%

ETH Gas0.36 Gwei

恐惧
26

增强版 Sora 生图模型发布:不仅能直接在 ChatGPT 用,还抢了梗图作者的饭碗

官方带头画梗图。

在 DeepSeek 24 小时前刚刚发布了 V3 模型 0324 版本更新之后,OpenAI 似乎真的有点「不甘示弱」的较劲感,在北京时间 3 月 26 日凌晨宣布了新产品的发布预告。

虽然在正式开始之前,有一些传言猜测本次有可能发布 GPT-5,但根据以往 OpenAI 的各种产品发布节奏来看,这次并不会是一次重磅更新,但本次直播中,发布的整合进 ChatGPT 中的新版 Sora,还是给大家带来的意料之外的「节目效果」。

目前,整合进 ChatGPT 中的 Sora,相比于独立应用版本,能力暂时被局限在了图像生成,但据 OpenAI 在直播中介绍,该模型比之前的模型有了质的飞跃。

据介绍,开发团队使用了GPT-4o「全模态」(或可以生成文本、图像、音频和视频等任何类型数据的模型)能力为基础,来开发这个版本的 Sora。因此用户可以直接说出自己的需求,甚至上传或者拍一张照片,作为提示词来使用。

比如直播现场的演示环节,就直接用手机给 Sam Altman 在内的三人来了张自拍,并要求 Sora 生成一张「动漫风格的版本」。

这还没完,他们三人甚至还现场演示了让 Sora 在图片上添加一段文本「Feel The AGI」(感受通用人工智能)。现场画了第一张新版 Sora 的表情包。

这个现场生成的表情包不仅文本准确清晰,并且准确理解了当代流行梗图中的包括粗体字等必备元素,已经能直接拿来当梗图发到各种群里了。

由于是 OpenAI 官方带头整活,评论区也有不少用户也被激发热情,尝试着把相同的提示词喂给 Grok,用相同的提示词和照片,生成同样风格的内容 ———— 但显然效果还是比新版 Sora 差了不少,反而带来了更喜感的效果。

除了带头画梗图,OpenAI 还演示了新版本 Sora 在文本渲染方面的改进,可以让在图像上生成没有拼写错误的连贯文本的成功率明显提升。

在另一个演示场景中,OpenAI 团队让 Sora 去生成一幅用于理解相对论的漫画卡片。

不同于以往生图模型中,在文本生成部分经常容易变得混乱不堪,甚至是「AI 造字」的情况发生,新版 Sora 其原生图像生成,生成的文本,已经没有任何明显错乱,甚至还在漫画生成了非常自然流畅的日文,意外的让日文社区的不少日本用户「炸锅」。

对于图片生成模型来讲,过去正确渲染文本是一个巨大的挑战。如果小标题或文本元素有拼写错误或错误,整个图像都可能变得无法使用。

此外在这个案例中,OpenAI 还演示了类似对相对论这样「世界上现有知识」的正确引用。

「如果我画一张图像,我会受到自身技能的限制……以及我积累的所有世界知识的限制,」 ChatGPT多模态产品负责人 Jackie Shannon 在接受媒体采访时解释这个功能的必要性。

「该模型将世界知识代入其中,因此当你要求生成牛顿棱镜实验的图像时,你无需解释「牛顿棱镜实验」这件事它本身是什么,就能得到准确的图像。」

除了上述这些直播中提到的模型能力改进,OpenAI 还表示新版 Sora 大幅提升了在属性和对象之间保持正确关系的能力。例如,绑定能力较差的模型可能会将要求生成蓝色星星和红色三角形的提示词,生成为红色星星而没有三角形。

据 OpenAI 介绍,现有的大多数图像模型在这方面都很容易「犯错」,尤其是当被要求渲染多个项目(通常在5到8个左右)时,经常会混淆颜色和形状。而新版 Sora 的图像生成功能,可以正确绑定15到20个对象的属性,在理解各自的复杂需求的同时,保证不会被误导,从而大幅提高成功率。

除了这些使用体验上的改进,还有一个细节是,OpenAI 已经确认,新版 Sora 生成图像的时间比以前更长,但 OpenAI 认为这是一个值得的权衡。

「虽然我们在延迟方面肯定还有改进的空间……但(我们觉得)这些生成图片的质量、功能和世界知识,确实弥补了用户需要等待的额外几秒钟,」Shannon说。

至于生图领域的安全问题 —— 从去年到今年已经出现多次伪造名人不雅图像、热点事件虚假图像,以及 Google Gemini 去除照片原水印这样的问题,OpenAI 团队强调新版 Sora 已经可以去除照片水印,同时阻止生成性深度伪造图像,并拒绝生成相关的内容请求。同时所有生成的图像都将包含标准的C2PA元数据,以标记该图像是由OpenAI创建的。

目前,新版集成在 ChatGPT 内的 Sora 图像生成模型功能,已经开放给 Pro 和 Plus 订阅套餐的用户,并且 OpenAI 承诺,新版 Sora 也会在不久的将来,提供给免费版本和 API。

现在我最想做的,就是立即让它帮我画自己的梗图了。

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/BlockFlow_News
作者张勇毅
相关文章
2025.12.05 - 36 分钟前
暴赚 6200 倍,谁是摩尔线程的最大赢家?
12月5日,摩尔线程正式登陆科创板,开盘价报650元,较114.28元的发行价暴涨468.78%。
2025.12.05 - 41 分钟前
Bitget 每日早报:21shares 于纳斯达克推出 2 倍杠杆 SUI ETF,美财政部债务破 30 万亿美元
摩根:Strategy能否挺住或成比特币短期走势关键。
2025.12.05 - 3 小时前
全球 DAO 第一案之后,链上借贷的「去中心化外衣」还能撑多久?
链上借贷的下一个爆发点无疑是 RWA,将现实世界的资产(如国债、房产)引入链上。
2025.12.05 - 5 小时前
链上价格发现
为什么发现资产公允价格的能力要取决于你所在的时区或星期几?
2025.12.05 - 5 小时前
「影子联储主席」哈塞特发声:下周美联储应该降息,预计 25 基点
不过,德银认为即使哈塞特上任,实际执行降息仍面临重重障碍。
2025.12.05 - 6 小时前
加密早报:美国初请失业金人数骤降,Base 推出 Solana 跨链桥
路透调查结果显示,超八成经济学家预计美联储12月将降息25个基点。
2025.12.04 - 21 小时前
美银 2026 年十大重磅预测:AI 热潮延续、中美经济超预期增长
美国银行上调了对中国经济的增长预期。
2025.12.04 - 21 小时前
盗电超 10 亿美元,马来西亚比特币矿工遭严厉追查
在马来西亚,打击非法比特币挖矿团伙已经变成了一场猫捉老鼠的游戏。
2025.12.04 - 21 小时前
火币成长学院|加密市场宏观研报:宏观流动性、机构化与风险重估的关键窗口
总体来看,本轮反弹在情绪层面显著改善市场气氛,在技术层面重塑关键支撑,在资金层面释放潜在参与意愿,但距离趋势性牛市还有阶段性距离。
2025.12.04 - 22 小时前
人民币强势反击,稳定币变成了“风险资产”
随着美联储降息不断深入,人民币仍存在进一步升值空间。