OpenAI 首届开发者大会:抢占生态布局,人人都能打造自己的 GPT

给开发者工具,然后改变这个世界。

被称为首届 AI 春晚的 OpenAI DevDay 在旧金山举办。随着一系列新产品、新功能的发布,OpenAI 初步展示了它在大模型时代的生态布局。

在发布会的开始,Altman 报告了 OpenAI 平台和产品的一些数据:每周使用量达到 1 亿人次, 开发者数量达到 200 万,以及 92% 的财富 500 强企业在使用 OpenAI 产品。

降价 更便宜更快速的 GPT-4 Turbo

OpenAI 发布了新的 GPT-4 Turbo,能力比现在的 GPT-4 更强。

  • 了解截至 2023 年 4 月的互联网知识。

  • 128K 上下文窗口,可以容纳相当于 300 多页的文本。

  • 降价:价格比之前的 GPT-4 便宜,输入侧为 GPT-4 的 1/3 价格,输出侧为 GPT-4 的 1/2 价格。

  • 函数调用更强了,可以一次性调用多个函数,准确性也更高。还有新的输出 json 模式。

  • GPT-4 Turbo 支持在聊天中输入图片,这也是现在 BeMyEyes 所使用的技术。开发者可以通过 api 使用此功能,gpt-4-vision-preview 定价取决于输入图像大小。例如,将 1080×1080 像素的图像传递给 GPT-4 Turbo 的成本为 0.00765 美元。

  • 开放 Fine-Tune,支持修改模型训练过程的每个步骤,并且训练好后的模型是公司专属。

  • 输出速率更快,每分钟的输出速度增加了一倍。

Assistants API / 助手 API

OpenAI 发布的类 agent 应用,开发者可以使用 Assistants API 执行特定指令、读取额外的知识库、调用模型和工具完成任务。配备了代码解释器、检索以及函数调用等工具。

  • Assistant API 拥有持久且无限长的线程,允许开发人员将线程状态管理移交给 OpenAI 并解决上下文窗口约束。

  • 代码解释器:在沙盒执行环境中编写和运行 Python 代码,可以生成图形和图表,并处理具有多种数据和格式的文件。允许 Assistants 迭代运行代码来解决具有挑战性的代码和数学问题等等。

  • 检索:利用模型之外的知识来增强助手,例如专有领域数据、产品信息或用户提供的文档。这意味着用户不需要计算和存储文档的嵌入,或实现分块和搜索算法。

  • 函数调用:使 Assistants 能够调用定义的函数并将函数响应合并到其消息中。

16K 上下文的 GPT-3.5 Turbo

OpenAI 同时升级了 GPT-3.5 Turbo,上下文窗口升级到了 16k 长度

  • 输入侧价格为之前的 GPT-3.5 16K 的 1/3,输出价格为 GPT-3.5 16K,Fine-tune 价格也同步进行了下调

  • 支持改进的指令跟踪、JSON 模式和并行函数调用

DALL·E 3、TTS 开放api,可供开发者接入

Snap、可口可乐等公司使用 DALL·E 3 的 api 为客户生成图像,该 api 内置审核功能,可以保护开发者防止程序被滥用。

开发者可以方便地使用 TTS 的 api 将文本生成人类语音,TTS 模型提供六种预设语音、两种性别。

开源 Whisper v3 和 Consistency Decoder

Whisper 是语音转文字的代表软件,这次开源了 V3 版本,马上还要开放 Whisper v3 的 API。Consistency Decoder 是 Stable Diffusion VAE 的替代品,该解码器改进了与 Stable Diffusion 1.0+ VAE 兼容的所有图像,在文本、面部和直线方面有显著改进。

生态布局 人人都可参与的 GPTs 和 GPT Store

本次发布最让人惊喜的莫过于 GPTs 的功能发布:任何人都可以创建 ChatGPT 的定制版本,服务于日常生活、工作或者家庭中。用户也可以将自己创建的 GPT 分享给别人,也可以创建仅限于个人或者公司内部使用的 GPT。

创建过程无需代码,使用自然语言交互,简单的指令配上需要额外提供的知识库文本,就可以快速创建一个可以进行网络搜索、制作图片或者分析数据的 GPT。

更重要的是,OpenAI 将在晚些时候推出 GPT Store,正如同 App Store 一样,商店将收录验证用户创建的 GPT 作品,可以被用户搜索到。商店也会推荐生产力、教育和好玩等类别的优秀作品,而且创建者还可以根据自己创建的 GPT 的使用人数获得一定分成。

与插件功能一样,用户创建的 GPTs 也支持集成外部数据、联网等功能,用户可以将 GPTs 连接到数据库、邮件或者购物助手等。借助 Zapier,用户搭建的 GPTs 可以轻松实现日历订阅、同步以及短信功能等。

ChatGPT 企业用户可以搭建仅供内部使用的 GPTs。

一个真正的 OpenAI 开发者生态似乎指日可待。

给开发者工具 然后改变这个世界

在开发者大会主题演讲的最后,Sam Altman 表达了他对开发者们想说的话:

「作为结束语,我想花一点时间,感谢创造了这一切的团队们。OpenAI 有着极高的人才密度,但仍然,这一切需要巨量的辛苦工作和协作,才能让这一切成为现实。我真的相信,我拥有世界上最好的同事们,能与他们共事我感到无比荣幸。

我们做所有这些,因为我们相信,AI 会是一次科技和社会的革命。它会从很多层面上,改变这个世界。我们也很高兴,能够从事这些工作,能够为你们带来价值,再让你们为我们所有人创造更多的价值。

早先我们说过,如果你予以人们工具,他们就能够改变这个世界。我们相信,AI 会以一种前所未见的规模,予以个体和机构新的能力。这也将把整个人类提升到我们前所未见的规模。

我们将能够做得更多,创造更多,拥有更多。随着智能无处不在,我们都将拥有有求必应的超能力。」

欢迎加入深潮TechFlow官方社群

Telegram订阅群:https://t.me/TechFlowDaily
Twitter官方账号:https://x.com/TechFlowPost
Twitter英文账号:https://x.com/TechFlow_Intern
作者Founder Park
相关文章
2024.07.12 - 前天
Ondo Finance 研报:与贝莱德合作,连接传统金融与Web3的RWA协议
Ondo正在通过其去中心化协议改造金融,利用区块链提供机构级产品。
2024.07.11 - 3 天前
消除MEV,详解 Pyth Network 新产品 Express Relay
“夺回控制权,DeFi 大不同”。
2024.07.11 - 3 天前
Storj 高管团队转向 AI,Prodia 究竟是什么?
1500 万种子轮融资,从图像生成到 AI 推理解决方案,三分钟速读 Prodia。
2024.07.11 - 3 天前
获 1500 万美元融资,RedStone 如何通过模块化设计重塑预言机?
RedStone 采用差异化的模块化设计来满足 DeFi 协议的需求,数据提供者可以避免不停地交付传输链上数据。
2024.07.10 - 4 天前
如何理解 GOAT Network 最新发布的比特币 Native 扩展白皮书?
GOAT Network 通过 OCP 挑战者机制和 Entangled Rollup 统一可交互层为其作为通用型 Native 跨链比特币二层解决方案提供了基础。
2024.07.10 - 4 天前
Fuel:解决拓展,并行,跨链,这个主网还未发布的L2协议到底什么来头?
单片L1架构就像一条古老的乡间小路,已无法应对越来越多的车辆和行人。
2024.07.10 - 4 天前
Movement:将 Move 引入 EVM,重塑以太坊生态安全性
Movement 致力于将 Move 语言的安全性和高性能优势,与 EVM 系的流动性和庞大的用户群体连接打通,实现优势联合。
2024.07.10 - 4 天前
深入 Kontos :大道至简,一个入口畅享触手可及的链抽象体验
不需要担心私钥和助记词,不用考虑目标链上有没有Gas费,支持全链交易和转账。
2024.07.09 - 5 天前
Uber 工程师创立,「盲计算」网络 Nillion 有何创新?
Nillion 认为,隐私增强技术没有灵丹妙药,所有方案都必须组织起来才能获得最佳结果。
2024.07.08 - 6 天前
LayerZero:去信任化跨链互操作的革命还是理想?
LayerZero Labs 的使命是解决区块链之间的互操作性问题,为dApp开发者提供无需中介即可在多个区块链上进行消息传递的能力。