今日运势评分

本月运势

戊子月

震荡偏多

丙破格，辰库蓄水

丙不修灶必见灾殃
辰不哭泣必主重丧

宜

入宅,安床,开光,祭祀,出火,拆卸,动土,挂匾,入殓,破土,安葬,纳畜

忌

嫁娶,开市,作灶,置产,作梁,伐木

月相

有明

底部反弹

日冲

ONDO0.46 0.63%

TRUMP5.56 -1.05%

SUI1.62 2.96%

TON1.62 0.16%

TRX0.27 -0.68%

DOGE0.14 1.15%

XRP2.03 0.78%

SOL133.50 0.51%

BNB897.78 1.82%

ETH3124.79 1.13%

BTC90415.90 0.11%

ETH Gas0.36 Gwei

恐惧

首页 深潮精选 Research 项目发现 7x24h︎快讯 最新活动

斯坦福 HAI《2025 年人工智能指数报告》精华

2025.04.14 - 244 天前

人工智能更高效、更易获取且更经济实惠；此外，亚洲人对人工智能更为乐观。

作者：Stanford HAI（斯坦福人工智能研究院）

编译：Felix，PANews

斯坦福 HAI 近期发布了长达 456 页的《2025 年人工智能指数报告》。以下是人工智能趋势的一些关键要点：

1.人工智能变得比想象的要强大得多

在新的基准测试 MMMU、GPQA 和 SWE-bench 中，人工智能的表现大幅提升：得分分别提高了 18.8%、48.9% 和 67.3%。除了基准测试外，人工智能系统在生成高质量视频方面取得重大进展，在某些情况下，大型语言模型（LLM）甚至在限时的编程任务中超越了人类。

注：

MMMU 是一个精心设计的新型基准，专为大学水平的多学科多模态理解和推理而设，旨在评估基础模型在广泛任务中的专家级多模态理解能力。

GPQA 是一个具有挑战性的数据集，包含 448 道由不同领域专家编写的高质量且难度极高的多项选择题。在相应领域拥有或正在攻读博士学位的专家，准确率仅为 65%，而技能高超的非专家验证者尽管平均花费时间超过 30 分钟且可不受限制地访问网络，准确率也只有 34%。

SWE-bench 是一个用于评估大型语言模型（LLM）在从 GitHub 收集的真实世界软件问题上的表现的基准。

斯坦福HAI《2025年人工智能指数报告》精华

2.人工智能更高效、更易获取且更经济实惠

参数更少的小型人工智能模型的能力日益增强：在短短两年内，参数数量减少了约 100 倍，但其在大规模多任务语言理解（MMLU）测试中的得分仍超过 60%。

开源模型与闭源模型之间的差距也在缩小，在某些基准测试中，性能差距从 8% 降至仅 1.7%。

斯坦福HAI《2025年人工智能指数报告》精华

此外，从 2022 年 11 月到 2024 年 10 月，达到 GPT-3.5 水平的系统的推理成本下降了 280 倍以上。在硬件层面，成本每年下降 30%，而能源效率每年提高 40%。

高级人工智能的门槛正在迅速降低。更不用说像 DeepSeek 这样的稀疏模型的开发，在专家混合（MoE）的结构下，只有相关的参数会被激活以回答用户的查询，使整个事情更加高效。

的确，随着规模更小但能力更强的 AI 模型不断涌现，AI 模型训练的要求降低了，成本效益高的分布式训练有望在未来十年成为主流。目前有一些顶尖项目正在基于不同的理论框架开展相关研究。

3.人工智能正日益融入日常生活

2023 年，美国食品药品监督管理局（FDA）批准了 223 款人工智能辅助医疗设备，而 2015 年这一数字仅为 6 款。在道路上，自动驾驶汽车已不再是实验品：美国最大的运营商之一 Waymo 每周提供超过 15 万次自动驾驶服务，而百度的 Apollo Go 无人驾驶出租车车队如今已在中国多个城市投入运营。

斯坦福HAI《2025年人工智能指数报告》精华