🔥 头条新闻

OpenAI发布GPT-5.4:史上最强大模型登场

行业新闻 铂傲智能
#OpenAI #GPT-5.4 #人工智能 #大模型 #OpenCLA

OpenAI发布GPT-5.4:史上最强大模型登场

北京时间2026年3月6日,OpenAI正式发布GPT-5.4系列模型,这是迄今为止最强大、最高效的旗舰模型。GPT-5.4将OpenAI在推理、编码和智能体工作流方面的最新进展整合到一个前沿模型中,为专业工作设定了新的标准。

一、GPT-5.4核心亮点

1. 首次原生计算机使用能力

GPT-5.4是OpenAI发布的首款具有原生计算机使用能力的大模型,能够操作计算机并跨应用程序执行复杂工作流程。这一突破性能力使得智能体(Agents)能够:

  • 通过Playwright等库编写代码来操作计算机
  • 根据屏幕截图响应鼠标和键盘命令
  • 支持高达100万Token的上下文长度
  • 实现跨长周期的任务规划、执行和验证

2. 性能大幅提升

基准测试GPT-5.4GPT-5.2提升幅度
GDPval(知识工作)83.0%70.9%+12.1%
OSWorld(计算机使用)75.0%47.3%+27.7%
BrowseComp(网络搜索)82.7%65.8%+16.9%
SWE-Bench Pro(编程)57.7%55.6%+2.1%

3. 工作效率显著提升

  • 减少Token消耗:GPT-5.4是OpenAI最高效的推理模型解决问题所需的Token显著减少
  • 更快的响应速度:在Codex中启用/fast模式,可实现高达1.5倍的Token处理速度提升
  • 更低延迟:相比GPT-5.2,GPT-5.4在各类任务中延迟大幅降低

二、专业能力升级

1. 办公软件能力突破

GPT-5.4在电子表格、演示文稿和文档处理方面实现了显著提升:

  • 电子表格建模:在初级投资银行分析师任务中,平均得分从68.4%提升至87.3%
  • 演示文稿生成:人类评审员在68%的情况下更偏好GPT-5.4生成的演示文稿(更美的美学、更多的视觉变化)
  • 事实准确性:GPT-5.4是OpenAI最准确的事实模型,个人陈述虚假可能性降低33%

2. 视觉理解能力增强

  • MMMU-Pro测试:GPT-5.4在视觉理解和推理方面达到81.2%准确率
  • 文档解析:平均错误率从0.140降至0.109
  • 高分辨率图像:支持高达1024万总像素的原始图像输入

三、工具使用与智能体

GPT-5.4引入了革命性的工具搜索功能,使模型能够:

  • 在数万个工具定义中快速定位所需工具
  • 减少47%的Token使用量
  • 保持相同准确率的同时大幅降低成本

2. 智能体网络搜索

在BrowseComp基准测试中,GPT-5.4相比GPT-5.2实现了17%的绝对提升,GPT-5.4 Pro更是达到了89.3%的新高。这使得模型能够更持久地跨多轮搜索,找到”大海捞针”问题的答案。

四、战略合作动态

1. 与美国国防部达成协议

2026年2月28日,OpenAI宣布与美国国防部(Department of War)达成协议,将先进AI系统部署到机密环境中。协议包含三大红线:

  • 禁止将OpenAI技术用于大规模国内监控
  • 禁止将OpenAI技术用于指挥自主武器系统
  • 禁止将OpenAI技术用于高风险自动化决策

2. 与亚马逊战略合作

2026年2月27日,OpenAI与亚马逊宣布达成战略合作伙伴关系,共同推进企业AI应用。

3. 与微软继续合作

OpenAI与微软发表联合声明,继续深化双方在AI领域的合作。

五、结语

GPT-5.4的发布标志着AI技术的又一重要里程碑。凭借其卓越的推理能力、首次原生计算机使用能力以及显著提升的专业工作效率,GPT-5.4正在重新定义AI的可能性边界。

作为西安铂傲智能科技有限公司,我们将持续关注全球AI技术发展动态,为您带来最新的行业资讯。


资料来源:OpenAI官方网站