🔥 头条新闻
OpenAI发布GPT-5.4:史上最强大模型登场
行业新闻 铂傲智能
#OpenAI
#GPT-5.4
#人工智能
#大模型
#OpenCLA
OpenAI发布GPT-5.4:史上最强大模型登场
北京时间2026年3月6日,OpenAI正式发布GPT-5.4系列模型,这是迄今为止最强大、最高效的旗舰模型。GPT-5.4将OpenAI在推理、编码和智能体工作流方面的最新进展整合到一个前沿模型中,为专业工作设定了新的标准。
一、GPT-5.4核心亮点
1. 首次原生计算机使用能力
GPT-5.4是OpenAI发布的首款具有原生计算机使用能力的大模型,能够操作计算机并跨应用程序执行复杂工作流程。这一突破性能力使得智能体(Agents)能够:
- 通过Playwright等库编写代码来操作计算机
- 根据屏幕截图响应鼠标和键盘命令
- 支持高达100万Token的上下文长度
- 实现跨长周期的任务规划、执行和验证
2. 性能大幅提升
| 基准测试 | GPT-5.4 | GPT-5.2 | 提升幅度 |
|---|---|---|---|
| GDPval(知识工作) | 83.0% | 70.9% | +12.1% |
| OSWorld(计算机使用) | 75.0% | 47.3% | +27.7% |
| BrowseComp(网络搜索) | 82.7% | 65.8% | +16.9% |
| SWE-Bench Pro(编程) | 57.7% | 55.6% | +2.1% |
3. 工作效率显著提升
- 减少Token消耗:GPT-5.4是OpenAI最高效的推理模型解决问题所需的Token显著减少
- 更快的响应速度:在Codex中启用/fast模式,可实现高达1.5倍的Token处理速度提升
- 更低延迟:相比GPT-5.2,GPT-5.4在各类任务中延迟大幅降低
二、专业能力升级
1. 办公软件能力突破
GPT-5.4在电子表格、演示文稿和文档处理方面实现了显著提升:
- 电子表格建模:在初级投资银行分析师任务中,平均得分从68.4%提升至87.3%
- 演示文稿生成:人类评审员在68%的情况下更偏好GPT-5.4生成的演示文稿(更美的美学、更多的视觉变化)
- 事实准确性:GPT-5.4是OpenAI最准确的事实模型,个人陈述虚假可能性降低33%
2. 视觉理解能力增强
- MMMU-Pro测试:GPT-5.4在视觉理解和推理方面达到81.2%准确率
- 文档解析:平均错误率从0.140降至0.109
- 高分辨率图像:支持高达1024万总像素的原始图像输入
三、工具使用与智能体
1. 工具搜索(Tool Search)
GPT-5.4引入了革命性的工具搜索功能,使模型能够:
- 在数万个工具定义中快速定位所需工具
- 减少47%的Token使用量
- 保持相同准确率的同时大幅降低成本
2. 智能体网络搜索
在BrowseComp基准测试中,GPT-5.4相比GPT-5.2实现了17%的绝对提升,GPT-5.4 Pro更是达到了89.3%的新高。这使得模型能够更持久地跨多轮搜索,找到”大海捞针”问题的答案。
四、战略合作动态
1. 与美国国防部达成协议
2026年2月28日,OpenAI宣布与美国国防部(Department of War)达成协议,将先进AI系统部署到机密环境中。协议包含三大红线:
- 禁止将OpenAI技术用于大规模国内监控
- 禁止将OpenAI技术用于指挥自主武器系统
- 禁止将OpenAI技术用于高风险自动化决策
2. 与亚马逊战略合作
2026年2月27日,OpenAI与亚马逊宣布达成战略合作伙伴关系,共同推进企业AI应用。
3. 与微软继续合作
OpenAI与微软发表联合声明,继续深化双方在AI领域的合作。
五、结语
GPT-5.4的发布标志着AI技术的又一重要里程碑。凭借其卓越的推理能力、首次原生计算机使用能力以及显著提升的专业工作效率,GPT-5.4正在重新定义AI的可能性边界。
作为西安铂傲智能科技有限公司,我们将持续关注全球AI技术发展动态,为您带来最新的行业资讯。
资料来源:OpenAI官方网站