OpenAI火速更新GPT-5.4 主打为专业而生 水分大不大?

AI/人工智能 work2e 2026-03-07 7
OpenAI火速更新GPT-5.4 主打为专业而生 水分大不大?


话说,5.4就这样发布了,首发全模式里都能用GPT‑5.4 Thinking 模式,据说还要推出Pro版本,但是CodeX暂时无缘。


感兴趣可以去看原版:https://openai.com/zh-Hans-CN/index/introducing-gpt-5-4/


这次OpenAI在标题上加了一行副标题,为专业工作而打造。如果说5.4有什么野心,那就全在这句话里了。



那么专业在哪些地方呢,首当其冲肯定通用能力的加强,在GDPval里,5.4刷新纪录,在83%的案例里达到了持平或更优的水准(GPT‑5.2 为 71.0%)。


数值没有多大含义,你可以知道它变强了。⁠




要说之前GPT-5.2能很好的满足文档生成能力,那么5.4就等于它同时获得了更好的审美能力。


好比你以前能交出一份80分的试卷,现在你在80分的基础上,还能把字写好。


GPT‑5.4 的平均得分达到 87.5%,而 GPT‑5.2 为 68.4%。这其中审美估计就占了10%。


肉眼可见,5.4在5.2完成文档理解和排版的基础上,它还能把数据进行一个表格汇总。这对于想要用大模型美化文档的工作者来说,算是一个进步,以后能更好代替其他设计类工具了。




现在不说Code能力,就好比大模型刚出来不讨论聊天一样。现在各大AI Code工具正在以不同方式占领用户的电脑,GPT5.4更是表现出超越了GPT‑5.3‑Codex的能力,甚至同时拉低了延迟。 


不过在 SWE-Bench Pro 测试中,能力也仅仅以微弱领先。OpenAI特别加了一个解释,也就是5.4有一个急速模式。



开启 Codex 中的 /fast 模式后,包括 GPT‑5.4 在内的所有受支持模型均可获得高达 1.8 倍的性能提升。模型本身及其智能水平完全一致,只是速度更快。



不过有个奇怪的地方,关于游戏的介绍这里消失了(上面是我开始的录屏)。原本有三个关于5.4设计游戏的演示,但是在些这篇文章我再去看的时候,发现没有相关介绍了。


😂也不知道是删掉了还是屏蔽了,不过咱也用不上,它强归它强,国产当自强。