#人工智能 OpenAI 发布更新修复 GPT-5.4 API 存在的图像理解能力低下问题,该问题由图像编码器故障引起,目前已经在后端服务器修复。修复后在高分辨率截图分析、图表 OCR 识别、复杂文档布局理解等场景上,GPT-5.4 的识别和理解能力会更稳定。查看全文:https://ourl.co/112167
OpenAI 日前更新 API 平台并对 GPT-5.4 模型的图像编码器进行更新,此更新主要是用来修复在某些图像理解应用场景中模型理解能力不足的问题。
这次更新属于后端服务器更新,因此开发者不需要进行任何修改,后续针对图像输入场景,GPT-5.4 的理解能力应该会有提升,此更新不影响 ChatGPT 中的 GPT-5.4 模型。
下面是具体内容:
修复时间:2026 年 3 月 13 日
修复细节:更新图像编码器,解决 GPT-5.4 在处理图像输入时的错误,该错误会导致模型图像理解能力下降。
用户体验:此次更新后在高分辨率、密集细节或者需要精确定位的场景中,模型理解能力会显著提升。
对文档解析 / 图表阅读等提升较大:
在 OpenAI 发布更新后部分开发者在 X/Twitter 讨论此次修复后的效果,修复后 GPT-5.4 在高分辨率截图分析、图表 OCR 识别、复杂文档布局理解等任务上确实观察到更稳定的表现,尤其是结合 Responses API 的 computer-use 功能时,点击 / 定位准确率有所提升。
所以如果开发者需要解析大量文档、识别图表以及在 UI 截图交互等方面使用 GPT-5.4,那应该能感觉到识别效果比以前更好,这次更新对常规图片识别和理解应该不会有明显提升。
