#人工智能 A 社推出 Claude Opus 4.7,该模型可以稳定处理长时间运行的任务以及严格遵循既定指令。基准测试显示该模型在编码能力上已经领先于 GPT-5.4,不过与不公开的 Claude Mythos 模型相比仍然差很多,而 4.7 也同样内置严格的安全机制用来识别和阻止高风险网络安全用途的请求。查看详情:https://ourl.co/112700
人工智能公司 Anthropic 已经推出最新模型 Claude Opus 4.7,该模型在复杂软件工程任务方面相较 Opus 4.6 有着显著提升,并且能够稳定处理长时间运行的任务以及严格遵循既定指令。
Opus 4.7 也大幅度提高视觉能力,该模型现在可以用于分析分辨率更高的图像,帮助用户或开发者识别图像内容并进行分析,例如将复杂的工程图像识别为分步骤任务等。
从基准测试数据来看 Opus 4.7 已经领先于 GPT-5.4 系列模型,但该模型能力仍然远逊于 A 社不公开发布的 Claude Mythos Preview 版,后者是 A 社面向网络安全领域推出的专有模型,由于担心潜在的危害因此 Mythos 模型当前仅面向少数企业提供。
基准测试数据:
基于安全考虑 A 社也在 Opus 4.7 中内置安全防护机制,该机制可以自动检测并阻止与高风险网络安全用途相关的请求,避免用户或黑客尝试利用模型挖掘和利用软件漏洞等。
而希望将 Opus 4.7 用于合法网络安全用途的专业安全研究人员则可以参与 A 社最新推出的网络安全验证计划,经过验证的合法安全研究员可以获得更宽松的安全边界,用于发掘漏洞、逆向工程和修复及验证漏洞补丁等。
A 社强调开发者从 Opus 4.6 迁移到 Opus 4.7 时关注两项变更:
首先 Opus 4.7 使用更新的分词器,这改进了模型处理文本的方式,根据内容类型的不同,新分词器使用的 tokens 数量是旧分词器的 1.0~1.35 倍。
其次 Opus 4.7 在高难度级别下会进行更多思考,这也会导致 tokens 消耗量显著增加,因此如果开发者将努力程度设置为高时,应该关注账户配额或 API 使用量。
除了发布 Claude Opus 4.7 模型外,A 社还更新 Claude Code 并新增 /ultrareview 命令,该命令可以创建专门的代码审查会话,用于读取代码变更并标记错误和其他设计问题。
已经开通 Claude Pro 和 Claude Max 的订阅用户在预览阶段可以获得三次的免费 Ultrareview 代码审查服务,开发者可以考虑将复杂的代码变更交给 Claude Code 审查。
