OpenAI加固ChatGPT Atlas浏览器Agent防御"提示注入"攻击
OpenAI为ChatGPT Atlas的Agent模式部署关键安全更新,防御"提示注入"攻击。该技术利用AI逻辑漏洞,在网页中隐藏恶意指令。更新引入对抗训练模型和强化防护措施,并建议用户限制访问权限、验证操作请求及使用明确指令以提升安全性。 2025-12-24 16:27:15 Author: www.freebuf.com(查看原文) 阅读量:0 收藏

freeBuf

主站

分类

云安全 AI安全 开发安全 终端安全 数据安全 Web安全 基础安全 企业安全 关基安全 移动安全 系统安全 其他安全

特色

热点 工具 漏洞 人物志 活动 安全招聘 攻防演练 政策法规

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

banner

随着人工智能开始代表我们浏览网页,安全战场正从服务器转移到浏览器标签页。OpenAI已为其ChatGPT Atlas的Agent模式部署关键安全更新,以抵御内部测试中发现的新型对抗性威胁。

新型攻击手法:提示注入

此次更新主要针对"提示注入"(prompt injection)攻击——这是一种复杂攻击技术,攻击者通过在网页中隐藏恶意指令,诱骗AI Agent执行未经授权的操作。

ChatGPT Atlas代表了AI实用性的重大飞跃。在"Agent模式"下,AI不仅能聊天,还能执行操作。它可以"像人类一样查看网页并在浏览器内执行点击和键盘输入操作",这种能力使其能够无缝处理复杂工作流程。

自主性带来的安全挑战

然而,这种增强的自主性也带来了更高风险。当用户授权AI浏览开放网络时,实际上是将AI暴露在互联网内容的"狂野西部"中。

OpenAI在安全公告中指出:"随着浏览器Agent帮助用户完成更多任务,它也成为了更高价值的对抗攻击目标,这使得AI安全变得尤为重要。"

防御机制升级

本次更新主要解决提示注入问题。与传统利用代码漏洞的黑客攻击不同,提示注入攻击利用的是AI的逻辑漏洞。攻击者可能在网站上嵌入不可见文本,命令访问该网站的AI秘密导出用户电子邮件或购买特定产品。

OpenAI将其描述为"我们积极防御的最重大风险之一,以确保ChatGPT Atlas能够安全地代表用户运行"。最新补丁由"内部自动化红队测试发现的新型提示注入攻击"触发,引入了"经过对抗训练的新模型和强化的安全防护措施",旨在检测并忽略这些恶意隐藏指令。

用户安全实践建议

在强化系统安全的同时,OpenAI也敦促用户在使用AI代理时养成更安全的习惯:

  • 限制访问权限:建议在不需要登录时使用"登出模式"。"我们继续建议用户利用登出模式...当手头任务不需要访问已登录网站时"。
  • 验证而非盲目信任:当Agent尝试执行高风险操作(如发送电子邮件或进行购买)时,会请求用户许可。用户必须仔细审查这些请求。"当Agent要求确认操作时,请花时间验证操作是否正确"。
  • 指令要具体明确:模糊指令会留下解释和操纵空间。"避免使用过于宽泛的提示,如'查看我的邮件并采取任何必要行动'。过大的自由度会使隐藏或恶意内容更容易影响Agent"。

参考来源:

ChatGPT Atlas Under Guard: OpenAI Fortifies Browser Agent Against “Prompt Injection” Attacks

本文为 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)


文章来源: https://www.freebuf.com/articles/ai-security/463716.html
如有侵权请联系:admin#unsafe.sh