【安全圈】AI抢不走的工作,微软力挺红队测试仍需人类“掌舵”
2025-1-14 11:0:0 Author: mp.weixin.qq.com(查看原文) 阅读量:2 收藏

关键词

人工智能

随着AI的快速发展,安全专家担心人工智能会取代他们的工作,但微软的研究人员坚持认为,有效的红队测试仍然依赖于人类的专业知识、文化意识和情商——这些品质是机器无法复制的。

微软的AI红队严格测试了100多款生成式AI产品,并确定人类的创造力在发现漏洞,以及预测黑客如何利用这些系统方面仍然至关重要。

根据雷德蒙德AI红队发布的白皮书,其开源的PyRIT(Python风险识别工具包)等工具可以简化模拟黑客攻击,但最终,在处理复杂风险方面,人类的参与仍然不可替代。

在网络安全医学、化学或生物风险等专业领域,微软坚持认为,人类驱动的专业知识是必不可少的,才能正确、精确地评估人工智能的响应,这远远超出了语言模型的能力。

在网络安全医学、化学或生物风险等专业领域,微软坚持认为,想要精确评估AI的响应,人类专家的专业知识必不可少,而这远远超出了语言模型的能力范围。

微软表示:“在多次操作中,我们依赖‘人类’来评估我们自己或使用大型语言模型(LLMs)无法评估的内容风险”,并强调“AI红队意识到这些局限性非常重要”。

公司研究团队还强调了所谓的“文化能力”,即红队必须考虑语言和文化差异,以识别可能被主要基于英语数据集训练的AI模型忽视的安全风险。

同时研究团队指出:“AI红队中的人类元素在回答需要情商的AI安全问题时最为明显。”例如“这个模型响应在不同情境下会如何被解读?”以及“这些输出是否让我感到不适?”等问题只有人类操作员才能解析。

微软补充表示:“最终,只有人类操作员才能评估用户在实际环境中与AI系统进行的全部互动。”

该论文还包括一个案例研究,在这个案例中,微软红队评估了聊天机器人对陷入困境用户的回应,以此来调查“心理社会危害”。并警告说,红队成员可能会接触到大量“令人不安和困扰的AI生成的内容”。

微软表示:“这凸显了很重要的一点,AI红队要拥有能让操作员在需要时脱离工作的流程,还要有支持他们心理健康的资源。”

研究人员警告称,生成式AI模型在现代应用中的集成引入了新的攻击向量,其中一个案例是,视频处理AI应用中的一个过时的FFmpeg组件引入了服务器端请求伪造(SSRF)漏洞,允许恶意黑客提升系统权限。

研究团队表示:“AI模型通过引入新的漏洞扩大了攻击面。”并指出,提示注入攻击利用了AI模型通常难以区分系统级指令和用户数据的事实。

参考来源:https://www.securityweek.com/ai-wont-take-this-job-microsoft-says-human-ingenuity-crucial-to-red-teaming/

   END  

阅读推荐

【安全圈】建立数据跨境服务中心、便利化访问国际互联网,上海虹桥商务区国际贸易中心新平台建设进一步落实

【安全圈】浙江某海岛发现间谍!抓了!

【安全圈】研究人员入侵苹果新 USB-C 控制器

【安全圈】微软起诉利用 Azure AI 创建有害内容的黑客组织

安全圈

←扫码关注我们

网罗圈内热点 专注网络安全

实时资讯一手掌握!

好看你就分享 有用就点个赞

支持「安全圈」就点个三连吧!


文章来源: https://mp.weixin.qq.com/s?__biz=MzIzMzE4NDU1OQ==&mid=2652067342&idx=2&sn=7630e1838566bfaad814bfbeff239c32&chksm=f36e7a4ec419f3583f2fdeb373ecf1fe61d6e4069f0710503306470b1bb3204f220e2a5f7a97&scene=58&subscene=0#rd
如有侵权请联系:admin#unsafe.sh