9月16日晚7点,由阿里巴巴集团与阿里云联合发起的2025「AI安全」全球挑战赛特别直播——《定向AI航轴》圆满结束。本次直播以“攻防双视角”为核心,深入探讨大模型时代面临的安全威胁与应对策略,并公开了阿里云在AI反向赋能安全攻防领域的最新实践。
点击下方视频可观看完整回放:
核心内容一:抵御越狱风险,Oyster-Qwen3展现“均衡之道”
针对大模型面临的越狱风险,阿里云推出基于Qwen3优化的开源安全模型Oyster-Qwen3。该模型采用深度混合防御体系,构建内生安全加固与外层防护护栏,打造多层次安全屏障。通过让模型深度“理解”用户真实意图,在安全性与使用性之间实现精妙平衡。
核心内容二:剖析新兴威胁,提出分层纵深防御体系
提示词注入、AI Agent工具滥用和RAG数据泄露等新兴风险同样值得警惕。阿里云安全专家指出,必须构建覆盖基础设施、模型本身和应用场景的分层纵深防御体系,同时警惕“链式组合攻击”带来的系统性风险。
核心内容三:AI反向赋能安全,实战提效成果显著
阿里云在本次直播中也分享了一系列用AI技术赋能安全攻防的实践成果。在攻击侧,自动化资产收集Agent节省了80%的人力投入;在防御侧,AI Agent的加入让内部安全审批等繁琐工作量下降了37%。实践证明,AI正从“被保护对象”向“安全防线守护者”的角色转变。
协同创新,共筑AI安全生态
随着AI技术的持续演进,安全攻防将更依赖智能化工具与人类专家的协同。阿里云通过模型内生安全加固、构建多层次防御体系、AI Agent守护AI三大路径,展现了“以AI守护AI”的可行性与潜力。阿里的目标始终不变:让AI在正确的航向上,驶向更远的星辰大海。
本文为 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf
客服小蜜蜂(微信:freebee1024)