阿里云一次说透「AI安全」！2025「AI安全」全球挑战赛特别节目—

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序把安全装进口袋

9月16日晚7点，由阿里巴巴集团与阿里云联合发起的2025「AI安全」全球挑战赛特别直播——《定向AI航轴》圆满结束。本次直播以“攻防双视角”为核心，深入探讨大模型时代面临的安全威胁与应对策略，并公开了阿里云在AI反向赋能安全攻防领域的最新实践。

点击下方视频可观看完整回放：

核心内容一：抵御越狱风险，Oyster-Qwen3展现“均衡之道”

针对大模型面临的越狱风险，阿里云推出基于Qwen3优化的开源安全模型Oyster-Qwen3。该模型采用深度混合防御体系，构建内生安全加固与外层防护护栏，打造多层次安全屏障。通过让模型深度“理解”用户真实意图，在安全性与使用性之间实现精妙平衡。

提示词注入、AI Agent工具滥用和RAG数据泄露等新兴风险同样值得警惕。阿里云安全专家指出，必须构建覆盖基础设施、模型本身和应用场景的分层纵深防御体系，同时警惕“链式组合攻击”带来的系统性风险。

阿里云在本次直播中也分享了一系列用AI技术赋能安全攻防的实践成果。在攻击侧，自动化资产收集Agent节省了80%的人力投入；在防御侧，AI Agent的加入让内部安全审批等繁琐工作量下降了37%。实践证明，AI正从“被保护对象”向“安全防线守护者”的角色转变。

随着AI技术的持续演进，安全攻防将更依赖智能化工具与人类专家的协同。阿里云通过模型内生安全加固、构建多层次防御体系、AI Agent守护AI三大路径，展现了“以AI守护AI”的可行性与潜力。阿里的目标始终不变：让AI在正确的航向上，驶向更远的星辰大海。

本文为独立观点，未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件，请联系 FreeBuf 客服小蜜蜂（微信：freebee1024）