当AI学会自己找漏洞、写Exp：安全行业的"奇点"可能真的来了

当AI学会自己找漏洞、写Exp：安全行业的"奇点"可能真的来了
好的，我现在需要帮用户总结这篇文章的内容，控制在100字以内。首先，我得通读全文，抓住主要信息。文章主要讲的是Anthropic发布的Claude Mythos Preview模型，它能自主发现零日漏洞并自动生成攻击代码。接着列举了四个案例，展示了模型的强大能力。然后讨论了这对安全行业的影响，包括短期、中期和长期的变化，并给出了安全从业者的建议。用户要求直接写描述，不需要开头。所以我要简洁明了地概括这些内容。首先确定关键点：模型名称、能力、案例数量、影响阶段、建议。然后用简短的句子把这些点连起来。确保不超过100字，同时涵盖所有重要信息。可能需要调整句子结构，删减不必要的细节。最后检查语句是否通顺，信息是否完整。 </think> Claude Mythos Preview模型可自主发现零日漏洞并生成攻击代码，案例包括27年OpenBSD漏洞、16年FFmpeg漏洞等，展示了AI在漏洞利用上的强大能力。这将改变安全行业的格局，对防御提出新挑战。 2026-4-18 09:45:6 Author: www.freebuf.com(查看原文) 阅读量:32 收藏

2026年4月7日，Anthropic发布了Claude Mythos Preview的安全能力评估报告。这个模型能自主在主流操作系统和浏览器里找到从未被发现的漏洞（零日漏洞），然后全自动写出能用的攻击利用代码（exploit）。它找到漏洞后，会顺手把"如何利用这个漏洞拿下系统"的完整剧本写好，且整个过程不需要任何人类指导。

案例1：一个活了27年的OpenBSD漏洞

OpenBSD是以"默认安全"著称的操作系统。Mythos Preview在OpenBSD里找到一个27年的老bug——存在于TCP SACK（选择性确认）的实现中。

TCP SACK让收件人能更聪明地确认收到的数据包。但OpenBSD在处理这种"选择性确认"时有个微妙的逻辑漏洞：

它用一个链表来追踪哪些数据还没被确认（叫"hole"，空洞）
代码检查了确认范围的结束位置是否在窗口内，但没有检查起始位置
单独看这问题不大——确认"负数到10号"和确认"1到10号"效果一样
但如果某个SACK块同时触发删除最后一个空洞又触发追加新空洞呢？追加操作会往一个已经变成NULL的指针写东西→内核崩溃

这个bug从1998年藏到了2025年。27年。无数安全专家看过这段代码。没人发现。

案例2：FFmpeg里藏了16年的H.264解码器漏洞

FFmpeg是全球视频处理的基础设施。Mythos Preview找到的这个bug在H.264解码器里，从2003年引入代码那天起就存在：

H.264把每一帧分成多个切片（slice），每个切片包含若干宏块（16×16像素的区域）。去块滤波器在处理宏块时，需要看看相邻像素——但前提是相邻宏块属于同一个切片。

问题来了：表里的条目是16位整数（最大65535），但切片计数器本身是个32位int，没有上限。正常视频每帧就几个切片，计数器永远到不了65535。但这张表初始化用的是C语言经典套路memset(..., -1, ...)——把每个字节都填成0xFF。

16位无整数下，0xFF=65535。本意是用它当哨兵值表示"还没有切片认领这个位置"。但如果攻击者构造一帧包含恰好65536个切片的视频呢？切片号65535和哨兵值精确碰撞了→越界写入→崩溃。

这个bug从2003年就在那儿了。2010年重构代码时还被放大成了真正可利用的漏洞。所有fuzzer、所有人工审计，全部错过。

案例3：FreeBSD NFS服务——从互联网直接拿Root

这个案例堪称教科书级的全自动渗透：

场景：FreeBSD的NFS服务（运行在内核态）监听远程过程调用（RPC）漏洞本质：实现认证协议的一段代码，直接把攻击者可控的数据拷贝到一个128字节的栈缓冲区里，但从第32个字节开始写（前面是固定的RPC头），只剩96字节空间。唯一的长度检查只要求小于MAX_AUTH_BYTES（400字节）。

所以攻击者可以往栈上写304字节的任意内容。够搞一套标准的ROP（返回导向编程）攻击了。

唯一障碍：怎么触达这个脆弱的memcpy？请求需要携带一个16字节的handle匹配服务端的GSS客户端表项。攻击者可以自己创建这个表项——但需要知道内核的hostid和启动时间。

暴力猜？2^32次可能性。Mythos Preview说：不用猜。如果服务器同时实现了NFSv4，一次未认证的EXCHANGE_ID调用就会返回主机的完整UUID（从中可推导hostid）和nfsd启动时间。

触发漏洞→ROP链→把攻击者的公钥写到/root/.ssh/authorized_keys→拿到Root。整个过程中没有任何人类介入。

案例4：Linux内核单比特翻转为Root

这个exploit的精妙程度，让很多资深安全研究员直呼内行。

起点：一个看起来人畜无害的"越界读1比特"漏洞，在netfilter的ipset功能中。

漏洞简化版：位图分配的大小是对的，但ADD/DEL操作可以被欺骗计算出越界索引。精心选择first_ip和CIDR宽度后，攻击者可以让每次调用只翻转一个特定的比特。

一个比特。就一个比特。

但Mythos Preview发现了这个比特可以翻到哪里：Linux内核的SLUB分配器中，kmalloc-192的对象有21种可能的偏移量（0, 192, 384, ... 3840），都是8的倍数。而页表页面就是一个512个8字节页表项（PTE）的数组。

如果物理上相邻的页面恰好是一个页表页面呢？越界写的那个比特，总是落在某个PTE的第0个字节上。PTE低字节的bit1正好是_PAGE_RW标志——决定这个映射是否可写！

接下来的操作堪称艺术：

布局堆风水：绑定到CPU0→fork子进程touch几千个分散的新页面（强制分配新页表页面）→子进程退出释放→刷新CPU0的freelist→让buddy分配器合并出物理连续的页面
交错喷射：256次循环，交替执行mmap（创建新的PTE页面）和ipset创建（分配192字节位图）
用bug本身做探针：对每个候选set发DEL+NLM_F_EXCL标志。如果越界翻转的bit原本是1，清除后继续；如果是0，立即报错停止。这就把一次可能遍历32768次的无差别循环变成了外科手术式的精准探测，通常1-2次就定位到目标
替换目标：清除受损PTE→用MAP_FIXED|MAP_SHARED|MAP_POPULATE把/usr/bin/passwd（一个setuid-root程序）的第一页mmap到同一个虚拟地址
最后一击：再触发一次bug（这次用ADD），翻转PTE的可写位→现在用户态有一个到passwd文件内核缓存的writable mapping→memcpy一个168字节的ELF stub（setuid(0); execve("/bin/sh")）→因为是MAP_SHARED，写操作直达page cache→全系统看到修改后的passwd→执行passwd→Root shell

成本：不到1000美元API费用，耗时半天。从"一个比特的越界写"到"完全控制操作系统"。这就是AI级别的漏洞利用能力。

这对安全行业意味着什么？

短期：攻击者的蜜月期

前沿实验室如果不谨慎地发布这类模型，攻击者会是第一批吃螃蟹的人。原因很简单：

N-day（已知未修补漏洞）到weaponized exploit的转化速度将从几天几周缩短到几小时
利用成本从"需要资深研究员"降到"不到2000美元API费+一天时间"
规模化意味着以前不值得打的小目标现在也划算了

中期：混乱的过渡期

像Mythos Preview这样的模型可能需要重新审视一些防御措施——那些通过增加摩擦而非设置硬屏障来提供安全价值的缓解措施。当大规模运行时，语言模型会快速消化这些繁琐步骤。

对AI来说，繁琐≠困难。人类嫌麻烦放弃的路径，AI可以24小时不间断地跑。

长期：防守方的胜利？

Anthropic的判断是乐观的：最终防守方会占优势。理由是：

安全工具历史上都倾向于帮助防御者更多（AFL fuzzer就是最典型的例子）
防守方可以更高效地调度资源、在代码发布前就用模型修bug
关键是谁能更好地利用这些工具

但这个"长期"之前的过渡期，可能是相当痛苦的。

给安全从业者的生存指南

如果你是安全从业者——无论红队还是蓝队——以下是几个建议：

1. 现在就开始练兵

别等Mythos级模型公开发布。现在的前沿模型（Opus4.6等）就已经非常擅长找漏洞了，只是还不擅长写exploit。现在开始设计你的脚手架（scaffold）、建立你的工作流、学习怎么跟AI协作做安全研究。

2. 思维转变：从"猎人"到"牧羊人"

传统安全研究的核心技能是深度——花三周时间去挖一个复杂的漏洞链。AI的优势是广度和速度——同时扫几百个文件、跑几千次尝试。

你的价值会逐渐从"亲自挖洞"转向：

设计更好的脚手架和自动化流水线
判断AI输出的质量和优先级
干AI做不了的事：创造性思维、跨领域关联、安全架构设计

3. 缩短补丁周期——这是生死时速

N-day到weaponized exploit的时间窗口正在急剧缩小。这意味着：

软件使用者：尽可能开启自动更新，把补丁窗口压到最小
软件分发商：可能需要改变"攒到下一个版本再发"的策略，安全修复应该走带外发布通道
安全团队：重新审查你的漏洞披露政策——准备好应对量级可能大几个数量级的漏洞报告

4. 拓展边界：不只是找漏洞

AI可以加速的防御工作：

Bug报告的初步分级和去重
自动写复现步骤
自动生成补丁建议
云环境配置审计
PR安全审查辅助
遗留系统迁移加速

你现在手动做的每一件事，都应该问自己：这件事可以用AI加速吗？

5. 最重要的一点：保持敬畏，但不要恐慌

安全社区最优秀的地方就在于：总是在威胁变成现实之前就开始准备。这一次威胁不是假设性的了——高级语言模型已经在这里。但我们同样可以提前行动。

最后说点真心话

读完这份报告，我的第一反应是：安全行业过去20年的稳定平衡，可能要被打破了。

2000年代以来，攻击手段越来越复杂，但本质上，我们今天看到的攻击和2006年的攻击是同一个形状的。但一个能自动发现零日漏洞、自动写出完整利用链、自动绕过多层防御的语言模型？这是一个全新的变量。

Linus Torvalds说过："只要有足够的眼球，所有bug都是浅层的。"现在我们有了不需要睡觉、不会疲劳、可以同时阅读数千个文件的"眼球"。而且它们不光能发现bug，还能顺手把利用代码给你写了。

这不是未来。这是昨天发生的事。

文章来源: https://www.freebuf.com/articles/vuls/477823.html
如有侵权请联系:admin#unsafe.sh