GPU出口限制导致DeepSeek新一代AI模型研发受阻

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户，每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序把安全装进口袋

AI安全

受制于英伟达芯片短缺

中国顶尖人工智能企业深度求索（DeepSeek）有限公司在开发新一代R2推理模型时遭遇瓶颈。据《The Information》报道，该公司因无法获取足量英伟达（Nvidia Corp.）图形处理器（GPU）而陷入困境。消息人士透露，尽管研发团队已持续开发R2模型数月，但首席执行官梁文峰对其性能仍不满意，而现有GPU资源严重制约了模型优化能力。

R1模型的成功与局限

深度求索今年初凭借首代推理模型R1崭露头角。该模型以远低于美国同行的研发成本，在性能上比肩OpenAI、Anthropic PBC和Meta Platforms Inc.等企业的最先进模型。据悉，R1训练使用了包含5万块Hopper架构GPU的集群，其中包括约1万块H100、1万块H800及3万块专为中国市场设计的低功耗H20 GPU。

芯片获取渠道受阻

中国企业始终无法合法采购H100/H800 GPU。报道指出，部分芯片通过投资方高瓴资本秘密供应，另有部分通过壳公司接入公有云基础设施服务获取。H20 GPU虽曾合法引进，但随着美国政府四月出台新禁令，这类芯片对华出口已被全面禁止。

资源挤兑危机加剧

当前中国境内多数H20 GPU已被深度求索的客户占用。R1模型正被大量中国企业及政府机构采用，这些应用主要依托云端H20 GPU运行，导致深度求索缺乏足够算力训练新一代模型。内部人员表示，若R2性能显著提升，中国云服务商的现有基础设施将难以满足激增的需求。

技术封锁持续升级

H20处理器性能本已因出口限制遭到阉割，其带宽与连接性均低于西方市场流通的H100 GPU。尽管存在华为昇腾910B等国产替代方案，但这些芯片不仅性能更弱，还缺乏对英伟达CUDA软件栈的支持——该编程架构被几乎所有中国AI开发者用于优化GPU应用。深度求索的R1/R2模型同样基于英伟达芯片优化，获取渠道的中断恐将严重影响其与美国同行的技术竞争。

参考来源：

Report: DeepSeek’s newest model delayed by GPU export restrictions

本文为独立观点，未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件，请联系 FreeBuf 客服小蜜蜂（微信：freebee1024）