
受制于英伟达芯片短缺
中国顶尖人工智能企业深度求索(DeepSeek)有限公司在开发新一代R2推理模型时遭遇瓶颈。据《The Information》报道,该公司因无法获取足量英伟达(Nvidia Corp.)图形处理器(GPU)而陷入困境。消息人士透露,尽管研发团队已持续开发R2模型数月,但首席执行官梁文峰对其性能仍不满意,而现有GPU资源严重制约了模型优化能力。
R1模型的成功与局限
深度求索今年初凭借首代推理模型R1崭露头角。该模型以远低于美国同行的研发成本,在性能上比肩OpenAI、Anthropic PBC和Meta Platforms Inc.等企业的最先进模型。据悉,R1训练使用了包含5万块Hopper架构GPU的集群,其中包括约1万块H100、1万块H800及3万块专为中国市场设计的低功耗H20 GPU。
芯片获取渠道受阻
中国企业始终无法合法采购H100/H800 GPU。报道指出,部分芯片通过投资方高瓴资本秘密供应,另有部分通过壳公司接入公有云基础设施服务获取。H20 GPU虽曾合法引进,但随着美国政府四月出台新禁令,这类芯片对华出口已被全面禁止。
资源挤兑危机加剧
当前中国境内多数H20 GPU已被深度求索的客户占用。R1模型正被大量中国企业及政府机构采用,这些应用主要依托云端H20 GPU运行,导致深度求索缺乏足够算力训练新一代模型。内部人员表示,若R2性能显著提升,中国云服务商的现有基础设施将难以满足激增的需求。
技术封锁持续升级
H20处理器性能本已因出口限制遭到阉割,其带宽与连接性均低于西方市场流通的H100 GPU。尽管存在华为昇腾910B等国产替代方案,但这些芯片不仅性能更弱,还缺乏对英伟达CUDA软件栈的支持——该编程架构被几乎所有中国AI开发者用于优化GPU应用。深度求索的R1/R2模型同样基于英伟达芯片优化,获取渠道的中断恐将严重影响其与美国同行的技术竞争。
参考来源:
Report: DeepSeek’s newest model delayed by GPU export restrictions
本文为 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf
客服小蜜蜂(微信:freebee1024)



