GPU出口限制导致DeepSeek新一代AI模型研发受阻
中国顶尖AI企业深度求索因英伟达GPU短缺陷入困境,影响新一代R2模型开发。R1模型虽成功但受限于资源不足和出口禁令,加剧算力需求与供给矛盾。 2025-6-26 17:28:43 Author: www.freebuf.com(查看原文) 阅读量:5 收藏

freeBuf

主站

分类

云安全 AI安全 开发安全 终端安全 数据安全 Web安全 基础安全 企业安全 关基安全 移动安全 系统安全 其他安全

特色

热点 工具 漏洞 人物志 活动 安全招聘 攻防演练 政策法规

官方公众号企业安全新浪微博

FreeBuf.COM网络安全行业门户,每日发布专业的安全资讯、技术剖析。

FreeBuf+小程序

FreeBuf+小程序

image

受制于英伟达芯片短缺

中国顶尖人工智能企业深度求索(DeepSeek)有限公司在开发新一代R2推理模型时遭遇瓶颈。据《The Information》报道,该公司因无法获取足量英伟达(Nvidia Corp.)图形处理器(GPU)而陷入困境。消息人士透露,尽管研发团队已持续开发R2模型数月,但首席执行官梁文峰对其性能仍不满意,而现有GPU资源严重制约了模型优化能力。

R1模型的成功与局限

深度求索今年初凭借首代推理模型R1崭露头角。该模型以远低于美国同行的研发成本,在性能上比肩OpenAI、Anthropic PBC和Meta Platforms Inc.等企业的最先进模型。据悉,R1训练使用了包含5万块Hopper架构GPU的集群,其中包括约1万块H100、1万块H800及3万块专为中国市场设计的低功耗H20 GPU。

芯片获取渠道受阻

中国企业始终无法合法采购H100/H800 GPU。报道指出,部分芯片通过投资方高瓴资本秘密供应,另有部分通过壳公司接入公有云基础设施服务获取。H20 GPU虽曾合法引进,但随着美国政府四月出台新禁令,这类芯片对华出口已被全面禁止。

资源挤兑危机加剧

当前中国境内多数H20 GPU已被深度求索的客户占用。R1模型正被大量中国企业及政府机构采用,这些应用主要依托云端H20 GPU运行,导致深度求索缺乏足够算力训练新一代模型。内部人员表示,若R2性能显著提升,中国云服务商的现有基础设施将难以满足激增的需求。

技术封锁持续升级

H20处理器性能本已因出口限制遭到阉割,其带宽与连接性均低于西方市场流通的H100 GPU。尽管存在华为昇腾910B等国产替代方案,但这些芯片不仅性能更弱,还缺乏对英伟达CUDA软件栈的支持——该编程架构被几乎所有中国AI开发者用于优化GPU应用。深度求索的R1/R2模型同样基于英伟达芯片优化,获取渠道的中断恐将严重影响其与美国同行的技术竞争。

参考来源:

Report: DeepSeek’s newest model delayed by GPU export restrictions

本文为 独立观点,未经授权禁止转载。
如需授权、对文章有疑问或需删除稿件,请联系 FreeBuf 客服小蜜蜂(微信:freebee1024)


文章来源: https://www.freebuf.com/articles/ai-security/436638.html
如有侵权请联系:admin#unsafe.sh