深度求索改携手华为芯片 AI模型下载量领跑全球
当前位置:首页>资讯 >行业资讯 > 人工智能>深度求索改携手华为芯片 AI模型下载量领跑全球

深度求索改携手华为芯片 AI模型下载量领跑全球

2026-03-04 来源:路透社浏览数:8 国际会展网

核心提示:中国人工智能初创企业深度求索(DeepSeek)并未依照重大模型更新前的业界惯例,向美国芯片商展示其即将发布的旗舰模型以进行性能最佳化,而是向包括华为在内的中国供应商开放了提前使用权。报导提到,自DeepSeek于2025年1月横空出世以来,其模型在开源平台Hugging Face上的下载量已超过7500万次,推动了中国开源模型浪潮,并与美国AI实验室展开竞争。

18SZ图片处理

路透引述消息人士报导,中国人工智能初创企业深度求索(DeepSeek)并未依照重大模型更新前的业界惯例,向美国芯片商展示其即将发布的旗舰模型以进行性能最佳化,而是向包括华为在内的中国供应商开放了提前使用权。

报导指,DeepSeek预计将推出下一次重大更新版本V4,而AI开发商通常会向英伟达和AMD等领先芯片制造商分享重大模型的预发布版本,以确保其软件在广泛使用的硬件上高效运行。DeepSeek以往曾与英伟达的技术人员密切合作。

18SZ图片处理

研究公司Creative Strategies执行长巴赫林(Ben Bajarin)表示:「对英伟达和AMD在通用数据加速器方面的影响微乎其微,大多数企业并未运行DeepSeek,它更像是一个基准测试模型。」他补充说,新的AI程序编写工具正将软件在硬件上高效运行所需的时间,「从数月缩短至数周。」巴赫林认为,此举可能是中国政府更广泛战略的一部分,试图让美国硬件与模型在中国处于不利地位。

路透社日前引述美国政府高级官员报导,DeepSeek即将发布的新一代AI模型,使用了英伟达最先进的Blackwell芯片进行训练,此举可能违反美国的出口管制规定。

18SZ图片处理

根据该名美国官员说法,DeepSeek可能会试图移除显示其使用美国AI芯片的技术指标,并计划对外声称其模型是使用华为的芯片训练。他补充说,这些Blackwell芯片很可能集中部署于其位于中国内蒙古的数据中心。

该官员还指出,DeepSeek用于训练最新模型的过程,很可能采用了来自美国先进AI公司的「蒸馏」技术,包括利用Anthropic、Google、OpenAI等的AI模型。

18SZ图片处理

报导提到,自DeepSeek于2025年1月横空出世以来,其模型在开源平台Hugging Face上的下载量已超过7500万次,推动了中国开源模型浪潮,并与美国AI实验室展开竞争。在过去一年发布的模型中,中国模型的下载量超过了该平台上其他任何国家的模型。

打赏
分享到:
0相关评论
阅读上文 >> 中东至国内航线超级油轮运费飙升至纪录新高
阅读下文 >> 今年MWC首次设立中国展馆 逾350家中企参展位居第三

大家喜欢看的

  • 品牌
  • 资讯
  • 展会
  • 视频
  • 图片
  • 供应
  • 百科
  • 商城

欢迎转发与合作:


本文地址:http://www.18sz.com/news/show.php?itemid=21463

转载本站原创文章请注明来源:国际会展网

行业专题

更多行业专题

微信“扫一扫”
即可分享此文章



友情链接

  • 关注官方订阅号

  • 关注官方服务号

Copyright© 2003-2026 18SZ.com 18SZ B2B SYSTEM All Rights Reserved

服务热线:+86 755 88850315 ICP备案号: