今年初DeepSeek R1在全球的惊讶声中诞生,美国AI界为之震动,当红人工智能芯片企业英伟达(Nvidia)股价随之暴跌。据媒体报导,在中国与全球AI竞争对手的高度关注下,更强的新版本DeepSeek R2即将面世。
据《快科技》引述AI市场最新爆料称,DeepSeek R2大模型将采用更先进的混合专家模型(MoE),总参数量较前代R1提升约一倍,预计达1.2万亿(R1总参数量为6710亿),单位推理成本较GPT-4大减,减幅高达惊人的97.4%。
报导导指出,由于中美科技战、贸易战愈演愈烈,英伟达H20芯片面临新一波出口管制。在DeepSeek R2预期发布时间临近的情况下,各界高度关注中国指标性AI大模型在缺乏美国芯片下的发展动向。
业界传闻,DeepSeek R2规模与ChatGPT的GPT-4 Turbo以及谷歌的Gemini 2.0 Pro相当,还将结合更智慧的门控网络层(Gating Network),进而优化高负载推理任务的性能。
有消息指出,DeepSeek R2将彻底摆脱英伟达芯片,训练全程全部基于升腾910B(Ascend 910B)芯片集群平台,在FP16精度下,计算性能达到512每秒浮点运算,芯片利用率高达82%,整体性能约为英伟达A100集群的91%。
市场预期,这项进展有望降低中国对海外高端AI芯片的依赖,且华为全新的升腾910C芯片也开始进入大规模量产阶段。
在成本方面,DeepSeek-R2的单位推理成本较OpenAI旗下的GPT-4大减97.4%。其中,R2输入每百万个词元仅需0.07美元,而输出每百万个词元仅0.27美元。
分析人士认为,R2若如传闻般强势,可能再次引发市场对AI基础设施需求的质疑,加上华为AI芯片的国产替代,将对英伟达带来更大影响。