
最近上线的中国AI软件DeepSeek引发业界震撼,开发商声称建构DeepSeek的基础成本很低,仅是OpenAI的零头,最广为流传的说法之一,是DeepSeek V3的训练成本约为600万美元。不过这个说法被半导业行业研究公司SemiAnalysis质疑,他们认为DeepSeek的成本应该至少13亿美元。
有趣的工程(Interesting Engineering)报导,SemiAnalysis指出,它未能解释几个关键因素。600万美元的估算,只考虑了GPU预训练费用,忽略了公司在研发、基础设施和其他必要成本方面的大量投资。报告强调,DeepSeek的总服务器资本支出,就高达13亿美元。

根据报导,DeepSeek使用了大约5万张Hopper GPU(微构架的),这导致业界产生了一些误解。以为这就等于5万张辉达H100 GPU(Nvidia Hopper H100 GPU)。
SemiAnalysis澄清说,英伟达的GPU有多种型号,包括H800、H100以及NVIDIA为应对美国出口限制而生产的H20。也是中国可以获得的类型。

该报告称,与一些较大的人工智能实验室不同,DeepSeek数据中心采用精简模型,来提高其灵活性和效率。这算是一种不错的调节能力,分析显示DeepSeek的R1模型,表现出与OpenAI的o1相当的推理能力。然而,这不意味着DeepSeek在所有指标都性能领先。
虽然DeepSeek的定价策略引起了关注和赞誉,但有一个重要的警告:功能相似的Google Gemini Flash 2.0,在API服务存取时更加经济。这使得DeepSeek处于一个十字路口,平衡性能和成本是其未来成功的关键。

但是,DeepSeek的多头潜在注意力(Multi-Head Latent Attention,MLA),是个颇具突破性的创新,这种方法透过减少键值(KV)缓存的使用,显著降低了93.3%的推理成本。不过,DeepSeek 带来的创新,也很可能会被渴望保持竞争力的西方人工智慧实验室迅速采用。
报告推测,DeepSeek可能产生不错的竞争环境,令其他同行也必须具有更快的调节能力。总之,SemiAnalysis描绘了DeepSeek在AI领域的当前地位。它的成本结构、GPU利用率,和创新能力,确实成为一名强大的AI参与者。

中油工程
天桥起重
HUAWEI
Dahua Technology
3M制造业
陕煤化工集团
中国石油
Gemtique
延长石油
German Machine Tool Builders Association
Iteca Exhibitions
IAA Show
LASTON
PALEXPO
QIIE青岛进博会
陕西有色金属
维远光伏产业
IFEMA
长城润滑油
吉祥星科技
天元化工
中杭贸易
PV EXPO
Media Fusion ME
首匠装饰工程
KUNVII
海康威视-HIK VISION
Hannover Messe
HealthCare
Expocentre
TOSHIBA
Time Out Group
大唐旗舰店
National Media
神木职教中心
深圳会展中心
世卫组织警告:部分国家对新冠肺炎疫情准备不足
习近平会见出席2019年“创新经济论坛”外方代表
外滩漫步-上海不夜的精彩
首次公開 長征五號遙二失利後測發大廳畫面曝光
上海8K原创纪录片《玉兰之城》
深美闳约—陈湘波、崔培鲁、西乐群、王茂飞书画联展
深圳国际工业设计大展
苏州吴中博物馆:釉里红白云龙纹盖罐
2019年美国太空科技博览会
绿色环保全玻璃特装展台
东南亚印度展位搭建现场图集
2023年5月北京养老产业展,第九届中国国际养老服务业博览会
洛阳唐三彩:沉睡千年,一朝出土惊世人
2019年欧洲国际聚氨酯及技术展览会
“中国军工”亮相2019年泰国国际防务展
北京2022年冬残奥会闭幕式在国家体育馆举行
2024年德国汉诺威工业博览会
2024第十二届中国(西部)电子信息博览会
2023年墨西哥国际绿色能源与环境展
纯天然翡翠阳绿满色山子挂坠
第31届广州酒店用品展览会
2023上海国际医疗制造机械及零部件展览会
2024年国际康复设备与解决方案展览会
2022年广州美博会时间、地点、详情
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡



