中国人工智能(AI)企业深度求索(DeepSeek)透露,开源AI模型DeepSeek-R1的训练费用仅为29.4万美元,远低于美国同行公布的数字。
据路透社报道,上述数据出现在由DeepSeek团队撰写、星期三(9月17日)登上国际学术期刊《自然》(Nature)封面的论文中。
这篇由DeepSeek团队共同完成、创始人梁文锋担任通讯作者的论文,介绍了开源AI模型DeepSeek-R1采用的大规模推理模型训练方法,并称DeepSeek-R1的训练成本为29.4万美元,使用了512颗英伟达H800晶片。
今年1月发布的DeepSeek-R1初版论文并未包含上述消息。
训练用于AI聊天机器人的大型语言模型,主要花费在用强大的晶片集群连续数周或数月处理大量文字和代码上。
尽管美国AI巨头OpenAI未披露任何模型的具体成本,但公司首席执行官奥尔特曼(Sam Altman)曾在2023年说,基础模型训练花费远超1亿美元。
软银愿景基金全球裁员20% 聚焦人工智能投资
日本软银集团(SoftBank Group)旗下愿景基金(Vision Fund)将在全球裁减近20%的员工,以集中资源支持创办人孙正义的人工智能(AI)宏图计划。
路透社星期四(9月18日)引述一份内部备忘录和消息人士报道,愿景基金目前在全球拥有逾300名员工,本轮裁员涉及约五分之一人手。这是自2022年以来第三轮裁员。
不过,与前两轮因投资亏损而被迫裁员不同,这次调整是在基金业绩改善的背景下进行。愿景基金上个月公布自2021年6月以来的最佳季度表现,主要受惠于在英伟达(Nvidia)和韩国电商平台Coupang的持股收益。
消息人士指出,这次裁员象征基金战略转向,不再广泛投资初创企业,而是把更多资源投向孙正义的AI项目,包括计划与美国人工智能公司OpenAI合作,在美国建设庞大数据中心网络的“星际之门”(Stargate),投资额高达5000亿美元。
愿景基金发言人证实裁员消息,但未透露细节,仅在声明中表示,公司会持续调整组织架构,以更好地执行长期战略,进行高信念的AI和突破性科技投资,为利益相关者创造长期价值。
孙正义近年重新回到一贯的高风险、高回报投资风格。除了在基础模型与AI基础设施积极布局,他过去12个月已通过愿景基金2注资97亿美元于OpenAI。基金2目前管理资产约658亿美元。
软银也在围绕旗下核心资产、晶片设计公司Arm制定新战略,收购晶片公司Graphcore和Ampere Computing,并持有英特尔(Intel)与英伟达股份,意在构建涵盖晶片、数据中心与AI模型的完整生态系统。
不过,这一资本密集战略面临执行风险。路透社日前报道,美国“星际之门”以及日本与OpenAI的类似合资项目都出现延误。