当前位置：首页>资讯 >国内>中国DeepSeek发布低价大模型性能比肩OpenAI o1

中国DeepSeek发布低价大模型性能比肩OpenAI o1

2025-01-25 来源：路透社浏览数：948 国际会展网

核心提示：中国初创公司深度求索发布一款价格低廉的大语言模型DeepSeek-R1，其性能比拟美国OpenAI开发的最新一代模型o1，但训练成本更低。美国CNBC报道称，这款模型的发布已在硅谷引起恐慌。由于美国出口管制限制中国企业采购最先进的人工智能计算晶片，中国企业正着力于通过优化软件、算法等方式，以更加低的训练成本开发模型。目前越来越多迹象显示，中国企业已取得巨大突破。

18SZ图片处理2025

中国初创公司DeepSeek（深度求索）发布一款价格低廉的大语言模型DeepSeek-R1，其性能比拟美国OpenAI开发的最新一代模型o1，但训练成本更低。

综合新华社、英国《金融时报》等报道，世界经济论坛2025年年会开幕当天，中国量化巨头幻方量化旗下的子公司深度求索公司1月20日发布最新开源模型DeepSeek-R1。

据深度求索介绍，DeepSeek-R1在后训练阶段大规模使用强化学习技术，在仅有极少标注数据的情况下，极大提升模型推理能力。这意味着该模型的训练跳过了监督微调（SFT）的步骤。

18SZ图片处理2025

在第三方基准测试中，DeepSeek-R1在算法类代码场景和知识类测试中的得分略低于OpenAI的o1，但在工程类代码场景、美国数学竞赛项目上均超越o1模型。

令外界更关注的是，与o1性能比肩的DeepSeek-R1，训练成本比o1低了五十分之一。

此外，深度求索提供更加低廉的收费方案，每百万tokens（大模型基本单位，1000个tokens约等于500个汉字）仅需16元人民币（下同），远低于o1模型每百万tokens要价438元。

18SZ图片处理2025

去年12月，深度求索公司发布DeepSeek-V3模型，仅使用2048块英伟达弱化版的H800晶片，花两个月就训练出性能比肩GPT4.0的模型。

DeepSeek能在多大程度上转化为实际的科学和技术应用，还是仅仅在基准测试中表现优异，仍有待观察。

但微软首席执行官兼OpenAI战略合作伙伴纳德拉1月22日在瑞士达沃斯世界经济论坛上说：“看到深度求索的新模型，真是令人印象深刻，不仅因为他们有效地构建一个开源模型，还因为它的推理计算效率极高。我们应该非常严肃地看待中国的AI进展。”

18SZ图片处理2025

美国CNBC报道称，这款模型的发布已在硅谷引起恐慌。

由于美国出口管制限制中国企业采购最先进的人工智能计算晶片，中国企业正着力于通过优化软件、算法等方式，以更加低的训练成本开发模型。目前越来越多迹象显示，中国企业已取得巨大突破。

另据路透社报道，除了深度求索公司，中国字节跳动星期三（1月22日）发布豆包大模型1.5 Pro，并称该模型在美国数学竞赛项目基准测试中表现优于o1模型。

18SZ图片处理2025

DeepSeek，全称杭州深度求索人工智能基础技术研究有限公司，成立于2023年7月17日，是一家创新型科技公司，专注于开发先进的大语言模型（LLM）和相关技术。注册地位于浙江省杭州市拱墅区环城北路169号汇金国际大厦西1幢1201室，法定代表人为裴湉。

打赏

相关阅读：

DeepSeek 大模型 OpenAI

分享到：

0 条相关评论

阅读上文 >> 中国三大航空去年大幅减亏年比收窄至少五成: 阅读下文 >> 长三角直达欧洲！「中欧快航」首抵德航程缩短十余天

大家喜欢看的

品牌
资讯
展会
视频
图片
供应
百科
商城

欢迎转发与合作：

本文地址：http://www.18sz.com/news/show.php?itemid=19452

转载本站原创文章请注明来源：国际会展网

推荐新闻

行业专题

更多行业专题

行业热点

VIP会员

微信“扫一扫”
即可分享此文章

友情链接

关注官方订阅号

关注官方服务号

Copyright© 2003-2026 18SZ.com 18SZ B2B SYSTEM All Rights Reserved

服务热线：+86 755 88850315 ICP备案号：