
中国初创公司深度求索(DeepSeek)发布了V3模型更新,加强了模型的编程能力,显示这家公司希望在人工智能(AI)激烈竞争中保持领先优势。
综合彭博社和科技博客网站VentureBeat报道,AI开源模型DeepSeek-V3的版本更新V3-0324星期一(3月24日)深夜在AI开源平台HuggingFace低调上线。
DeepSeek没有为此次版本更新发布任何公告,延续了该公司的低调风格。

初代DeepSeek-V3发布于2024年12月26日,这款模型自上线后便以高性价比火速“出圈”。根据官方技术论文披露,DeepSeek-V3模型的总训练成本为557.6万美元,而GPT-4o等模型的训练成本约为1亿美元。
更新后的DeepSeek-V3模型大小为641GB,参数量6850亿。与V3相同,V3-0324模型采用专家混合(MoE)架构,并开源允许自由商用。
此次DeepSeek发布的V3版本更新,编程能力的优化成了最大亮点。有网民使用V3-0324模型编写800多行代码,全程没有出现任何故障。

有AI研究者在X发布评测指出,V3-0324模型在所有基准测试中都取得巨大进步,可能已超越美国Anthropic的Claude Sonnet 3.5,成为最强大的非推理模型。Sonnet 3.5是当前最受认可的商业AI模型之一。
让更多科技博主关注的是,V3-0324模型可直接在消费级硬件上运行,如搭载苹果M3 Ultra晶片的Mac Studio上,不需要动辄千瓦级别功耗的数据中心。
M3 Ultra晶片在进行推理时的功耗不到200瓦,意味着V3-0324模型的部署和运营门槛已大大降低。

VentureBeat报道认为,DeepSeek-V3-0324模型的发布,可能预示着DeepSeek-R2的即将到来。DeepSeek一贯先推出基础模型,再推出专门优化推理能力的版本,如V3后不久发布的R1。
路透社今年2月引述消息称,DeepSeek正加快推出R1模型的后续产品R2。据悉,DeepSeek-R2原计划在5月初发布,但公司现在希望尽早推出。
VentureBeat认为,DeepSeek-R2的发布,可能成为直接挑战OpenAI GPT-5的竞品。

Saudi Pharma Expo
中国能建
蓝海永兴
HUAWEI
Dahua Technology
陕煤化工集团
Gemtique
3M制造业
天桥起重
中国石油
延长石油
LASTON
IAA Show
PALEXPO
维远光伏产业
IFEMA
German Machine Tool Builders Association
吉祥星科技
陕西有色金属
天元化工
Iteca Exhibitions
首匠装饰工程
中杭贸易
长城润滑油
中油工程
Expocentre
PV EXPO
HealthCare
Hannover Messe
KUNVII
National Media
Time Out Group
大唐旗舰店
MFV Expositions
深圳会展中心
神木职教中心
杜塞尔多夫国际高尔夫用品展览会
圆明园罹难160周年 90秒看科技复原的圆明园
外国人选择深圳的N个理由
上海进博会:创意微视频《汇•惠》
深美闳约—陈湘波、崔培鲁、西乐群、王茂飞书画联展
中国空间站首次出舱活动实况:航天员出舱视频
Stone+tec Trade Fair
崔文僮获得实用新型专利的香道文化珠宝
洛阳唐三彩:沉睡千年,一朝出土惊世人
翰墨清逸 一串明珠
杭州市富阳区:古镇金秋庙会迎中秋
24小时不停歇生产口罩滤材熔喷布
航拍南京玄武湖秋色 美若画卷
唐三彩黑釉马
默克尔:欧盟期待与中国加强多领域合作
反映社会问题或现象漫画
西安大型展台设计与搭建
2026越南平阳国际智能仓储及物料搬运展览会
浙江绍兴龙门吊出租 轨道式龙门吊100米轨道
2023深圳国际检验医学及体外诊断试剂展览会
合肥专业生产烧结砖厂家 园林行道砖 广场砖 厂家直销
2026 深圳国际新能源汽车技术暨智慧出行展览会
2024上海国际医疗器械展览会6月26-28日举办
2023年第18届巴基斯坦国际塑料展览会
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡


