
中国科技巨企字节跳动旗下的豆包大模型团队开源优化技术,令其训练成本节约四成。
综合IT之家和快科技星期一(3月10日)报道,上述团队宣布开源混合专家模型(MoE)架构的关键优化技术。此技术通过一系列创新方法,将大模型的训练效率提升约1.7倍,同时也将训练成本降低40%。
这一技术已在字节跳动的万卡集群训练中得到实际应用。内部数据显示,自采用该技术以来,已累计节省了数百万GPU(图形处理器)小时的训练算力。

豆包大模型团队决定开源此技术,是希望通过分享这一技术,推动整个人工智能(AI)社区在模型训练效率方面的共同进步。开源不仅有助于加速行业技术发展,还能为更多研究者和开发者提供宝贵的资源,进一步推动AI技术的创新与应用。
彭博社去年5月引述移动应用数据分析公司Sensor Tower的数据显示,字节跳动推出的豆包大模型,成为中国市场上最受欢迎的AI聊天机器人。
字节跳动否认10亿人民币购买寒武纪晶片

综合中国新京报贝壳财经和21经济网报道,有消息指字节跳动向寒武纪下单4万颗580型号晶片,单价2.5万元,总价值合计10亿元。字节跳动相关负责人回应时说,消息不实。
在上海挂牌的寒武纪,股价星期一(3月10日)午后出现拉升,一度涨超5%,收涨3.87%。

寒武纪官网资料显示,公司成立于2016年,专注于人工智能芯片产品的研发与技术创新,致力于打造人工智能领域的核心处理器芯片,“让机器更好地理解和服务人类”。

21经济网也报道,官网显示,寒武纪目前产品分别为智能加速卡、智能加速系统、智能边缘计算模组、终端智能处理器IP、软件开发平台,涉及芯片有思元220系列、思元270系列、思元290、思元370系列等,但未见到580型号的产品。

Saudi Pharma Expo
中国能建
蓝海永兴
HUAWEI
Dahua Technology
陕煤化工集团
Gemtique
3M制造业
天桥起重
中国石油
延长石油
LASTON
PALEXPO
IAA Show
维远光伏产业
IFEMA
German Machine Tool Builders Association
吉祥星科技
陕西有色金属
天元化工
Iteca Exhibitions
首匠装饰工程
中杭贸易
Expocentre
长城润滑油
PV EXPO
中油工程
HealthCare
Hannover Messe
KUNVII
National Media
MFV Expositions
大唐旗舰店
深圳会展中心
神木职教中心
TOSHIBA
深美闳约:宝能第一空间即将推出当代艺术作品展
中国航空工业集团宣传片 - 大国起飞
深圳国际工业设计大展
苏绣梅兰竹菊等美图欣赏
讲述曾思玉将军的长征故事
坐着高铁看中国 十月一日出发
15858顆鑽石!中國「牡丹表」驚艷世界
2019十大考古新发现推介:浙江义乌桥头遗址
榆林市在第九届陕西省艺术节上荣获多项大奖
疫情下的美国首都华盛顿民众
北宋剔刻的极致之美—登封白沙窑
今年十一国庆假期海南免税购物火爆
2020年阿拉伯国际医疗保健设备展览会
第七届丝博会现代农业馆宝鸡展区设计
翰墨清逸 执着于心-著名画家崔培鲁作品赏析
2020年中东国际医学实验室及设备展览会
2024上海国际医疗器械展览会
InterBee 2020(日本广电展会)线上展
超级鲜面条 | 真正0添加 劲道又爽滑
2026泰国(曼谷)第24届电子元器件、组件及生产设备展览会
2020慕尼黑 成都环博会
2026广东家电配件展_2026中国家电制造设备及配件交易会
2024上海国际医疗器械展览会
2024年上海美博会时间、地点、详情
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡



