
阿里巴巴发布一款新的人工智能(AI)模型,据称能够通过视频识别人类情绪,意在超越OpenAI的最新模型。
综合彭博社和中国《科创板日报》报道,阿里巴巴旗下的通义千问实验室星期二(3月11日)开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。
可验证奖励的强化学习(RLVR)正是深度求索(DeepSeek)模型R1的训练模式。

开发团队称,研究人员利用RLVR对开源Omni模型HumanOmni-0.5B进行优化,在推理能力、情感识别准确性和泛化能力三个关键方面显著提高性能。据称,R1-Omni能更清楚地理解视觉和听觉信息如何促进情绪识别,明确展示哪些模态信息对特定情绪的判断起到关键作用。
在两场演示视频中,R1-Omni能推测视频中人物的情绪状态,并描述其服饰和周围环境。这为所谓的计算机视觉增加新的理解层次。
让人工智能解读并回应人类情绪,早已成为科技行业的一个重要目标。目前能够识别人类心理状态和健康状况的技术已被广泛应用,如客户服务聊天机器人,或用于特斯拉等电动汽车以识别司机是否疲劳驾驶。

在DeepSeek-R1亮相震撼全球科技圈后,阿里巴巴也加快在AI领域争取领先地位的步伐,其对标DeepSeek的模型“通义千问”成了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供AI服务。
目前阿里似乎还打算与OpenAI一争高下。今年早些时候,OpenAI推出GPT-4.5模型,据称能更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。

而阿里巴巴则不收取任何费用,开放所有人使用R1-Omni模型,目前阿里已在Hugging Face平台上免费让用户下载使用该模型。
尽管当前的演示仅展示R1-Omni模型识别“高兴”或“愤怒”等基本情绪的能力,但能从视觉线索推导情绪的能力仍具有重要意义。阿里巴巴首席执行官吴泳铭在2月份告诉分析师,人工通用智能(AGI)已成为阿里巴巴的“首要目标”,而情绪智能是实现这一目标的重要一步。

天桥起重
HUAWEI
中油工程
Dahua Technology
3M制造业
陕煤化工集团
中国石油
Gemtique
延长石油
LASTON
IAA Show
PALEXPO
German Machine Tool Builders Association
QIIE青岛进博会
Iteca Exhibitions
维远光伏产业
IFEMA
吉祥星科技
陕西有色金属
天元化工
中杭贸易
长城润滑油
PV EXPO
首匠装饰工程
KUNVII
Hannover Messe
Expocentre
HealthCare
Media Fusion ME
大唐旗舰店
Time Out Group
TOSHIBA
National Media
MFV Expositions
Dowpol Chemical
神木职教中心
Glee Birmingham 2023
五月苏绣艺术品在线展示
2023 NAB Show Centennial
商务部:将制定行动计划 推进贸易高质量发展
崔培鲁受邀参加吴东魁艺术馆书画邀请展盛
2022年意大利里米尼国际可再生能源及环保展览会
苏州吴中博物馆:釉里红白云龙纹盖罐
2019十大考古新发现推介:山东滕州西孟庄遗址
故宫博物院清朝瓷器藏品
嫦娥五号安全着陆 完成月球采样任务
换个角度 看榆林70年巨变
扬州个园四季-西乐群作品
Ascent Products Show in Aquatech Amsterdam
西藏拉林高等级公路上的“最美大桥”
2019年科隆古董古物艺术品交易展览会
景德镇斗彩瓷器
2025年美国迈阿密无纺布展|IDEA 25
2024第三十二届上海国际建筑装饰展览会
开关-TS6-0000R
2026日本(东京)第40届电子元器件、材料及生产设备展览会
安邦云昇立式三辊闸Anb-SGZ101热销中
YH10W-24KV
WDS2026第三届沙特(利雅得)国际防务展
塑料橡胶|制品|工业展 2021广州国际塑料橡胶工业展览会
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡


