
阿里巴巴发布一款新的人工智能(AI)模型,据称能够通过视频识别人类情绪,意在超越OpenAI的最新模型。
综合彭博社和中国《科创板日报》报道,阿里巴巴旗下的通义千问实验室星期二(3月11日)开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。
可验证奖励的强化学习(RLVR)正是深度求索(DeepSeek)模型R1的训练模式。

开发团队称,研究人员利用RLVR对开源Omni模型HumanOmni-0.5B进行优化,在推理能力、情感识别准确性和泛化能力三个关键方面显著提高性能。据称,R1-Omni能更清楚地理解视觉和听觉信息如何促进情绪识别,明确展示哪些模态信息对特定情绪的判断起到关键作用。
在两场演示视频中,R1-Omni能推测视频中人物的情绪状态,并描述其服饰和周围环境。这为所谓的计算机视觉增加新的理解层次。
让人工智能解读并回应人类情绪,早已成为科技行业的一个重要目标。目前能够识别人类心理状态和健康状况的技术已被广泛应用,如客户服务聊天机器人,或用于特斯拉等电动汽车以识别司机是否疲劳驾驶。

在DeepSeek-R1亮相震撼全球科技圈后,阿里巴巴也加快在AI领域争取领先地位的步伐,其对标DeepSeek的模型“通义千问”成了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供AI服务。
目前阿里似乎还打算与OpenAI一争高下。今年早些时候,OpenAI推出GPT-4.5模型,据称能更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。

而阿里巴巴则不收取任何费用,开放所有人使用R1-Omni模型,目前阿里已在Hugging Face平台上免费让用户下载使用该模型。
尽管当前的演示仅展示R1-Omni模型识别“高兴”或“愤怒”等基本情绪的能力,但能从视觉线索推导情绪的能力仍具有重要意义。阿里巴巴首席执行官吴泳铭在2月份告诉分析师,人工通用智能(AGI)已成为阿里巴巴的“首要目标”,而情绪智能是实现这一目标的重要一步。

中油工程
天桥起重
HUAWEI
Dahua Technology
3M制造业
陕煤化工集团
中国石油
Gemtique
延长石油
German Machine Tool Builders Association
Iteca Exhibitions
IAA Show
LASTON
PALEXPO
QIIE青岛进博会
陕西有色金属
维远光伏产业
IFEMA
长城润滑油
吉祥星科技
天元化工
中杭贸易
PV EXPO
Media Fusion ME
首匠装饰工程
KUNVII
海康威视-HIK VISION
Hannover Messe
HealthCare
Expocentre
TOSHIBA
Time Out Group
大唐旗舰店
National Media
神木职教中心
深圳会展中心
揭秘文博会线下力量 记者带你走进文博参展企业
祁门红茶与安徽姑娘
前海深港合作区成立10周年
时尚与艺术的完美演绎,这么别具一格的时装秀你一定没看过!
紫气东来作品展
今秋不可错过的故宫600年大展
Battery Cells & Systems Expo 2023
2020年意大利米兰国际自助贩卖机展览会
2019年美国太空科技博览会
航拍南京玄武湖秋色 美若画卷
泉城济南:济西湿地春色美
国画桂花飘香
2020年莫斯科国际军事比赛 - 组图
习近平同苏里南总统鲍特瑟会谈
大型实景神话音乐剧《昆仑之约》在乌鲁木齐上演
陕西榆阳:经济转型升级 开拓高质量发展之路
ONE-PIECE TOILET ZT-091
多功能烹煮机器人
2025年沙特国际家具配件 木工机械展览会woodshow
2025年上海美博会CBE-2025年第29届上海浦东美博会
2025上海国际养老产业及康复展览会
2023年第23届韩国釜山国际海事展
非洲埃及国际电子电脑展CAIRO ICT
国画葡萄-醇香可掬
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡



