
阿里巴巴发布一款新的人工智能(AI)模型,据称能够通过视频识别人类情绪,意在超越OpenAI的最新模型。
综合彭博社和中国《科创板日报》报道,阿里巴巴旗下的通义千问实验室星期二(3月11日)开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。
可验证奖励的强化学习(RLVR)正是深度求索(DeepSeek)模型R1的训练模式。

开发团队称,研究人员利用RLVR对开源Omni模型HumanOmni-0.5B进行优化,在推理能力、情感识别准确性和泛化能力三个关键方面显著提高性能。据称,R1-Omni能更清楚地理解视觉和听觉信息如何促进情绪识别,明确展示哪些模态信息对特定情绪的判断起到关键作用。
在两场演示视频中,R1-Omni能推测视频中人物的情绪状态,并描述其服饰和周围环境。这为所谓的计算机视觉增加新的理解层次。
让人工智能解读并回应人类情绪,早已成为科技行业的一个重要目标。目前能够识别人类心理状态和健康状况的技术已被广泛应用,如客户服务聊天机器人,或用于特斯拉等电动汽车以识别司机是否疲劳驾驶。

在DeepSeek-R1亮相震撼全球科技圈后,阿里巴巴也加快在AI领域争取领先地位的步伐,其对标DeepSeek的模型“通义千问”成了苹果在中国大陆市场的AI合作伙伴,为中国iPhone用户提供AI服务。
目前阿里似乎还打算与OpenAI一争高下。今年早些时候,OpenAI推出GPT-4.5模型,据称能更好地识别和响应用户书面提问中的微妙线索。但该模型价格不菲:最初仅向月费200美元的付费用户开放。

而阿里巴巴则不收取任何费用,开放所有人使用R1-Omni模型,目前阿里已在Hugging Face平台上免费让用户下载使用该模型。
尽管当前的演示仅展示R1-Omni模型识别“高兴”或“愤怒”等基本情绪的能力,但能从视觉线索推导情绪的能力仍具有重要意义。阿里巴巴首席执行官吴泳铭在2月份告诉分析师,人工通用智能(AGI)已成为阿里巴巴的“首要目标”,而情绪智能是实现这一目标的重要一步。

天桥起重
HUAWEI
Dahua Technology
3M制造业
陕煤化工集团
Gemtique
中国石油
延长石油
LASTON
IAA Show
PALEXPO
German Machine Tool Builders Association
中油工程
维远光伏产业
IFEMA
Iteca Exhibitions
吉祥星科技
陕西有色金属
天元化工
首匠装饰工程
中杭贸易
QIIE青岛进博会
长城润滑油
PV EXPO
Expocentre
HealthCare
Hannover Messe
KUNVII
大唐旗舰店
Time Out Group
TOSHIBA
National Media
Dowpol Chemical
MFV Expositions
Ptak Warsaw Expo
海康威视-HIK VISION
稳外贸持续发力 高质量发展底气足
鲁芳斋艺术展厅送出五福临门
深圳与广州城市建设实力对比
2019新冠病毒抗体检测试剂
我国第一艘国产航空母舰交付海军 习近平出席交接入列仪式
2019十大考古新发现推介:浙江义乌桥头遗址
深圳最新国际形象片《深圳更深处》全球首发!
2021圣诞前夕宝能第一空间崔培鲁画展
2021年莫斯科国际化工展览会
Formnext 2021 Important information at a glance
换个角度 看榆林70年巨变
从模型到真车 第二代“会飞的汽车”惊艳亮相进博会
Flag Production Customization
RE+SPI Booth Setup
AGFRC Products in FASZINATION MODELLBAU
DOMOTEX Turkey 2019
2021第二十八届广州酒店用品展览会
德国EBRO依博罗Z011-A气动衬胶蝶阀 原装正品价格优惠
第八届广州国际渔业博览会
Skater No. 6(布上丙烯)
2021年9月JME中国(天津)机床展
2023北京福祉展/残疾人用品展/中国国际康复博览会
门诊药房自动化解决方案
stainless steel wire mesh
意大利里米尼城市介绍
纽伦堡 - 玩具都城
慕尼黑 - 伊萨尔河畔的酒都
法兰克福 - 欧洲金融中心
迪拜 - Dubal
俄罗斯 - 战斗民族和套娃的国家
葡萄牙 - 软木塞之乡
西班牙 - 斗牛士的故乡



