3月11日,阿里巴巴旗下的通义千问实验室星期二开源R1-Omni模型,并形容这是业界首个将具有可验证奖励的强化学习(RLVR)应用于全能多模态大语言模型。
 
 
Back to Top