小米大模型团队音频推理突破,一周登顶MMAU榜,GRPO算法显神威!

小米大模型团队近日宣布,在音频推理技术方面取得了显著进步。该团队受DeepSeek-R1项目的启发,成功将强化学习算法应用于多模态音频理解任务,这一创新实践仅耗时一周,便在国际权威的MMAU音频理解评测中取得了64.5%的准确率,成功登顶榜首,并且已经同步开源。
据悉,DeepSeek-R1项目中提出的Group Relative Policy Optimization(GRPO)方法,使得模型能够通过“试错-奖励”机制自主进化,展现出类似人类的反思和多步验证等高级推理能力。小米团队受此启发,尝试将GRPO算法迁移到自家的Qwen2-Audio-7B模型上,取得了令人瞩目的成果。
在训练样本方面,小米团队仅使用了AVQA数据集中的3.8万条样本进行强化学习微调,便在MMAU评测集上实现了64.5%的准确率。这一成绩不仅刷新了记录,而且相比目前榜单上排名第一的商业闭源模型GPT-4o,有近10个百分点的优势。
尽管取得了如此显著的进步,但小米团队表示,当前模型的准确率距离人类专家的82%水平仍有差距。他们将继续努力,不断优化算法和模型,以期达到更高的准确率。
在官方提供的交互demo中,小米团队选择了雷军2015年“R U OK”的视频作为默认分析对象,展示了模型在实际应用中的表现。这一选择不仅富有趣味性,也体现了小米团队对于用户需求和场景理解的深入洞察。
小米技术官微在发布这一消息时表示,音频推理技术的突破将为智能语音助手、智能家居等领域带来更加智能和人性化的体验。他们期待与更多合作伙伴共同探索这一技术的广阔应用前景。
小米团队还强调了开源的重要性。他们认为,通过开源可以吸引更多开发者参与到技术的创新和优化中来,共同推动人工智能技术的发展和进步。
本文链接:http://knowith.com/news-1-9427.html小米大模型团队音频推理突破,一周登顶MMAU榜,GRPO算法显神威!
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
南开大学研究生学费(南开大学研究生学费一年多少钱)
南方科技大学考研(南方科技大学考研分数线)
自考本科能考研究生吗?武汉大学硕士研究生的学费一年是多少
萍乡考研地点在哪里,萍乡学院学前教育是专科还是本科
莆田市考研考场安排,莆田学院考研成功率高吗
艺术类考研培训班费用 清华大学深圳国际研究生院考研难度
2015经济学考研:微观经济学脉络图(第二章)
香港考研和国内考研,哪个更难,香港建筑硕士申请通过率
金山区两区一堡的含义,农林大学金山学院有研究生吗
数二考哪些内容_数二考哪些内容章节
今日揭露 孟加拉阿伐曲泊帕不出国怎么买 孟加拉仿制药阿伐曲泊帕最新代购价格出炉
大吉大利:深圳龙华上门代还信用卡,多年经营,高效便捷服务
大吉大利:广州增城代还信用卡最好还款服务,实体店多种方式
如登春台:郑州新郑市代还信用卡取现,最便宜的地方,多年经验诚信
心花怒放:杭州下城区代还信用卡取现,怎么刷出来,5种常用方式
风驰电掣:海口代还信用卡垫还,怎么刷出来,5种常用方式
最新方法:白条怎么刷出来现金(重要方法须掌握)-知者
砥砺前行:羊小咩额度怎么套出来,5种办法有效教你提现
DY月付怎么换钱出来!完美的操作:
头条:分期乐怎么把购物额度提出来,看看这2个操作方法