小米大模型团队音频推理突破，一周登顶MMAU榜，GRPO算法显神威！-知多少教育网-记录每日最新科研教育资讯

首页 > 资讯

小米大模型团队音频推理突破，一周登顶MMAU榜，GRPO算法显神威！

虎科技

发布时间: 2025-03-18 09:13:48 459次浏览

小米大模型团队近日宣布，在音频推理技术方面取得了显著进步。该团队受DeepSeek-R1项目的启发，成功将强化学习算法应用于多模态音频理解任务，这一创新实践仅耗时一周，便在国际权威的MMAU音频理解评测中取得了64.5%的准确率，成功登顶榜首，并且已经同步开源。

据悉，DeepSeek-R1项目中提出的Group Relative Policy Optimization（GRPO）方法，使得模型能够通过“试错-奖励”机制自主进化，展现出类似人类的反思和多步验证等高级推理能力。小米团队受此启发，尝试将GRPO算法迁移到自家的Qwen2-Audio-7B模型上，取得了令人瞩目的成果。

在训练样本方面，小米团队仅使用了AVQA数据集中的3.8万条样本进行强化学习微调，便在MMAU评测集上实现了64.5%的准确率。这一成绩不仅刷新了记录，而且相比目前榜单上排名第一的商业闭源模型GPT-4o，有近10个百分点的优势。

尽管取得了如此显著的进步，但小米团队表示，当前模型的准确率距离人类专家的82%水平仍有差距。他们将继续努力，不断优化算法和模型，以期达到更高的准确率。

在官方提供的交互demo中，小米团队选择了雷军2015年“R U OK”的视频作为默认分析对象，展示了模型在实际应用中的表现。这一选择不仅富有趣味性，也体现了小米团队对于用户需求和场景理解的深入洞察。

小米技术官微在发布这一消息时表示，音频推理技术的突破将为智能语音助手、智能家居等领域带来更加智能和人性化的体验。他们期待与更多合作伙伴共同探索这一技术的广阔应用前景。

小米团队还强调了开源的重要性。他们认为，通过开源可以吸引更多开发者参与到技术的创新和优化中来，共同推动人工智能技术的发展和进步。

点击展开全文

本文链接：http://knowith.com/news-1-9427.html小米大模型团队音频推理突破，一周登顶MMAU榜，GRPO算法显神威！

声明：本网页内容由互联网博主自发贡献，不代表本站观点，本站不承担任何法律责任。天上不会到馅饼，请大家谨防诈骗！若有侵权等问题请及时与本网联系，我们将在第一时间删除处理。

上一篇：华为余承东预热“超乎想象”新品：是手机？还不止？3月20日见真章！

下一篇：宝马坚守安全底线：未验证自动驾驶技术，绝不装车实验

热点精选

海南发布2024年国际科技合作研发项目立项通知

海南发布2024年国际科技合作研发项目立项通知

海南省科学技术厅关于2024年国际科技合作研发项目立项的通知各有关单位：根据《海南省国际科技合作研发项目和

天津市自然科学基金项目通讯评审专家名单公布

天津市自然科学基金项目通讯评审专家名单公布

2023年天津市自然科学基金、种业创新重大专项项目评审专家名单按照工作安排，现将自然科学基金项目通讯评审、种业

贵州发布1项省基础研究计划申报指南

贵州发布1项省基础研究计划申报指南

省科技厅关于发布2025年度贵州省基础研究计划（决策科学）项目申报指南的通知各市（州）科技管理部门，各有关单位：

2024年度福建省高校产学研联合创新项目组织申报

2024年度福建省高校产学研联合创新项目组织申报

福建省科学技术厅等四部门关于组织申报2024年度福建省高校产学研联合创新项目的通知省内有关高校：为促进我省

云南公示2024年度省科学技术奖提名受理情况

云南公示2024年度省科学技术奖提名受理情况

云南省科技厅关于2024年度云南省科学技术奖提名受理情况的公示 2024年度云南省科学技术奖于2024年5月30日截止提

杜祥琬、李安民被提名为四川科学技术杰出贡献奖人选

杜祥琬、李安民被提名为四川科学技术杰出贡献奖人选

四川省科学技术厅关于2023年度四川省科学技术杰出贡献奖、杰出青年科学技术创新奖拟奖人选的公示根据《四川省科