蚂蚁百灵大模型最新进展:已具备原生多模态能力

7月5日,在2024世界人工智能大会“可信大模型助力产业创新发展”论坛上,蚂蚁集团公布其自研百灵大模型最新研发进展:百灵大模型已具备能“看”会“听”、能“说”会“画”的原生多模态能力,可以直接理解并训练音频、视频、图、文等多模态数据。
原生多模态被认为是通往AGI的必经之路。记者在大会现场的演示看到,多模态技术可以让大模型更像人一样感知和互动,支撑智能体体验升级,百灵的多模态能力已应用于“支付宝智能助理”上,未来还将支持支付宝上更多智能体升级。
值得注意的是,支付宝智能助理入选2024世界人工智能大会“镇馆之宝”。
蚂蚁集团副总裁徐鹏介绍百灵大模型原生多模态能力
多模态大模型技术能够使AI更好地理解人类世界的复杂信息,也让AI落地应用时更符合人类的交互习惯,在智能客服、自动驾驶、医疗诊断等多个领域展现出巨大的应用潜力。据了解,百灵大模型多模态能力在中文图文理解MMBench-CN评测集上达到GPT-4o水平,在中国信息通信研究院多模态安全能力评测达到优秀级,具备支持规模化应用的能力,能支持AIGC、图文对话、视频理解、数字人等一系列下游任务。
据介绍,百灵大模型的多模态能力,也已被应用在蚂蚁集团生活服务、搜索推荐、互动娱乐等场景。在生活服务上,通过多模态模型让智能体具备一定规划执行能力,比如根据用户语音指定直接下单一杯星巴克咖啡,目前这一功能已在支付宝智能助理上线。在医疗领域,多模态能力为用户实现复杂任务操作,可以对超过100多种复杂的医学检验检测报告进行识别和解读,还可以检测毛发健康和脱发情况。
发布现场,蚂蚁集团副总裁徐鹏展示了新升级的多模态技术可实现的更多应用场景:通过视频对话的自然形式,AI助理能为用户识别穿着打扮,给出搭配建议;根据用户不同意图,从一堆食材中搭配出不同菜谱组合;根据用户描述的身体症状,从一批药物中挑选出可能合适的药,并读出服用指导,供用户参考等。
基于百灵大模型多模态能力,蚂蚁集团已在探索规模应用落地产业的实践。
论坛上同时发布的“支付宝多模态医疗大模型”正是这一探索的实践。据了解,支付宝多模态医疗大模型添加了包含报告、影像、药品等多模态信息在内的百亿级中英文图文、千亿级医疗文本语料,以及千万级高质量医疗知识图谱,具备专业医学知识,在中文医疗LLM评测榜单promptCBLUE上,取得A榜第一,B榜第二的成绩。
基于百灵大模型多模态能力,由蚂蚁集团与武汉大学联合研发的遥感模型SkySense,也在论坛上公布了开源计划。数据显示,SkySense是目前参数规模最大、覆盖任务最全、识别精度最高的多模态遥感基础模型。
“从单一的文本语义理解,到多模态能力,是人工智能技术的关键迭代,而多模态技术催生的‘看听说写画’的应用场景,将让AI的表现更真实,更接近人类,从而也能更好地服务人类。蚂蚁会持续投入原生多模态技术的研发。”徐鹏说。
(主办方供图)
本文链接:http://knowith.com/news-1-1349.html蚂蚁百灵大模型最新进展:已具备原生多模态能力
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
通辽人才?通辽市实验小学是市教育局直属吗
湖南大学研究生学费(湖南大学研究生学费一年多少)
东莞理工学院研究生(东莞理工学院研究生院)
经济学考研冲刺:微观经济之理性与风险
2014考研:经济学名词解释荟萃(第8辑)
经济学考研:曼昆《经济学原理》(第1章)
2015经济学考研:西方经济学模拟试题六
无锡在职研究生有哪些学校(无锡在职研究生有哪些学校招生)
考研数学一如何复习(考研数学一攻略)
查博士 怎么样_查博士怎么样准不准
称赞:京东白条怎样套,一招教你转到余额里
大吉大利:广州从化区上门代还信用卡,真实商户积分,高效便捷服务
揭底:在国内印度吉非替尼正常购买多少钱一瓶?购买必读第一代肺癌靶向药印度吉非替尼在国内购买地点在哪里,真实报价在499元30粒一瓶
组织:微信收款二维码怎么收分付,揭秘分付怎么套出来
商家推荐:抖音月付套出来的技巧小二分享秒回攻略:
总结五个办法:抖音月付套现秒回攻略教会你
大吉大利:佛山顺德代还信用卡垫还,都在这信誉至上,价格最低的地方
大吉大利:广州海珠区代还信用卡取现,最便宜的地方,实体店多种方式
告诉你:京东加油包怎么套出来,2025最简单的操作步骤流程
志在千里:花呗自己如何提现现金(试一试这三个方法)