问题越简单,人工智能越“糊涂”

中国科学报
276次浏览

 01V知多少教育网-记录每日最新科研教育资讯

9月25日,一项发表于《自然》的研究表明,当大型语言模型(LLM)变得更大并从人类反馈中学习时,它们在回答简单问题方面似乎变得不那么可靠。01V知多少教育网-记录每日最新科研教育资讯

大型语言模型能够回答各种各样的问题,但并不总是准确的。图片来源:Jamie Jin/Shutterstock01V知多少教育网-记录每日最新科研教育资讯

  ?01V知多少教育网-记录每日最新科研教育资讯

人工智能开发人员试图通过两种主要方式提高LLM的能力,一是扩大规模,为其提供更多的训练数据和计算能力,二是根据人类反馈对其进行调整或微调。01V知多少教育网-记录每日最新科研教育资讯

西班牙巴伦西亚理工大学的JoséHernández-Orallo和同事研究了LLM在规模扩大和调整过程中的表现。他们研究了OpenAI的GPT系列聊天机器人、Meta的LLaMA AI模型,以及一组名为BigScience的研究人员开发的BLOOM。01V知多少教育网-记录每日最新科研教育资讯

研究人员通过设置5种类型的任务测试人工智能,即算术问题、解字谜、地理问题、科学挑战和从杂乱无章的列表中提取信息。01V知多少教育网-记录每日最新科研教育资讯

结果发现,扩大和调整可以使LLM更好地回答棘手的问题,比如将异序词“yoiirtsrphaepmdhray”重新排列为“甲状旁腺功能亢进症”。但两种方式与其在基本问题上的进步并不匹配,比如问及“当把24427和7120加在一起时,会得到什么”,LLM继续出错。01V知多少教育网-记录每日最新科研教育资讯

虽然在难题上的表现有所改善,但人工智能系统避免回答任何一个问题的可能性下降了——因为它不能。结果是,错误答案的可能性增加了。01V知多少教育网-记录每日最新科研教育资讯

Hernández-Orallo表示,研究结果突出了将人工智能描述为无所不知的危险,就像它们的创造者经常做的那样,而一些用户太容易相信了。“我们过度依赖和信任这些系统。”他说。01V知多少教育网-记录每日最新科研教育资讯

这是一个问题,因为人工智能模型对自己的知识范围并不诚实。英国牛津大学的Carissa Véliz说:“人类之所以超级聪明,部分原因在于有时我们没有意识到‘知之为知之,不知为不知’,但与大型语言模型相比,我们非常善于意识到这一点。大型语言模型不知道所拥有知识的极限。”01V知多少教育网-记录每日最新科研教育资讯

相关论文信息:https://doi.org/10.1038/s41586-024-07930-y01V知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-3-1009.html问题越简单,人工智能越“糊涂”

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

编导专业不走艺考可以吗?
最近经常有小伙伴私信询问编导专业不走艺考可以吗?相关的问题,今天,小编整理了以下内容,希望可以对大家有所帮助。 2024河北艺考政策如下: 1、到2024年,河北省将基本建立以统一高考为基础、
河南省音乐艺考分数线2023(24届舞蹈艺考改革内容)
今天小编整理了河南省音乐艺考分数线2023(24届舞蹈艺考改革内容)相关信息,希望在这方面能够更好的大家。 河南省2023年普通高等学校招生艺术类省统考专业合格线:音乐类:130;播音与主持类:268;
2024 年将实行新高考地区的高考生,今年没考好还建议复读吗?
今天小编整理了2024 年将实行新高考地区的高考生,今年没考好还建议复读吗?相关信息,希望在这方面能够更好帮助到大家。 对于这些地区的高考生来说,现在的确是一个非常困难的时期。在即将实施新高考
天津春季高考预科班分数线 预科分数线?
今天小编整理了天津春季高考预科班分数线 预科分数线?相关信息,希望在这方面能够更好的大家。 2023广西大学预科班分数线554分。 预科班: 预科即大学基础课程或桥梁课程,属大学前的预备
鱼台中职春季高考分数线 山东春季高考专科分数线
鱼台中职春季高考分数线 山东春季高考专科分数线很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 2022年春季高考专科分数线是150分。 春季高考是为缓解夏季高考压力,带给考
中考舞蹈艺考考什么内容
中考舞蹈艺考考什么内容很多朋友对这方面很关心,整理了相关文章,供大家参考,一起来看一下吧! 中考舞蹈艺考的的考试科目: 1、基本功考核。 由评委统一组织、统一测试,满分为100分。基本功测试的内容

热点精选

最新推荐

您可能感兴趣