优化引文幻觉的AI来了

中国科学报
发布时间: 301次浏览

 tbO知多少教育网-记录每日最新科研教育资讯

一个新推出的开源语言模型OpenScholar,在进行准确文献综述方面可超越商用大语言模型(LLM)。比如,实验中,GPT4o会在78%-90%的情况下出现引文幻觉,而新的人工智能(AI)工具的引文准确率却与人类专家相仿。虽然仍需进一步优化,但该工具有望帮助科学家处理复杂且日益繁重的科学文献综述任务。相关研究成果2月5日发表于《自然》。
tbO知多少教育网-记录每日最新科研教育资讯

科学文献综述对于支持循证决策、微调科学过程和引导新发现都很重要。然而,文献发表数量的增长使研究人员很难掌握全部资讯。LLM可以提供协助,但却很容易出错,如归因能力有限和引文幻觉。tbO知多少教育网-记录每日最新科研教育资讯

为了生成准确、全面、透明的科学文献综述,美国西雅图华盛顿大学的Akari Asai、Hannaneh Hajishirzi和同事推出了OpenScholar。该模型是专为科研任务设计的检索增强语言模型。其他系统也用过这个框架,但作者将其与一个包含4500万篇最新开放获取科研论文的专业数据库以及一个自我评估机制相结合,从而优化其输出。作者还创建了名为ScholarQABench的基准工具来评估文献综述的自动化。研究显示,OpenScholar的准确率比GPT4o和PaperQA2(一个文献综述工具)这类现有系统分别高出6.1%和5.5%。此外,OpenScholar生成的答案在50%到70%的情况下比专家注释器的答案更有用。作者总结道,以上结果和引文幻觉大幅下降证明了OpenScholar有望支持和推动科学家的研究工作。tbO知多少教育网-记录每日最新科研教育资讯

但作者指出该系统仍有局限性,并强调基于语言模型的系统无法使科学文献综述完全自动化。他们向学界同时开放了ScholarQABench和OpenScholar,以鼓励进一步研究和优化。tbO知多少教育网-记录每日最新科研教育资讯

相关论文信息:https://doi.org/10.1038/s41586-025-10072-4tbO知多少教育网-记录每日最新科研教育资讯

本文链接:http://knowith.com/news-3-5106.html优化引文幻觉的AI来了

声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。

热门文章

延伸阅读

相关阅读

广东省2024艺考改革 2024年广东舞蹈艺考新政策
小编给大家带来了广东省2024艺考改革 2024年广东舞蹈艺考新政策相关文章,一起来看一下吧。 2024年广东舞蹈艺考新政策对艺术类专业进行了分类。 艺术类专业分为“组织专业能力考试的艺
泸州高考状元是谁考多少分
小编今天整理了一些泸州高考状元是谁考多少分相关内容,希望能够帮到大家。 关于2023年平陆高中高考成绩如下: 2023年高考,员鹏杰同学以总分626分,数学143分的优异成绩勇夺2023年平陆县高考
河南2024艺考时间几月几号 2024年河南高考报名时间
河南2024艺考时间几月几号 2024年河南高考报名时间相关内容,小编在这里做了整理,希望能对大家有所帮助,关于河南2024艺考时间几月几号 2024年河南高考报名时间信息,一起来了解一下吧! 河南省艺术
北京艺考时间2023具体时间是(美术校考时间2023具体时间)
今天小编整理了北京艺考时间2023具体时间是(美术校考时间2023具体时间)相关信息,希望在这方面能够更好帮助到大家。 北京2023年艺术统考具体时间是2022年12月到2023年1月,具体安排以教育部公布
艺考哪个比较好考
最近经常有小伙伴私信询问艺考哪个比较好考相关的问题,今天,小编整理了以下内容,希望可以对大家有所帮助。 艺考比较好考是美术、表演艺术考试和舞蹈艺术。 1、美术专业难度,通过率高 美术
山东最好的春季高考分数线 2023山东春季高考分数线
小编给大家带来了山东最好的春季高考分数线 2023山东春季高考分数线相关文章,一起来看一下吧。 2023山东春季高考分数线如下: 1、环境保护211分 2、建筑设计与管理252分 3、食品加

热点精选

最新推荐

您可能感兴趣