1/7生物医学论文摘要由AI撰写

一项针对学术文献的大规模分析显示,去年发表的生物医学论文摘要中,约1/7可能借助人工智能(AI)完成撰写。2024年,医学数据库PubMed收录的150万篇摘要中,超过20万篇包含大型语言模型(LLM)常推荐使用的词汇。
相关研究于2024年6月以预印本形式在线公布,当时预计上半年约1/9的摘要由AI辅助完成。上述最新分析结果则在今年7月2日发表于《科学进展》。
图片来源:Nicolas Economou/NurPhoto via Getty
英国伦敦大学学院的Andrew Gray表示:“由LLM编辑的论文数量一直‘不可阻挡地增长’。”他认为,研究人员尚未充分认识到这些工具被用于产出学术成果的规模,“希望这篇论文能推动人们关注这一问题”。
许多团队试图评估LLM对学术产出的影响,但这一过程颇具挑战性,因为大多数使用者并未披露这种行为。常见方法是训练模型识别人类与LLM生成文本的差异,再将其应用于文献评估。然而,目前尚不清楚此类模型如何区分两种文本,且训练数据集未必能反映LLM生成文本的最新趋势。
德国图宾根大学的Dmitry Kobak及同事采用了更开放的研究方法。他们在摘要中搜索2022年11月ChatGPT普及后出现频率异常升高的“冗余词汇”。
研究发现,2024年有454个词汇的出现频率远高于2010年以来的任何年份。它们多为与研究内容无关的“风格词”,且以动词和形容词为主。其中既有常见词汇“发现”“潜力”,也有较生僻的词汇“探究”“展现”。Kobak指出,2024年下半年新增的冗余词汇包括“显著增强”“妨碍”,以及“无与伦比”“极有用”等最高级形容词。
科学词汇的演变是长期过程。2021年有190个“冗余词汇”,多为与研究内容相关的名词。但自LLM普及以来的词汇变化更为显著,且主要体现在风格层面。
此外,在计算科学和生物信息学等领域,超过1/5的摘要由LLM辅助撰写。“今年的整体数据可能进一步上升,LLM的使用仍在持续增加。”Kobak表示。AI实际使用率可能比最新研究显示的更高。
2月,法国巴黎高等师范学院的Mingmeng Geng及同事在预印本平台arXiv公布的研究中指出,部分标志性词汇和短语,如“探究”在2024年底的出现频率有所下降。他认为,这可能是由于相关研究将其标记为“使用AI”,促使作者删除此类词汇,或调整LLM请求以规避检测。
随着作者不断调整策略,评估AI对学术文献影响的研究变得越发困难。另一大挑战在于,包括Kobak团队在内的研究均无法确定AI工具的具体使用方式。作者可能将其用于合理场景,如润色文本或辅助翻译,也可能涉及更具争议的做法,如在缺乏适当监督的情况下生成大段文本。“这其中存在真正的科研诚信隐患。”Gray说。
相关论文信息:https://doi.org/10.48550/arXiv.2406.07016
本文链接:http://knowith.com/news-1-11802.html1/7生物医学论文摘要由AI撰写
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
许昌学院考研氛围,哪个学校研究生好考
哲理小故事——-送给奋斗中的考友们
北京大学光华管理学院经济学复习方法指导
2014考研:经济学名词解释荟萃(第10辑)
2015经济学考研:微观经济学脉络图(第一章)
重庆口碑好的考研机构(重庆考研学校推荐)
天津工业大学研究生怎么样(天津工业大学研究生怎么样好不好)
陕西省考研时间 考研政治名师都有谁
农业管理硕士太好考(农业管理硕士太好考小红书)
渴望GAP的年轻人,去海底捞当服务员
当前2025年印度/孟加拉劳拉替尼代购方式更新 洛拉替尼最便宜报价出炉
爆款2025伊布替尼多少钱一盒真实价格一览表公布!印度伊布替尼哪里买国内能买到吗?
如登春台:南昌青云谱区代还信用卡取现,最好还款服务,大家都找他操作
本人操作:DY月付要怎么套出来科普四大技巧:
天平:白条额度怎么刷出来现金,轻松7种流程方法
笃行致远:羊小咩享花卡怎么套出来,详细5个操作方法
态度陈恳:套白条最新的操作步骤—推荐10个操作方法
热点:白条怎么套出来(12种提现方法技巧分享)-知者
本人操作: 微信分付怎么套出来秒到, 这些套路和流程值得大家防范!
今天最新: DY月付如何取现出来? 2024最新提现方法