厦大尝试AI大模型破译甲骨文

近日,厦门大学信息学院自然语言处理实验室教授史晓东团队申报的“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”入选“探元计划2024”“创新探索型项目”TOP10榜单。
甲骨文也被称作“殷墟文字”,距今已有三千多年历史,是世界四大古文字之一,是现代汉字的根脉。传统的甲骨文字考释工作极其耗时费力,依托于专家进行人工释读,多采用字形分析、辞例研究等方法,需要考古专家以深厚的知识积累和大量的文献阅读为基础,结合多方面的知识去破译甲骨字,已经难以为继。近年来AI技术迅猛发展,利用深度学习模型超强语义表示能力来实现甲骨文的辅助考释,优势已经崭露头角。
团队研究人员针对甲骨文数据稀缺、图像质量参差不齐的现状,系统整理相关古文字数据,构建更大规模、更高质量的甲骨文多模态数据集,提出了“基于甲骨文多模态大模型的多元信息辅助考释模型”的技术方案。
项目将设计一系列与实际考释过程密切相关的任务和评估方法,如跨字体图像映射、跨字体IDS(表达结构的部首偏旁序列)解码和甲骨字现代字对译关系等,以有效训练多模态大模型。利用其强大的跨模态理解能力,辅助甲骨文考释。在大模型提供的语义嵌入基础上,本项目还将设计融合音、形、义、用多元信息的端到端甲骨文综合考释模型,综合利用字形结构、语义关联、同音通假和用法聚类分析,开发一种更加轻量的考释系统,以适应资源有限的实际考释场景。
据悉,“探元计划2024”是由国家文物局科技教育司指导,中国文物信息咨询中心(国家文物局数据中心)、腾讯SSV数字文化实验室、腾讯研究院、社会价值投资联盟(深圳)与中国文物报、紫荆杂志社联合发起。厦门大学信息学院教授史晓东为“基于甲骨文多模态大模型的多元信息甲骨文辅助考释模型”项目的团队负责人。
本文链接:http://knowith.com/news-2-2004.html厦大尝试AI大模型破译甲骨文
声明:本网页内容由互联网博主自发贡献,不代表本站观点,本站不承担任何法律责任。天上不会到馅饼,请大家谨防诈骗!若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。
【申报】关于公开征集2024年绿色诊断服务商的通知
【解读 】《关于调整本市人力资源服务业务部分经办政策有关问题的通知》
关于印发《北京市集成电路专业职称评价试行办法》的通知(京人社事业发〔2023〕41号)
工业和信息化部办公厅关于举办2023年中国5G发展大会的通知(工信厅通信函〔2023〕275号)
首批30家服务站“各显其能”—— 北京:多维度靶向赋能专精特新企业
第七届中关村国际前沿科技大赛境外赛区医药健康领域决赛举办
关于进一步提升不动产登记便利度促进营商环境优化的通知(自然资发〔2024〕9号)
北京经济技术开发区支持高精尖产业人才创新创业实施办法(2.0版)
进一步促进北京老字号创新发展的行动方案(2023-2025年)
《工业领域数据安全能力提升实施方案(2024-2026年)》
今日消息: 羊小咩享花卡购物额度怎么取现 超级实用提现方法!
2025年印度布加替尼价格多少钱一盒正式出炉!国内购买布加替尼印度版如何购买更靠谱呢?
大吉大利:深圳大鹏新 上门代还信用卡,可长期合作,需要的请联系
如登春台:合肥长丰县上门代还信用卡,放心的选择,需要的请联系
坚韧不拔:花呗自己如何提现现金(推荐最新的3个方法)
欢欣鼓舞:贵阳修文县代还信用卡的6种刷法 (无视风控秒回款)
新闻:京东白条去哪里可以套(详细操作的9种方法)-知者
热点讨论:拼多多先用后付额度怎么套出来(推荐十个操作方法)
换现无风险: 得物佳物分期额度找商家TX的安全秒到方法 7个常用方法手把手教你操作
今日公布:微信分付怎么套出来?这三个操作方法一定有用