【理响中国】AI如何解密甲骨文

发布时间:2024-12-25 12:41:30 来源: sp20241225

  甲骨文作为中华民族宝贵的精神财富,不仅承载着深厚的文化底蕴,还蕴含着丰富的学术和史料价值。这一古老的文字,犹如穿越时空的信使,传递着先人的智慧与文明的信息。

  作为我国已知最早的成熟文字系统,甲骨文自1899年首次被发现以来,便引起了学术界的广泛关注。历经数代学者的不懈努力,甲骨文研究取得了丰硕的成果,为我们揭示了古代社会的诸多秘密。然而,甲骨文研究的专业性极强,加之甲骨本身易损且分散保存于各地,使得这一领域的研究仍面临诸多挑战。

  近年来,随着人工智能技术的飞速进步,人们开始探索将AI应用于甲骨文研究的新途径。这一创新性的尝试不仅为甲骨文研究注入了新的活力,也引发了学界的广泛讨论和期待。在数字化和智能化的浪潮中,甲骨文研究究竟取得了哪些实质性的进展?人工智能能否凭借其强大的计算能力,成功破解甲骨文的千古之谜?其背后的核心优势又是什么?为深入了解这些问题,记者采访了中国社会科学院学部委员、甲骨学家宋镇豪,请他带我们走进“数字化时代”的甲骨文。

  创新:用高质量数据库投喂AI

  历经三千余载岁月洗礼的甲骨文,无时无刻不在与风化、虫蠹、破坏等自然力量抗争。在以往的甲骨文研究中,学者们主要依赖于拓片研究与书面著录。然而,这一传统方式往往受限于甲骨文字的模糊和信息的碎片化,难以形成统一且全面的认知。如今,随着数字技术的飞跃式发展,我们拥有了前所未有的工具——上亿像素的相机、微距拍摄技术、三维建模、红外线拍摄以及多光谱拍摄等。这些高科技手段共同织就了一张细密的网,全方位、多角度地捕捉并呈现了甲骨的真实面貌。尤为值得一提的是,微痕增强技术的引入更为甲骨文的解析工作开辟了新天地。即便是在肉眼难以辨识的细微之处,这项技术也能让研究者清晰地看到甲骨上那些浅浅的刻痕,进而更为精准地分析笔画走向与字形轮廓。此外,光谱分析技术的运用,使我们得以窥见那些被丹砂“涂朱”或被炭黑“填墨”的甲骨文背后所隐藏的特殊含义,为解开古老文明的密码提供了宝贵的线索。

  经过长达125年的不懈努力,甲骨文研究已从最初的辨析阶段迈上了认知发展的新台阶。宋镇豪指出,尽管目前甲骨文已知的单字数量已逾4200个,但能够确切释读的却仅占总数的1/3左右。这意味着,仍有大量的甲骨文字等待着我们去董理、去解读。同时,他也强调,甲骨文研究不应局限于单个文字的识别,而应更加注重其中所蕴含的人文精神与思想内涵。宋镇豪表示,甲骨文作为殷商时期的重要文化遗产,不仅记录了祭祀、战争、占卜、记事等日常活动,还生动再现了当时社会的经济、政治、文化等各个方面。它如同一部生动的历史画卷,为我们揭开了古老殷商王朝的神秘面纱。如今,借助人工智能与大数据的力量,我们可以对这些珍贵的史料进行深度挖掘与关联分析,从而更加全面、深入地理解那段遥远而辉煌的历史。

  对于人工智能在甲骨文研究中的应用前景,宋镇豪充满了期待。他认为,学习型人工智能的关键在于为其提供充足且高质量的“教材”。在这些“教材”的滋养下,人工智能将承担更多的研究任务,如甲骨文字形识别、拓影甲骨字的提取与检测、甲骨文的组类区分、甲骨片的查重收敛、甲骨片的智能缀合以及甲骨文例的释读解析等。譬如在甲骨缀合领域,人工智能技术展现出了巨大的潜力。面对那些因年代久远而破碎不堪的甲骨碎片,人工智能能够凭借其强大的数据处理能力与算法优势,实现碎片的自动缀合与拼接。这不仅极大地减轻了研究者的工作负担,更为甲骨文的完整复原与深入研究提供了有力支持。此外,人工智能还能够在研究成果的集成与校验方面发挥重要作用。通过对已有研究成果的重新审视与校验,人工智能能够及时发现并纠正其中的错误与遗漏,确保甲骨文研究的准确性与可靠性。

  突破:甲骨文大数据平台不断完善

  2019年,值甲骨文发现120周年之际,中国社会科学院甲骨学殷商史研究中心与安阳师范学院教育部暨河南省甲骨文信息处理重点实验室携手共创的甲骨文大数据平台——“殷契文渊”(http://jgw.aynu.edu.cn/)向全球免费开放。

  登录“殷契文渊”官方网站,一幅幅古朴典雅的甲骨文与深邃的暗黑背景交相辉映,营造出一种穿越时空的神秘氛围,同时又不失现代科技的未来感。该平台集成了甲骨著录库、甲骨字形库、甲骨文献库以及甲骨文知识服务平台等多个功能模块,为用户提供了全方位、多层次的甲骨文信息查询与研究体验。

  截至目前,“殷契文渊”已收录甲骨著录多达154种,甲骨图像更是达到了惊人的239902幅,甲骨论著亦有34418种之丰。记者尝试在字形库中输入“文”字,便迅速检索到与之相关的甲骨单字详情,进而通过片号查询包含该字形的甲骨片及其释读信息,真切体会到这一大数据平台给学者与甲骨爱好者的研究工作带来的极大便利。

  “‘殷契文渊’已步入第五期建设新阶段,并建设了‘殷契文渊AI协同研究平台’。”宋镇豪表示,未来,该平台将致力于全球范围内甲骨文大数据的精细采集,并在AI大模型的辅助下实现智能化深度集散与知识体系的育成,为甲骨文研究开辟更加广阔的空间。

  回顾历史,20世纪在郭沫若、胡厚宣等学术巨擘的引领下,《甲骨文合集》历经二十六载春秋,精选传世甲骨41956片,编撰成书,成为甲骨学领域的扛鼎之作。随后,《甲骨文合集补编》又增补了13450片甲骨,进一步丰富了甲骨文的资料库。然而,据统计,目前全球范围内已知的甲骨数量已逾16万片,仍有大量珍贵甲骨散落各处,甚至沉睡于库房之中,亟待发掘与整理。宋镇豪说,依靠我们目前手中有限的甲骨文资料,想要揭开中国古史的奥秘,还远远不够。

  除了甲骨全面整理著录这一制约性问题,甲骨释读的难度更大。甲骨文等古文字的考释工作,恰似一个错综复杂的解谜与破案过程,要求研究者们在浩瀚的已知信息中抽丝剥茧,寻找关键证据,以推求未知的真相。这一过程不仅考验着研究者的专业知识与技能,更对其跨学科的综合素养提出了很高的要求。甲骨文研究领域的知识门槛相对较高,需要研究者精通古文字学,并具备历史、考古、天文、地理、文献、语法等多方面的知识储备。

  面对这一挑战,我国政府相关部门积极作为,推动全国多所高校研究团队投身于人工智能辅助甲骨文研究的探索之中。在互联网科技公司的鼎力支持下,甲骨文数据集得以不断完善与扩充,为AI技术的深度应用提供了坚实基础。“我始终坚信,建立高质量的甲骨文数据库才是长远之计。”宋镇豪强调,我们亟须通过第一手资料的汇总与整理,构建一个权威、核心且可持续发展的平台。我们在此基础上进行科学分析与研究,以期解决一些重大问题,推动对中华文明历史进程的深入了解与阐释。

  心愿:让数字化助力甲骨文“回家”

  近日,散落在韩国的7片甲骨实物高保真数据首次以数字化形式“回归”安阳。这标志着甲骨文正式开启了数字化“归乡”之路。

  一片甲骨惊天下。甲骨文以其独特的魅力展现了中华民族的伟大智慧和创造。安阳殷墟是甲骨文的主要出土地,安阳小屯出土的近16万片甲骨文物分散收藏于全球近200家机构中。宋镇豪一直有一个心愿:让甲骨文“回家”。然而,甲骨文以“物理形式”回归殷墟几无可能,随着互联网平台的发展,数字化回归成为最佳选择。

  以宋镇豪为牵头人,腾讯公司、中国先秦史学会、安阳师范学院等机构发起的“全球甲骨数字回归计划”,以“殷契文渊”为基盘,逐步形成了甲骨采集、建模、存储、展示、共享的标准规范和数字工具箱,初步实现了甲骨文数字化工程的试点建模。据了解,这项工程最大程度地保存了甲骨及其承载文字的原始面貌,有助于实现永续保存、传播与传承的目标。以三维建模、微痕增强、人工智能等技术为基础的“甲骨文全信息模型”突破了传统研究对拓片、摹本、照片的依赖,不仅能看清甲骨文字,还能看到笔画叠压、朱书墨书、涂改刮削等其他原来看不清的相关信息,为甲骨文研究,特别是查重及缀合研究带来了革命性变革,有力推动了甲骨文以数字化形式回归殷墟。团队还与加拿大英属哥伦比亚大学、美国芝加哥大学、英国杜伦大学等知名高校及研究机构初步达成合作意向,共同推动此项工程的顺利进行。

  宋镇豪表示,甲骨文数字技术的突破形成了新质生产力,计算机的学习功能远远高于人类。下一步,应在整体整理材料的基础上,通过文献的碎片化标注,全面增强大模型的甲骨学知识和能力。要不断创新,加大人工智能与甲骨文复合型人才的培养,使人工智能工具助力甲骨文相关各类工作提质增效。

  宋镇豪谈到,人工智能为甲骨文开发了更广阔的天地和更多的应用场景,让甲骨文能够得到永续保存与传承。他坚信,未来,随着大数据、云平台、人工智能等新技术在甲骨文研究领域的推广和应用,有望加快甲骨文探析进程,解决长期困扰学界的疑难问题,甲骨文研究必将取得令人震撼的成果。(作者:段丹洁 来源:中国社会科学网-中国社会科学报) 【编辑:田博群】