◇连佳鹏(语言研究所)
习近平总书记在哲学社会科学工作座谈会上的重要讲话中指出,“要重视发展具有重要文化价值和传承意义的‘绝学’、冷门学科。这些学科看上去同现实距离较远,但养兵千日、用兵一时,需要时也要拿得出来、用得上。还有一些学科事关文化传承的问题,如甲骨文等古文字研究等,要重视这些学科,确保有人做、有传承”。习近平总书记专门提到了要加强以甲骨文为代表的古文字研究,体现了党中央对传承弘扬中华优秀传统文化的高度重视。在甲骨文研究中,甲骨缀合是最为基础和最为重要的工作之一。
甲骨缀合具有重要意义
作为三千年前的遗物,商周甲骨破损严重。目前,存世商周甲骨总数在16万片左右,绝大多数都是残缺不全的碎片。利用甲骨文研究古代语言和历史,首先必须对这些碎片进行缀合,即将本属同版的甲骨碎片,依据形态、卜辞、坑位等信息拼接在一起,尽可能恢复其本来面貌。
学界累积的很多疑难问题往往要依靠新材料的不断出现才能解决。甲骨学新材料的来源有二:一是来自甲骨出土,二是来自甲骨缀合。从这个意义来讲,再怎么强调甲骨缀合的重要性都不为过。
甲骨缀合容易让人误解为是一种简单的拼图游戏。事实上,它是一项复杂且学术性较强的工作,是综合运用甲骨学知识的集中体现。在缀合时,研究者要熟悉龟甲与牛肩胛骨的形态,掌握甲骨的整治情况、字体类别、残存笔画、甲骨辞例、卜法等。除此之外,对甲骨材料的著录、出土区域以及已有的缀合成果等内容也要有所了解。由此可见,缀合甲骨之前的准备工作本身就是一个刻苦艰辛的努力过程。即使努力完成了这些准备工作,也仅仅站在了缀合的起跑线上,研究者还要具备敏锐的观察力和思考力,才会有缀合成果不断产出。
甲骨缀合历史阶段划分
2010年,黄天树曾将甲骨缀合史大致分为三个阶段:从1917年王国维首次缀合甲骨到1938年是第一阶段,1939年曾毅公出版缀合专书到1977年是第二阶段,1978年《甲骨文合集》的出版标志着甲骨缀合进入第三个阶段。这一分法依据的是甲骨缀合史上的标志性事件,是比较科学的。不过,2010年之后又出现了一些新情况,这一分法没有涉及。本文在此分法的基础上将甲骨缀合分为四个阶段。
发轫阶段(1906—1938)。1906年,美国传教士方法敛在《中国古代文字考》一文中,发表了有记载的第一组甲骨缀合。1917年,王国维在撰写《殷卜辞所见先公先王续考》时,发现《殷虚书契后编·上》8.14与《戬寿堂所藏殷虚文字》1.10可以缀合,缀合后得到的是一条比较完整的世系卜辞“上甲十,报乙三,报丙三,报丁三,示壬三,示癸三”等。通过与《史记·殷本纪》所记载的“微—报丁—报乙—报丙—主壬—主癸”世系相比对,不仅可以确认《殷本纪》所记载的殷商世系大体是可信的,而且可以据卜辞将“报丁—报乙—报丙”订正为“报乙—报丙—报丁”。王氏的此则缀合体现了“纸上之材料”与“地下之新材料”相结合进行古史新证的二重证据法的精髓,也成为最早产生广泛而深远影响的一组缀合。其后,董作宾、郭沫若、唐兰、容庚、商承祚、孙海波等,都对甲骨缀合的理论与实践作出了重要贡献。不过,总体上看,这一时期缀合成果不多,尚处于起步阶段。
勃兴阶段(1939—1977)。这一阶段的起点,以1939年曾毅公出版第一部甲骨缀合专书《甲骨叕存》为标志。后来,曾氏将该书增订为《甲骨缀合编》,收录缀合382则,数量之巨,前所未有。“勃兴”主要表现在成规模的缀合成果问世,如郭若愚、曾毅公、李学勤的《殷虚文字缀合》收录缀合475则;张秉权的《殷虚文字丙编》编为632号,正反各占一号;屈万里的《殷虚文字甲编考释》收录缀合192则等。严一萍所编的《甲骨缀合新编》为第一部缀合总集,加上后来增补的《甲骨缀合新编补》,共收各家及作者缀合708则。
全盛阶段(1978—2018)。1978—1982年,大型甲骨著录书《甲骨文合集》陆续出齐,编纂者对甲骨材料经过精心的整理,做了大量的缀合,“总计拼合不下两千余版”。随着新材料和更清晰的拓本著录书如《史语所购藏甲骨集》《上海博物馆藏甲骨文字》《旅顺博物馆所藏甲骨》等的出版,以及字体分组分类、甲骨形态学、甲骨文例等理论研究的不断深入,这一阶段的缀合数量远超以前,总数为4000余则。甲骨缀合学者队伍庞大,先后发表过缀合成果的有近100人。其中,以林宏明缀合成就最为突出,累计已达1200余则。缀合专书有蔡哲茂的《甲骨缀合集》《甲骨缀合续集》,黄天树主编的《甲骨拼合集》《甲骨拼合续集》《甲骨拼合三集》《甲骨拼合四集》《甲骨拼合五集》,林宏明的《醉古集》《契合集》、张宇卫的《缀兴集》(主要辑录作者2011—2018年的缀合成果)等,还有蔡哲茂编选的集众家缀合成果的《甲骨缀合汇编》。此外,2005年中国社会科学院历史研究所(现为古代史研究所)先秦史研究室网站开通运行,为研究者提供了及时、可检索的缀合发表平台,在推动甲骨缀合方面功不可没。
计算机辅助阶段(2019年至今)。这一阶段学者的手工缀合正如火如荼地进行着。如黄天树率领其甲骨团队编纂的《甲骨文摹本大系》于2022年出版,全书共43巨册,从选择良拓、剔除伪片、删除重片、缀合残片等细致步骤入手,针对7万余片有字甲骨制作摹本、撰写释文、编制索引,将原本庞杂无序的有字甲骨整理成了井井有条的科学资料。该书收录了2020年12月之前的所有缀合成果,这些甲骨缀合成果原本分散在各种甲骨缀合专书、刊物和学术网站上,应用起来不太方便,该书出版后可以省去学者翻检之苦。此外,黄天树主编的《甲骨拼合六集》目前正在编撰,预计收录新的缀合成果近200则。
不过,手工缀合全凭个人的经验和脑力记忆,面对存世的约16万片甲骨,如果全靠人力来整理,将会耗费大量的时间和精力。早在20世纪70年代,美国学者周鸿翔和中国学者童恩正等人就曾试图利用计算机进行甲骨碎片的缀合,但因人工录入拓片信息工作量较大,且缀合准确率不高,因而无果而终。随着计算机技术的迅猛发展,人工智能(AI)这两年逐渐成为各个行业的焦点,为学术研究注入了新的活力。2019年,人工智能辅助甲骨缀合取得了实质性进展,这一年产出了数则人工智能辅助的甲骨缀合。因此,可以将2019年视为人工智能辅助甲骨缀合的元年。
2019年3月,林圭侦、李怡萱、蔡依静在先秦史研究室网站上发表一组甲骨新缀,指出“系透过计算机图像比对边缘特征相符”。2019年12月,安阳师范学院甲骨文信息处理教育部重点实验室成员张展使用计算机辅助甲骨缀合的第一则成果也在先秦史研究室网站上发表。他设计的程序后来又完成数则正确的缀合,该程序的基本方法为:“使用计算机视觉技术,提取甲骨碎片图像边缘,每隔相等的距离采样一个像素点,根据甲骨碎片图像采样像素点之间的距离和,判断图像是否可拼接。”边缘记忆和匹配能力对于人脑来说是比较困难的,而这恰恰是人工智能比较擅长的领域。现在的人工智能技术,在人脸识别、物品识别等方面都已相当成熟,而甲骨的边缘本质上也是一种线形图形,处理起来并没有什么特殊的困难,其效率远超人脑。2019年,在尝试把甲骨文与计算机结合的一次小型会议中,首都师范大学莫伯峰提出可以用计算机缀合甲骨作为“甲机会”的实验项目。后来由河南大学和首都师范大学联合研发的软件“缀多多”,对殷墟出土的牛胛骨材料进行了全面计算和试缀,减少了人工查验的工作量,在一个月内经甲骨学者查验可得的新缀达40余则,取得了初步成功。2023年,清华大学计算机系自然语言处理与社会人文计算实验室“计算甲骨学”研究组李霜洁研发了人工智能文物拼缀系统“知微缀”,将如何更有效地发现甲骨新缀这一问题,聚焦到人工智能如何建立更有效的直观联系以带动和触发研究者的直觉上。截至2024年3月,该研究组已使用这一系统拼缀甲骨达40则。
计算机除了辅助甲骨缀合外,还可以辅助缀合成果的检索。目前,学界已有7000则以上的缀合成果,涉及甲骨约1.5万片。面对如此巨量、不同出处的缀合,如果全靠手工翻检,颇为不便,而前辈学者编制出版的缀合总表也有一定滞后性。为此,2023年复旦大学出土文献与古文字研究中心研发了“缀玉联珠”甲骨缀合信息库,致力于全面整合甲骨缀合信息,将缀合情况、出处、缀合者等信息汇于一处,为学界提供了极大的查检之便。
虽然人工智能辅助甲骨缀合的运用前景十分光明,引人遐想。不过,应当承认其仍处于非常初级的阶段,计算机缀合程序只是辅助人工,不能完全替代人工,研究者不得不采取“人机耦合”的方式。今后,应考虑让人工智能学会自主学习,自主发现缀合特征并实现缀合。