用数字科技守护中华文脉、焕活汉字源头

4月20日,“了不起的甲骨文”小程序正式发布上线,同时“甲骨文数字焕活”研讨会在河南安阳举办,会议围绕古文字与人工智能、甲骨文数字焕活总体思路、算法助力甲骨文焕活、甲骨文活化利用等重要议题展开。
当前研究表明,已经出土的甲骨约15到16万片,自然损坏速度较快,急需进行数据采集在数字空间进行永久化保存;已经发现的约4500个甲骨字,其中约3000字尚未释读,急需智能工具帮助提升字形匹配的搜索效率、推荐破译的相关线索;另外,急需将甲骨文冷门的文化资源转化成大家喜闻乐见愿意参与的普惠文化服务;甲骨文活化利用的素材有限、手段传统、渠道不畅,急需系统化开展工作。
在文化强国战略指引下,如何将前沿数字技术应用到文化遗产保护领域,腾讯一直在思考。
研究与传承仍需突破
自去年12月起,腾讯与河南安阳牵手,历经4个月的合作,由河南安阳市文物局、安阳师范学院甲骨文信息处理教育部实验室、中国文字博物馆、中国社会科学院考古研究所安阳工作站、腾讯SSV数字文化实验室、腾讯优图实验室、QQ浏览器共同推进的人机协同助力甲骨文“破译”和传承活化的专项合作,迎来阶段性成果,“了不起的甲骨文”小程序如今发布上线,将成为“甲骨文数字焕活”专业、实用、有趣的网络载体。
“了不起的甲骨文”小程序所使用的甲骨文高质量数据,源自世界上现有资料最齐全和最权威且可免费使用的甲骨文数据平台之一的“殷契文渊”,既可以为公众提供参与甲骨文传承活化的互动平台,也可以帮助专家学者进行甲骨文保护研究。
在底层技术的突破上,将从数据采集、信息建模、文字匹配几个步骤破题。
传统的甲骨文著录里提供的拓片、摹本、照片与实物相比,信息丢失较多,而学者到收藏机构查看甲骨实物的过程很不便利。项目组将通过系统梳理殷墟出土的各类甲骨实物特点,运用光照变换矩阵技术形成便携设备,大幅提升采集的速度和精度,用于甲骨文馆藏机构的大批量采集。
这些数据借助人工智能等技术实现“微痕分析”的突破,形成“甲骨文全信息数据模型”,实现了甲骨实物在数字空间的高保真还原和保护,并不断丰富完善甲骨文模型库。
甲骨文的研究重在文字,而甲骨文尚未进行标准编码,异体字、相近字、文字演变的查询比较困难。腾讯针对性研发的视觉AI技术,将用于训练文字检测、字形匹配等定制化算法,大幅提升甲骨文考释研究和“破译”的效率和质量。
双向互动打造众创模式
小程序可以作为中小学和文博机构、社会教育部门进行甲骨文研学的线上工具。爱好者也可以进行文字标注、提供破译线索,通过创意互动,承担甲骨文专家学者和信息处理团队已经分解的简单任务,进而形成甲骨文研究与传承双向互动的众创模式。
基于已释读的甲骨文权威数据,打开QQ浏览器搜索其中汉字即可查看权威的甲骨文对照信息,或使用“QQ浏览器扫描王”的识生字功能对该汉字进行摄像头识别,还能看到甲骨文的字源演变动画,直观感受汉字变迁源流。此外,用户还可以在腾讯搜狗百科中,全面地了解汉字的“前世今生”。
腾讯SSV数字文化实验室负责人舒展说,数字技术为文化遗产实现创造性转化与创新性发展提供了崭新契机。我们希望找到更多的可持续路径,持续的把它化为社会价值行动,不仅要靠腾讯自己的力量,更需要凝聚社会共识,汇聚同伴力量,久久为功。