【寫意中國探尋漢字起源】視頻|甲骨文研究進入智能時代,新技術讓冷門絕學“活”在當下
【“了不起的中國漢文字”系列——甲骨文信息處理教育部重點實驗室】
甲骨文,又稱“契文”“甲骨卜辭”。它的發現,將有文字記載的中華文明史向前推進了一千多年。時至今日,距離甲骨文首次被發現已經過去了120余年,但人們對甲骨文的了解仍較為有限。很多人好奇,在這些充滿趣味卻又晦澀難懂的甲骨文里,究竟蘊藏著古人怎樣的文化秘密?
識別與釋讀是甲骨文研究的核心問題。在已發現的甲骨文單字中,大部分未獲識別。從20世紀初開始,一代又一代的專家學者們將甲骨文研究接續傳承,著述不輟,并讓這門古老的學問不斷推出新的成果。在此期間,甲骨文破譯之路也開始越走越寬。
近日,話題“破譯一個未釋讀甲骨文單字獎勵10萬元”一度沖上熱搜,這是甲骨文釋讀工作課題責任單位——中國文字博物館,于2016年10月28日發表在《光明日報》上的公告。這則面向社會發出的“懸賞令”,一經發出便引起眾多讀者的注意。其中提出了“鼓勵甲骨文研究者運用大數據、云計算等現代技術手段與傳統研究手段相結合,形成原創性研究成果”。
在大數據、云計算飛速發展的今天,如何有效利用這些現代科技手段,助力甲骨文研究工作,是各界一直在思考和努力的方向。
地處甲骨文發源地的安陽師范學院,擁有國內唯一的甲骨文信息處理教育部重點實驗室和甲骨文信息處理人才創新團隊,建有甲骨文大數據平臺“殷契文淵”、甲骨文活化利用中心和漢字文化體驗館等專業平臺,是全國甲骨文研究的重要單位和學術中心。
研究工作的積累,促進了甲骨文信息處理學科建設。安陽師范學院計算機與信息工程學院院長、甲骨文信息處理教育部重點實驗室主任劉永革介紹,目前實驗室已建立四個研究方向支撐的學科體系:甲骨學與殷墟科技考古、甲骨文語言計算、甲骨文識別與字形分析、甲骨文大數據平臺。同時,運用大數據和人工智能等技術對尚未破譯的甲骨文單字進行多學科聯合攻關,在甲骨文考釋、甲骨綴合等方面實現新突破,取得了豐碩成果。
2019年,實驗室向全球發布了“殷契文淵——甲骨文大數據平臺”。該平臺集甲骨文著錄庫、文獻庫、字形庫于一體,是世界上現有資料最齊全、最規范、最權威的甲骨文數據平臺,從上線之日起便面向全世界免費開放,為甲骨文研究插上了科技的翅膀,也標志著甲骨文研究進入“云時代”。
截至目前,平臺數據庫中共收錄甲骨著錄152部,種類數量為世界最多;收錄甲骨圖像23萬多幅,甲骨文研究論著3萬余篇,平臺瀏覽量超過100萬次。“通過這個平臺,能讓甲骨文能被更多人所看到,并且還可以借助‘人機協同’的方式,通過智能化信息提取,幫助專家破譯未釋讀的甲骨文。”劉永革說。
“以前甲骨碎片都是靠記憶和手工一片一片地拼合。數字化介入以后,可利用人工智能圖像技術進行自動綴合,團隊據此研發了甲骨文自動綴合系統,目前已綴合37組甲骨碎片,這37組是人類專家還沒有綴合出來的。”劉永革表示,實驗室的未來目標是實現甲骨文“圖形檢索”,破譯出一個新的甲骨文字,即用計算機人工智能圖像識別系統,直接檢索甲骨文拓片上的甲骨文,“這將為全球的甲骨文研究學者及愛好者的甲骨文資料查詢帶來極大便利,我們正在一步步向這個目標靠近”。
以甲骨文為代表的“古老絕學”,一度因為研究的人太少,而略顯冷門。近年來,為推動甲骨文走向大眾,讓甲骨文從“絕學”變“顯學”,做到“絕學”不絕,“冷門”不冷。在劉永革的支持下,安陽師范學院開設了《甲骨文信息處理》特色課程,還舉辦了計算機編程選拔比賽,為學生提供實驗室工位以便于研究,大大提升了學生的學習和科研興趣。
實驗室科研助理劉夢婷日常負責的就是甲骨文論著信息錄入工作。“因為熱愛甲骨文,想到能為甲骨文整體研究貢獻一點自己的力量,同時也能學到更多相關知識,就不會覺得枯燥無味。”劉夢婷說。
一片甲骨驚天下,百年研究氣象新。現代科技為保護文物、研究甲骨文開辟了新的空間,而未來如何做好傳承,利用好人工智能技術助力甲骨文破譯,講好甲骨文的故事,還有一段路需要走。但我們相信,這一天,并不遙遠。
策劃:李政葳、丁艷 拍攝:曾震宇 撰文:雷渺鑫 制作:劉昊
版權聲明:凡注明“來源:中國西藏網”或“中國西藏網文”的所有作品,版權歸高原(北京)文化傳播有限公司。任何媒體轉載、摘編、引用,須注明來源中國西藏網和署著作者名,否則將追究相關法律責任。