12月10日消息,2016年,中國文字博物館曾向公眾發(fā)出懸賞令,承諾每破譯一個甲骨文字便獎勵10萬元人民幣。然而直到2023年前,僅有一位學(xué)者憑借對“蠢”字的研究獲得了這份獎金。
截至目前,已發(fā)現(xiàn)的甲骨數(shù)量接近16萬片,其中包含約4500個不同的甲骨文字符。但遺憾的是,這些字符中只有大約1500個被成功解讀出來。
造成這一現(xiàn)象的主要原因包括:許多甲骨上的文字模糊不清、相似字形難以區(qū)分以及人工查找效率低下等挑戰(zhàn)。
為了加快甲骨文的解碼速度,騰訊公司構(gòu)建了一個包含超過143萬個單字記錄的世界大甲骨文數(shù)據(jù)庫,并利用數(shù)字技術(shù)實現(xiàn)了相似形狀和相關(guān)甲骨之間的匹配與關(guān)聯(lián)功能。該數(shù)據(jù)庫已于近期開源。
通過這個平臺,用戶可以快速檢索到相關(guān)信息。例如,在搜索欄輸入“牛”,系統(tǒng)將返回3504種與之形態(tài)相近或相關(guān)的甲骨文樣本及其對應(yīng)的原始材料。
除此之外,騰訊還發(fā)布了首個多模態(tài)甲骨文數(shù)據(jù)集(涵蓋一萬份甲骨拓片及摹本),詳細(xì)標(biāo)注了每個單字的具體位置及其所屬類別等信息,這一系列舉措有助于加速甲骨文被考釋的進程。
本文鏈接:http://m.zh1234.com/news42897.html騰訊建全球大甲骨文單字?jǐn)?shù)據(jù)庫:一個“?!庇?500種寫法