學術研究離不開電子資源已成為學術界的共識。基於共用精神,學界、社會界提供了許多網路資源,為研究者創造了便利。但與此同時,網路資源的有限性、不穩定性等局限,也為學術研究充分利用資源帶來了困難與挑戰。為此,11月19日,北京大學佛教研究中心邀請部分在京學者在中心舉辦了“佛學研究資來源資料庫建設”座談會,商討中心資料庫建設的相關事宜。
北京大學《儒藏》編纂與研究中心楊浩老師首先介紹了知識圖譜技術。知識圖譜技術通過模仿人腦的思維方式,在資料庫的基礎上進行資料連接,相當於資料庫的2.0版,其底層邏輯是本體-關係理論。楊浩老師以《宋元學案》知識圖譜為例,為在場學者演示文本處理與圖譜構建的具體應用。《宋元學案》最基本的本體有人物、地點、著作、職官等,在本體基礎上以視覺化技術完成知識和知識之間的連接。接著,楊浩老師介紹了古籍整理核心演算法研究——通過人機協作實現句讀標點、詞語切分、實體識別的自然語言處理技術,方便核對古籍原圖與標記,並且可以記錄對電子稿的任何修改。人機協作能產生更好的資料,更好的資料積累能滋生更好的演算法,從而形成良性迴圈。可以說數位化會全面提升古籍整理效率。
中央民族大學哲學與宗教學學院史經鵬老師介紹了方廣錩老師對敦煌寫本的處理過程。寫本本身形態複雜,人力識別耗時耗力,為學術研究帶來了許多困難。楊浩老師指出,方老師的前期工作積累可作為原始資料説明電腦“學會”識別、切字等技能,進而輔助識別、切分所有敦煌文獻,因為對電腦而言,三萬件與三百萬件的區別不大。
北京大學外國語學院葉少勇老師介紹了梵佛辭典線上檢索平臺與Mdict格式離線辭典,以及PKU梵文輸入法3.0PC版。梵佛辭典與梵文輸入法以其簡易便捷的特點,在學界使用率頗高。並且,葉少勇老師希望在建設佛學研究資來源資料庫時,可以制定一個大家共同遵守的規範制度,方便大家分類上傳、備份資料,並且定期整理目錄、清理重複檔,以便研究者查詢與下載。中國人民大學哲學院王俊淇老師順便分享了清理重複檔的利器——Duplicate Cleaner。該軟體通過比對檔內容而非檔案名識別出重複檔,幫助大家更有條理地整理文獻資料。
王俊淇老師根據以往的研究經驗指出電腦在具體研究中的應用問題。例如,《楞伽經》梵文底本有三十多種,若人工對比不僅勞力費神,還會出現訛誤。雖然採用電腦則可以在一定程度上解決文本對照的問題,但寫本本身的字體差異懸殊、印刷年代久遠,又對電腦的智慧程度提出更高的要求。楊浩老師建議,在目前的技術條件下,建立資料庫或許是更好的選擇。在資料庫中實現資料檢索與文本對照,既可以簡化研究者的研究步驟,又不完全依賴電腦,在一定程度上整合了人力與電腦的優勢。葉少勇老師認為電腦的使用是有臨界值的,文本量需要超出這個臨界值,才能凸顯電腦的優勢,若文本量較少,人工可能更兼具效率與準確。楊浩老師則指出電腦的優勢在於減少人力帶來的無效、重複勞動,因為電腦絕對不會出現遺漏,而人眼識別則會出現遺漏,再以人力排查遺漏無異於大海撈針。
北京外國語大學亞非學院李燦老師結合自己正在進行的《陰持入經》研究,詢問如何利用電腦實現校勘巴厘文並匯出校勘記。楊浩老師指出目前的古籍整理平臺是以《儒藏》的方式匯出校勘記的,外文校勘功能還在開發當中,需要研究者提供更加具體的需求,比如梵語或巴厘語的變位元規則等。對校文本的軟體很多,而這個版本的古籍整理平臺特色在於可以對照異體字,這種特色的優勢在中文對照中更加凸顯。
中國社會科學院古代史研究所陳志遠老師介紹了造像記的資料。目前中國出版了七種大型錄文集,但錄文集並未對造像統一題名,因此在為某一造像記定名時會產生混亂。陳老師目前正在做勘同的工作,減少同石不同名的情況。並且把原石和拓本以及錄文進行整理,做成表格、設置參數,實現大資料分析。接下來的工作是對博物館等單位進行細緻的調查。希望未來能以交通線串聯起石刻材料,方便研究者研究。
北京大學哲學系孫海科博士介紹了東京大學數字人文研究現狀。東大基於佛教學提供人文學各領域可參考的數位知識基礎,探討人文學整體共同開創未來研究的方法論,形成“統合數字研究環境”。將人文學的文本、圖像、事物、行為等研究物件的差異與思想、語言、歷史、社會學等研究方法的差異這兩者共同納入視野,通過數位技術有效地保存和利用此兩者產生的知識多樣性,構建多層次概念模型,並在新大藏經資料庫(新SAT-DB)中裝載。
對於古籍多功能協同數位人文研究平臺的設計,楊浩老師提供了幾點想法:第一,應提供古籍的多層次閱讀。數位化古籍不僅要服務于研究者的學術研究,還有必要為普通讀者提供閱讀服務。第二,應重視知識網路的構建,建立相關內容之間的連結,比如引書內容之間的連接,專名與其別名之間的連接。第三,應提供協同工作環境與動態知識庫,構建協同工作環境,讓不同的用戶參與協作與溝通,並聚合研究成果。在知識庫的設計上,將研究者生產的新知識補充到知識庫中,形成一個動態的、可擴充的知識庫。第四,應集成輔助研究工具、分析工具,集成輔助研究工具,提升工作效率;提供分析工具,展開數位人文研究。
參加座談會的還有北京大學哲學系趙悠老師、南開大學哲學院趙文老師、中國社會科學院哲學所胡士潁老師,德國海德堡大學的陳瑞翾老師(線上),中心主任王頌教授主持了會議。在座學者積極參與討論,分享交流了電腦技術在具體應用中的問題和解決方法,並展望了數位技術與人文研究相結合的前景。座談會在熱烈的氛圍中圓滿結束。