瀏覽“江蘇省珍貴古籍數字資源集成平臺”,如同漫步在歷史長卷中。《投筆集一卷》《憺園文集三十六卷》等文集有序排列在電子書架上,點開一看,古樸厚重的線裝書一頁一頁、圖文并茂地呈現在眼前。
近日,南京圖書館“清人文集數據庫”上線。作為“江蘇省珍貴古籍全文影像數據庫”項目第一期成果,該平臺目前共收錄清人文集400部,以全本彩色掃描的方式制作成13萬余幅高像素數字圖像,并帶有檢索功能,在全網發布。
“南京圖書館館藏的清刻本有7萬多冊,其中不少是清人文集。”南京圖書館歷史文獻部主任、江蘇省古籍保護中心副主任陳立說,本次南京圖書館發布的數據庫,便是結合館藏優勢,以圖像數據庫形式,集中公布了一批具有相同主題的珍貴文獻。值得一提的是,這其中有許多“罕見”文獻,甚至有些還是僅存“孤本”。陳立介紹,例如嘉慶時期刻本吳俊《榮性堂詩集》、潘奕雋《三松堂集》等,都是存世較少的清人文集。
這些古籍是怎樣從圖書館庫房被“搬”到網絡平臺的呢?
陳立介紹,古籍數字化過程分為兩步。首先,要將古籍進行掃描。古籍掃描使用專用非接觸式掃描儀,通過高像素照相機,盡量不按壓古籍頁面進行拍照;采用的光源是防紫外線的LED燈冷光源,圖片顏色不能失真,要用色卡比對。
掃描完成后,就要對這些原汁原味的圖像做數據化處理,做至少深入到第二層級的標引,方便使用者按子目檢閱相關內容。記者看到,每種文獻的序和跋都進行了單獨標引,通過檢索可以單獨搜索出來。“古籍的序和跋中不乏名家作品,具有較強的文學和研究價值,如《莫愁湖風雅集》中就有姚鼐作的序。”陳立介紹。
平臺的開發建設也至關重要。一方面,要完整、全面地給古籍“搬家”,還要方便、快捷地幫助使用者找到相應內容;另一方面,還要給后續發布的方志、家譜等多種類型的古籍文獻“搬家”預留接口。
古籍數字化的最大挑戰,一是專業知識,二是技術。“從事這項工作,需要懂歷史學、文獻學、目錄學等的復合型人才,還要有甘坐冷板凳的精神。”陳立坦言,南京圖書館對古籍文獻進行掃描的工作從15年前就開始了,數字標引小組也在4年前啟動。正因為有這些基礎準備,“清人文集數據庫”才能在近期與讀者見面。
不過,古籍數字化到這一步還沒有結束。陳立介紹,古籍數字化的2.0版,將為古籍愛好者梳理浩如煙海的文字背后的知識邏輯順序,制作專題知識圖譜型數據庫,甚至可將部分書中內容制作成“數字文創”,讓曾經束之高閣的古籍更好走進千家萬戶。
- 2023-01-28文學跨界,“格局打開了” 多元傳播中的文學更有力
- 2023-01-28梁曉聲:視文學為動態河流,更在乎影響世道人心
- 2023-01-28社長總編來薦書|江西出版集團副總經理周建森推薦:《蘇軾傳》
- 2023-01-28社長總編來薦書|華文出版社社長包巖推薦:《遼寧傳》