原標題:探訪文溯閣《四庫全書》數字化影印出版工程(人民眼·讓文物活起來③)
圖①:讀者古籍數字科技中心工作人員對文溯閣《四庫全書》數字化文件進行質檢。
本報記者 王錦濤攝
圖②:甘肅省圖書館依托文溯閣《四庫全書》開發的文創產品。
圖③:甘肅省圖書館文溯閣《四庫全書》藏書館工作人員巡查書庫。
圖②③均為甘肅省圖書館提供
圖④:甘肅省圖書館文溯閣《四庫全書》藏書館主樓。
本報記者 王錦濤攝
引子
登臨蘭州北山九州臺,甘肅省圖書館文溯閣《四庫全書》藏書館躍入眼簾——館樓飛檐翹角,踞北山而瞰黃河。
自正門入樓,穿鞋套,做登記,進書庫。書庫恒溫恒濕,1128個香樟木書箱層層疊疊,收錄典籍6141函、3474種、36315冊的文溯閣《四庫全書》就安放于箱中。
2023年6月,習近平總書記在中國國家版本館中央總館考察調研時,詳細聽取《四庫全書》版本源流、紙張印刷、保護收藏等介紹,叮囑工作人員:“我最關心的就是中華文明歷經滄桑留下的最寶貴的東西。中華民族的一些典籍在歲月侵蝕中已經失去了不少,留下來的這些瑰寶一定要千方百計呵護好、珍惜好,把我們這個世界上唯一沒有中斷的文明繼續傳承下去。”
《四庫全書》編纂于清代乾隆年間,是我國歷史上規模最大的叢書,修成后謄抄7部,分藏于紫禁城文淵閣、圓明園文源閣、盛京(今沈陽)文溯閣、承德避暑山莊文津閣、杭州文瀾閣等地。目前存世三部半,分別為文淵閣本、文溯閣本、文津閣本,以及被稱為“半部”的文瀾閣殘本。其中,文溯閣本輾轉多地,于2006年入藏現在的藏書館,也是“三部半”中唯一尚未完整影印出版的一部。
為了讓書寫在古籍里的文字活起來,經過長期縝密的籌劃論證,2021年8月,甘肅省正式啟動文溯閣《四庫全書》數字化影印出版工程。
目前,文溯閣《四庫全書》數字采集工作已全部完成,數據處理工作完成70%。從現在起至2028年,文溯閣《四庫全書》將按經、史、子、集四部,分期分批推出全套影印版本。
數字采集
采集方案、流程規范和相關作業標準周密完善
約8億字的文溯閣《四庫全書》共有多少頁?數字化之前鮮有人知。
“換算為現代書籍頁碼,共488萬多頁。”文溯閣《四庫全書》數字化影印出版專職工作組組長宋學娟說。
作為讀者出版集團有限公司所屬的讀者古籍數字科技中心總經理,宋學娟過去兩年多時間帶領團隊把文溯閣《四庫全書》從紙上“搬進”了電腦——逐頁掃描、存入,數據資源總量逾700TB(太字節)。“如果用常見的容量32GB的U盤存儲,需要2.2萬多個才能裝下。”宋學娟說。
文溯閣《四庫全書》既是歷史典籍,又是珍貴文物。若藏于高閣,難以活化利用;若活化利用,又有損壞之虞。如何破解“藏”“用”兩難?2021年8月,甘肅省委宣傳部制定《文溯閣〈四庫全書〉數字化影印出版工作重啟方案》,力求在保護的同時“喚醒”古籍。
古籍真本由甘肅省圖書館提供,數據采集處理、影印出版等工作由讀者出版集團有限公司具體實施。數字化影印出版工程分為“數字采集—數據處理—影印出版及數據庫建設”3個階段。所需經費,部分由中央文化產業發展專項資金、甘肅省財政資助,部分由讀者出版集團有限公司自籌。
數字采集,免不了要接觸古籍真本,如何確保其安全無損?甘肅省圖書館和讀者出版集團有限公司制定了周密完善的采集方案、流程規范和相關作業標準,“54條數字化工作流程規定,涵蓋前期準備、文獻出庫、數據處理等全部流程。”宋學娟介紹。
為保古籍安全萬無一失,文溯閣《四庫全書》藏書館二樓會議室被改造成了數字采集室,做到原書“出庫不出館”。而從書庫到采集室,平常不到一分鐘的路程,藏書館90后館員魏喬波卻要走好幾分鐘:戴上白色手套,細查一遍即將出庫的古籍,再輕輕捧起,就像捧著一碗不能灑出的水,慢慢往樓上“移”,“就怕腳下不穩”。
“古籍出庫,要填報11類表格,層層審批。歸還時,所有細節都要對得上。”魏喬波說,以其中的《提書登記表》為例,提取古籍需詳細填報當日采集計劃、提取數量,然后與書庫管理員共同清點每一函、每一冊書,包括函盒、夾板、束帶、銅扣的存缺程度,每一冊古籍的題名、卷數、頁數,以及有無破損、污跡或霉斑等情況,“這些都要一一記錄在案。一送一回路上、數據采集期間,古籍若有半點閃失,都會被及時發現。”
數字采集作業班班長楊旭勇告訴記者,采集時必須使用古籍專用非接觸式掃描儀高清掃描,且光源必須是冷光源。對采集人員,甘肅省圖書館的古籍專家也開展了多輪培訓演練,“既要保證掃描精度與進度,還要避免傷害古籍,翻書的力道不能輕也不能重,要穩而有力。”楊旭勇說。
準備周密,工作前期進展順利,意料不到的問題還是出現了。“古籍開本大小相同,厚薄卻不一樣。”宋學娟翻開一本書,拿到一臺掃描儀前比劃道,“超3厘米厚的古籍,用這種平板掃描儀掃描,靠近訂口的部分內容很難被有效采集。”
為啥?不按壓,無法掃描;按壓,古籍易損,且采集到的內容會變形。怎么辦?“為保證采集質量,我們追加預算,在已采購10臺古籍專用平板掃描儀的基礎上,又購置了兩臺V型古籍掃描儀。”宋學娟說,使用這種掃描儀,只需將書翻開到90度,即可完成掃描采集,問題迎刃而解。
2021年12月23日,開機掃描;2022年5月23日,采集告竣。“整整5個月,經過人員倒班,實現每天工作16個小時、一天未休。古籍沒有絲毫受損,函盒沒有增加一道劃痕。”陽光透過窗口,灑在黃底黑字的《文溯閣〈四庫全書〉數字化工作手冊》上,宋學娟長舒一口氣。
數據處理
數字文件與古籍真本如同孿生,最大程度呈現古籍原貌
偌大的房間里,數十名工作人員神情專注、緊盯屏幕,只聽見鍵盤敲擊聲此起彼伏。在讀者古籍數字科技中心的數據處理室,采集來的文溯閣《四庫全書》數據,將被加工成標準的數字文件,供后續影印出版和數據庫建設之用。
“數據處理有4道流程,圖版處理、一校、二校和質檢存儲。”宋學娟介紹,其中圖版處理是關鍵,主要工作是拼接完整“葉”。
葉,古籍特有的量詞。不同于現代書籍,古代紙張多為單面印刷,一張紙即為一葉,書冊由一葉一葉對折后裝訂而成。一葉,相當于現代書籍的兩頁。所以,數字采集到的掃描件實則都是半葉,圖版處理就是讓它們合二為一。
“最初,我們先在電腦上制作一個標準葉模板,再利用智能軟件,從掃描件上提取文字,貼在模板上。”宋學娟告訴記者,但實際操作中發現,智能軟件可能會漏字、識錯字,且原本每一葉的版式不盡相同,模板統一后,有“失真”之嫌。
數字文件與古籍真本,如何保持孿生一般的相同面貌?“我們摒棄了標準模板,選擇了逐葉拼接,最大程度呈現古籍原貌。”宋學娟說。
圖版處理不易,校對任務也很繁重。文溯閣《四庫全書》數據校對人員張靜從事古籍校對工作已有10年,但從未校對過如此海量內容。利用數字技術能夠提速,但一些訛誤很難被發現。
不久前,張靜在校對時發現,一個“丸”字疑為“九”字。經仔細核校后確認,果然是因為古籍宣紙里的植物纖維發生霉變,掃描時多出了這一“點”。
起初,一天校對300葉是張靜的上限。“剛開始時平均用力,耗時較多。”她說,而今這個數字翻了近3倍,“慢慢地,哪里容易出錯、哪里容易變色,心里都有了數,效率提高不少。”
效率高了,膽子卻小了。“總擔心有錯誤沒能及時發現。”張靜回憶,有次下樓吃午餐,飯剛端上來,她又起身趕忙回到辦公室,“以為忘了標注一處訛誤,打開電腦一看,其實已經做了記錄。”
為明確權責,避免誤操作,從圖版處理到一校、二校,再到最后的質檢存儲,文溯閣《四庫全書》數據處理是條“單行道”。電腦之間不能互相訪問,數據傳給下一流程后,前一流程的人員將無權再改。
“在數據處理程序軟件和制度流程上,我們有一套完整設計,確保數據資源安全。”宋學娟輸入賬號、密碼,登錄數字化成果管理系統,所有成品文件呈現在眼前,函盒編碼、書名、作者、朝代,以及長、寬、高和冊數等基本信息,都有詳細記錄。“我們爭取今年內基本完成圖版處理工作。”她說。
影印出版
不少圖書館、藏書機構等正虛位以待,靜待“四閣四庫合璧”
文溯閣《四庫全書》影印出版,匯聚了社會各界的期待。
西北師范大學教授趙逵夫全程參與了文溯閣《四庫全書》影印出版工程專家論證會。他說,《四庫全書》現存不同版本在內容、冊數、卷數上皆有不同,通過數字化影印出版,方便學者比對研究,意義重大。
蘭州大學教授汪受寬也持相同觀點。他曾用兩年時間,帶著學生對甘肅省圖書館編印的《影印文溯閣四庫全書四種》進行整理、標點和精細校勘,并將收錄其中的《易圖說》《長安志圖》《墨法集要》《璇璣圖詩讀法》這4種(每種各1冊)書,跟文淵閣本進行對比,發現兩個版本的文字、圖片等存在901處差異。
“4冊書就有這么多差異,3.6萬多冊會是什么樣?”汪受寬說,“文溯閣《四庫全書》影印出版,將對文化史、史學史、文獻學研究等都產生重要影響。”
期望值高,現實問題也不少。一方面,古籍實現數字化后,盜印現象難以杜絕。另一方面,超大規模古籍的影印出版投入巨大,盈利是個難題。“變古籍為現代書籍,背后是大量的人力、物力、財力成本。”讀者出版集團有限公司所屬甘肅人民出版社社長、總編輯原彥平坦言。
防止數據泄露,采集區域設置嚴密安保措施。宋學娟介紹,任何人出入采集區,都須經過嚴格安檢,以防手機等電子設備進入工作區域。同時,每個工作臺均安裝了監控設備,每臺電腦都作了加密設置。
應對盈利難題,找準盈利點是關鍵。原彥平給記者詳細分析:古籍影印本主要有仿真本和縮印本。前者好比是“克隆體”,從紙張到字號,從排版到裝幀,與原書幾乎“一模一樣”;后者則是“迷你版”,內容不變,但字號變小、頁數變少,冊數大幅縮減。“文溯閣《四庫全書》若是出全套仿真影印本,成本過高,市場較小。”
原彥平說,文溯閣《四庫全書》多達3.6萬余冊,數據采集、處理、編輯、出版等投入大,且多為手工完成,成本高,發行對象則主要為圖書館、文化館、高校、研究院所等專業機構和為數不多的研究者。
2024年1月3日,文溯閣《四庫全書》經部影印出版專題工作會議召開,確定了出版方案——縮印、16開本、236冊。“我們將按經、史、子、集四部,分期分批推出縮印本。如果全套出齊,預計共1500冊。”原彥平說。
走進甘肅省圖書館的古籍閱覽室,其他三閣《四庫全書》的影印本旁,工作人員已為文溯閣《四庫全書》的影印本騰好了書架。
“古籍影印本看似小眾、銷路窄,實際上,版本好、印刷精美、定價合適的古籍,自有其發行空間。”從事出版行業20多年,宋學娟對文溯閣《四庫全書》影印本的市場前景頗有信心——版本獨一份,價值突出,公眾期待較高;自帶流量和話題,營銷成本較低,做到客戶明確、精準供給,就能減輕銷售壓力。
今年初,宋學娟帶領團隊參加2024北京圖書訂貨會。文溯閣《四庫全書》全套影印出版工作頗受關注,不僅有高校、圖書館、文博機構的負責人,還有銷售商和個人前來咨詢。“據市場調研,不少圖書館、藏書機構等正虛位以待,靜待‘四閣四庫合璧’。”宋學娟說。
“在做好保護工作基礎上,我們將深入挖掘文溯閣《四庫全書》價值,努力在信息服務、文化創意、文旅融合上求突破,讓這座資源寶庫在新時代活起來、用起來。”讀者出版集團有限公司黨委書記、董事長梁朝陽表示。
活化利用
首推精選本,開發文創產品,讓更多人領略古籍魅力
“宣傳推廣古籍的文創產品,既要開發周邊,更要聚焦古籍本身。”甘肅省圖書館館長肖學智說,不妨跳出杯子、本子、袋子等樣式,回歸古籍做文創,出版精選本圖書。
汪受寬介紹,《四庫全書》歷來有“典籍總匯,文化淵藪”之譽,不僅囊括了從先秦至清代乾隆中期之前中國歷史上的主要典籍,而且涵蓋了中國傳統學術文化的各個學科門類和各個專門領域。
“卷帙浩繁通常也意味著無從讀起,從這個意義上講,讓‘高冷’的古籍變暢銷的書籍,就是好文創。”肖學智說。
啟函盒、取夾板、解束帶,《文溯閣四庫全書影印精選》露出真容。翻開書頁,映入眼簾的楷書溫潤大方、賞心悅目。每頁8行、每行21字,雖是手抄,可字的大小、間距幾無差異,工整如打印一般。
“共計40卷,分為3函、5種、18冊。”肖學智介紹,為突出甘肅文化特色,這套影印精選本甄選了文溯閣《四庫全書》子部所收古代隴人著作兩種——《潛夫論》和《拾遺記》,另外還有《文房四譜》《法書要錄》《畫史會要》等書畫藝術史經典作品3種。
這樣一套精裝古籍,俘獲了不少讀者的心。“自去年5月出版發行,迄今已銷售680多套,平均每天銷售約2套,這在古籍中銷量不低。”甘肅省圖書館文創中心負責人介紹,甘肅省圖書館10多年前就曾出版《影印文溯閣四庫全書四種》,暢銷至今,共售出5600多套。
“優質的古籍,就是優質的文創。”肖學智說,近年來,甘肅省圖書館以文溯閣《四庫全書》為素材,從其包裝方式、撰寫格式、用色寓意、人文理念等角度汲取靈感,推出了一系列文創產品,“目前,我們正挖掘文溯閣《四庫全書》中的龍元素,即將推出特色伴手禮。”
“古籍活化,不能止于開發文創產品。”肖學智說,為了讓更多人樂于走近文溯閣《四庫全書》,領略古籍魅力,甘肅省圖書館打造了多個文創場景——線上,推出“文溯·隴跡”等專欄,在“云”上賦予古籍新話題;線下,建成甘肅省圖書館文溯閣《四庫全書》藏書館展廳,讓參觀者沉浸式體驗纂修、流傳、保護、發展等歷史場景,與“書”同行……
“我們舉辦的‘千古巨制——《四庫全書》展’是國內較早推出的《四庫全書》專題展覽,至今已在全省50多個圖書館流動展出。”肖學智介紹,今年3月,省圖書館還啟動了專題展覽進校園活動,未來還將推動展覽進社區。
年輕讀者馬瑛正是通過這個展覽認識了文溯閣《四庫全書》,并買了一套《影印文溯閣四庫全書四種》。“帶回去,讓更多人了解我們的典籍瑰寶。”馬瑛說。
今年,甘肅省出臺《關于以“八個一”文化品牌為抓手全力推動文化傳承發展的實施方案》,其中一個“一”即為“一部《四庫全書》,讓中國古典文化活起來”。實施方案提出,加強文溯閣《四庫全書》保護傳承、整理研究、數字轉化、版權開發、活化利用等,激發古籍保護利用活力。
“影印出版,是活化利用的第一步。”肖學智說,未來還將建設完整、好用的數據庫,研發音視頻等產品,讓文溯閣《四庫全書》的“數字分身”走進千家萬戶。
- 2024-05-30武星煜作品《甘肅天牛圖志》出版
- 2024-05-29《一首詩所能做的》新書分享會在京舉行
- 2024-05-28讓書法藝術融入時代與生活
- 2024-05-24回望北宋與蘇東坡