业界动态
142期澳门四不像-探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③),古籍,扫描,工作
2024-06-03 00:18:01
142期澳门四不像-探访文溯阁《四库全书》数字化影印出版工程(人民眼·让文物活起来③),古籍,扫描,工作

引子

登临兰(lan)州(zhou)北山(shan)九州(zhou)台,甘肃省(sheng)图书馆文溯阁《四库(ku)全书》藏书馆跃入(ru)眼帘——馆楼飞檐翘角,踞北山(shan)而瞰黄河。

自(zi)正门入(ru)楼,穿鞋套,做登记,进书库(ku)。书库(ku)恒温恒湿(shi),1128个香樟木书箱层层叠叠,收录典籍6141函、3474种、36315册的文溯阁《四库(ku)全书》就安放于(yu)箱中。

2023年6月,习近平总书记在中国国家版本馆中央总馆考察调研时(shi),详细(xi)听(ting)取(qu)《四库(ku)全书》版本源流、纸张(zhang)印刷、保护收藏等(deng)介绍,叮嘱工作人员:“我最关心的就是(shi)中华文明历经沧桑留下的最宝贵的东西。中华民族(zu)的一些典籍在岁月侵蚀中已(yi)经失去了不(bu)少,留下来的这些瑰宝一定(ding)要千方百计呵护好、珍惜(xi)好,把(ba)我们这个世界上唯一没有中断的文明继(ji)续传承下去。”

《四库(ku)全书》编纂于(yu)清代乾隆年间,是(shi)我国历史上规模最大的丛(cong)书,修成后誊抄7部,分藏于(yu)紫禁城(cheng)文渊阁、圆明园文源阁、盛(sheng)京(今沈阳)文溯阁、承德避暑山(shan)庄(zhuang)文津阁、杭州(zhou)文澜阁等(deng)地(di)。目前(qian)存世三(san)部半,分别为(wei)文渊阁本、文溯阁本、文津阁本,以及被称为(wei)“半部”的文澜阁残本。其中,文溯阁本辗转多(duo)地(di),于(yu)2006年入(ru)藏现(xian)在的藏书馆,也是(shi)“三(san)部半”中唯一尚未完整影印出(chu)版的一部。

为(wei)了让书写在古(gu)籍里(li)的文字活起(qi)来,经过长期缜密的筹划论(lun)证,2021年8月,甘肃省(sheng)正式启(qi)动文溯阁《四库(ku)全书》数字化影印出(chu)版工程。

目前(qian),文溯阁《四库(ku)全书》数字采集工作已(yi)全部完成,数据处(chu)理工作完成70%。从现(xian)在起(qi)至2028年,文溯阁《四库(ku)全书》将按(an)经、史、子、集四部,分期分批推出(chu)全套影印版本。

数字采集

采集方案、流程规范和相关作业标准周密完善

约8亿字的文溯阁《四库(ku)全书》共有多(duo)少页?数字化之(zhi)前(qian)鲜有人知。

“换(huan)算为(wei)现(xian)代书籍页码,共488万多(duo)页。”文溯阁《四库(ku)全书》数字化影印出(chu)版专职工作组组长宋学娟说。

作为(wei)读者出(chu)版集团有限公司所属的读者古(gu)籍数字科技中心总经理,宋学娟过去两(liang)年多(duo)时(shi)间带(dai)领团队把(ba)文溯阁《四库(ku)全书》从纸上“搬进”了电脑——逐页扫描、存入(ru),数据资(zi)源总量逾700TB(太字节)。“如果用常见的容量32GB的U盘存储,需要2.2万多(duo)个才能装下。”宋学娟说。

文溯阁《四库(ku)全书》既是(shi)历史典籍,又是(shi)珍贵文物。若藏于(yu)高阁,难以活化利用;若活化利用,又有损坏之(zhi)虞。如何破(po)解“藏”“用”两(liang)难?2021年8月,甘肃省(sheng)委宣(xuan)传部制定(ding)《文溯阁〈四库(ku)全书〉数字化影印出(chu)版工作重启(qi)方案》,力求在保护的同时(shi)“唤醒”古(gu)籍。

古(gu)籍真(zhen)本由甘肃省(sheng)图书馆提供,数据采集处(chu)理、影印出(chu)版等(deng)工作由读者出(chu)版集团有限公司具体实施。数字化影印出(chu)版工程分为(wei)“数字采集—数据处(chu)理—影印出(chu)版及数据库(ku)建设”3个阶段。所需经费,部分由中央文化产业发展专项资(zi)金、甘肃省(sheng)财政(zheng)资(zi)助(zhu),部分由读者出(chu)版集团有限公司自(zi)筹。

数字采集,免不(bu)了要接触古(gu)籍真(zhen)本,如何确保其安全无(wu)损?甘肃省(sheng)图书馆和读者出(chu)版集团有限公司制定(ding)了周密完善的采集方案、流程规范和相关作业标准,“54条数字化工作流程规定(ding),涵盖前(qian)期准备(bei)、文献出(chu)库(ku)、数据处(chu)理等(deng)全部流程。”宋学娟介绍。

为(wei)保古(gu)籍安全万无(wu)一失,文溯阁《四库(ku)全书》藏书馆二楼会议室被改造成了数字采集室,做到原书“出(chu)库(ku)不(bu)出(chu)馆”。而从书库(ku)到采集室,平常不(bu)到一分钟的路程,藏书馆90后馆员魏乔波却要走好几分钟:戴上白色手套,细(xi)查一遍即将出(chu)库(ku)的古(gu)籍,再轻轻捧起(qi),就像捧着一碗不(bu)能洒出(chu)的水,慢慢往楼上“移”,“就怕(pa)脚(jiao)下不(bu)稳”。

“古(gu)籍出(chu)库(ku),要填(tian)报11类表格,层层审批。归还时(shi),所有细(xi)节都要对得上。”魏乔波说,以其中的《提书登记表》为(wei)例(li),提取(qu)古(gu)籍需详细(xi)填(tian)报当日采集计划、提取(qu)数量,然(ran)后与书库(ku)管理员共同清点每一函、每一册书,包括函盒、夹板、束带(dai)、铜扣的存缺程度,每一册古(gu)籍的题(ti)名(ming)、卷(juan)数、页数,以及有无(wu)破(po)损、污迹或霉斑等(deng)情况,“这些都要一一记录在案。一送(song)一回路上、数据采集期间,古(gu)籍若有半点闪(shan)失,都会被及时(shi)发现(xian)。”

数字采集作业班班长杨旭勇告诉(su)记者,采集时(shi)必须使用古(gu)籍专用非接触式扫描仪高清扫描,且光源必须是(shi)冷光源。对采集人员,甘肃省(sheng)图书馆的古(gu)籍专家也开展了多(duo)轮培训演练,“既要保证扫描精度与进度,还要避免伤害古(gu)籍,翻书的力道不(bu)能轻也不(bu)能重,要稳而有力。”杨旭勇说。

准备(bei)周密,工作前(qian)期进展顺利,意料不(bu)到的问题(ti)还是(shi)出(chu)现(xian)了。“古(gu)籍开本大小相同,厚薄却不(bu)一样。”宋学娟翻开一本书,拿到一台扫描仪前(qian)比划道,“超3厘米厚的古(gu)籍,用这种平板扫描仪扫描,靠近订口的部分内容很(hen)难被有效采集。”

为(wei)啥?不(bu)按(an)压,无(wu)法(fa)扫描;按(an)压,古(gu)籍易损,且采集到的内容会变形。怎么办?“为(wei)保证采集质量,我们追加预算,在已(yi)采购10台古(gu)籍专用平板扫描仪的基础上,又购置了两(liang)台V型古(gu)籍扫描仪。”宋学娟说,使用这种扫描仪,只需将书翻开到90度,即可完成扫描采集,问题(ti)迎刃(ren)而解。

2021年12月23日,开机扫描;2022年5月23日,采集告竣。“整整5个月,经过人员倒班,实现(xian)每天工作16个小时(shi)、一天未休。古(gu)籍没有丝毫受损,函盒没有增加一道划痕。”阳光透过窗口,洒在黄底黑字的《文溯阁〈四库(ku)全书〉数字化工作手册》上,宋学娟长舒一口气。

数据处(chu)理

数字文件与古(gu)籍真(zhen)本如同孪(luan)生,最大程度呈现(xian)古(gu)籍原貌

偌大的房间里(li),数十名(ming)工作人员神情专注、紧盯屏幕,只听(ting)见键盘敲击声此起(qi)彼伏。在读者古(gu)籍数字科技中心的数据处(chu)理室,采集来的文溯阁《四库(ku)全书》数据,将被加工成标准的数字文件,供后续影印出(chu)版和数据库(ku)建设之(zhi)用。

“数据处(chu)理有4道流程,图版处(chu)理、一校、二校和质检存储。”宋学娟介绍,其中图版处(chu)理是(shi)关键,主要工作是(shi)拼接完整“叶(ye)”。

叶(ye),古(gu)籍特有的量词。不(bu)同于(yu)现(xian)代书籍,古(gu)代纸张(zhang)多(duo)为(wei)单面印刷,一张(zhang)纸即为(wei)一叶(ye),书册由一叶(ye)一叶(ye)对折后装订而成。一叶(ye),相当于(yu)现(xian)代书籍的两(liang)页。所以,数字采集到的扫描件实则都是(shi)半叶(ye),图版处(chu)理就是(shi)让它(ta)们合二为(wei)一。

“最初,我们先在电脑上制作一个标准叶(ye)模板,再利用智能软件,从扫描件上提取(qu)文字,贴在模板上。”宋学娟告诉(su)记者,但实际操作中发现(xian),智能软件可能会漏字、识错字,且原本每一叶(ye)的版式不(bu)尽相同,模板统一后,有“失真(zhen)”之(zhi)嫌。

数字文件与古(gu)籍真(zhen)本,如何保持孪(luan)生一般的相同面貌?“我们摒弃了标准模板,选择了逐叶(ye)拼接,最大程度呈现(xian)古(gu)籍原貌。”宋学娟说。

图版处(chu)理不(bu)易,校对任务也很(hen)繁重。文溯阁《四库(ku)全书》数据校对人员张(zhang)静从事古(gu)籍校对工作已(yi)有10年,但从未校对过如此海量内容。利用数字技术能够提速,但一些讹误很(hen)难被发现(xian)。

不(bu)久前(qian),张(zhang)静在校对时(shi)发现(xian),一个“丸”字疑为(wei)“九”字。经仔细(xi)核校后确认,果然(ran)是(shi)因为(wei)古(gu)籍宣(xuan)纸里(li)的植物纤维发生霉变,扫描时(shi)多(duo)出(chu)了这一“点”。

起(qi)初,一天校对300叶(ye)是(shi)张(zhang)静的上限。“刚开始时(shi)平均用力,耗时(shi)较多(duo)。”她说,而今这个数字翻了近3倍,“慢慢地(di),哪里(li)容易出(chu)错、哪里(li)容易变色,心里(li)都有了数,效率提高不(bu)少。”

效率高了,胆子却小了。“总担心有错误没能及时(shi)发现(xian)。”张(zhang)静回忆,有次下楼吃午餐,饭刚端上来,她又起(qi)身赶忙回到办公室,“以为(wei)忘了标注一处(chu)讹误,打开电脑一看,其实已(yi)经做了记录。”

为(wei)明确权责,避免误操作,从图版处(chu)理到一校、二校,再到最后的质检存储,文溯阁《四库(ku)全书》数据处(chu)理是(shi)条“单行道”。电脑之(zhi)间不(bu)能互相访问,数据传给下一流程后,前(qian)一流程的人员将无(wu)权再改。

“在数据处(chu)理程序软件和制度流程上,我们有一套完整设计,确保数据资(zi)源安全。”宋学娟输入(ru)账号、密码,登录数字化成果管理系统,所有成品文件呈现(xian)在眼前(qian),函盒编码、书名(ming)、作者、朝代,以及长、宽(kuan)、高和册数等(deng)基本信(xin)息,都有详细(xi)记录。“我们争取(qu)今年内基本完成图版处(chu)理工作。”她说。

影印出(chu)版

不(bu)少图书馆、藏书机构等(deng)正虚位以待,静待“四阁四库(ku)合璧”

文溯阁《四库(ku)全书》影印出(chu)版,汇聚了社会各(ge)界的期待。

西北师范大学教授赵(zhao)逵夫全程参与了文溯阁《四库(ku)全书》影印出(chu)版工程专家论(lun)证会。他说,《四库(ku)全书》现(xian)存不(bu)同版本在内容、册数、卷(juan)数上皆有不(bu)同,通过数字化影印出(chu)版,方便学者比对研究,意义重大。

兰(lan)州(zhou)大学教授汪受宽(kuan)也持相同观点。他曾用两(liang)年时(shi)间,带(dai)着学生对甘肃省(sheng)图书馆编印的《影印文溯阁四库(ku)全书四种》进行整理、标点和精细(xi)校勘,并将收录其中的《易图说》《长安志图》《墨法(fa)集要》《璇(xuan)玑(ji)图诗读法(fa)》这4种(每种各(ge)1册)书,跟文渊阁本进行对比,发现(xian)两(liang)个版本的文字、图片等(deng)存在901处(chu)差异。

“4册书就有这么多(duo)差异,3.6万多(duo)册会是(shi)什么样?”汪受宽(kuan)说,“文溯阁《四库(ku)全书》影印出(chu)版,将对文化史、史学史、文献学研究等(deng)都产生重要影响(xiang)。”

期望值(zhi)高,现(xian)实问题(ti)也不(bu)少。一方面,古(gu)籍实现(xian)数字化后,盗印现(xian)象难以杜绝。另一方面,超大规模古(gu)籍的影印出(chu)版投入(ru)巨(ju)大,盈利是(shi)个难题(ti)。“变古(gu)籍为(wei)现(xian)代书籍,背后是(shi)大量的人力、物力、财力成本。”读者出(chu)版集团有限公司所属甘肃人民出(chu)版社社长、总编辑原彦(yan)平坦言。

防(fang)止数据泄露,采集区域设置严密安保措施。宋学娟介绍,任何人出(chu)入(ru)采集区,都须经过严格安检,以防(fang)手机等(deng)电子设备(bei)进入(ru)工作区域。同时(shi),每个工作台均安装了监控设备(bei),每台电脑都作了加密设置。

应对盈利难题(ti),找准盈利点是(shi)关键。原彦(yan)平给记者详细(xi)分析:古(gu)籍影印本主要有仿真(zhen)本和缩印本。前(qian)者好比是(shi)“克(ke)隆体”,从纸张(zhang)到字号,从排版到装帧,与原书几乎“一模一样”;后者则是(shi)“迷你版”,内容不(bu)变,但字号变小、页数变少,册数大幅缩减。“文溯阁《四库(ku)全书》若是(shi)出(chu)全套仿真(zhen)影印本,成本过高,市场较小。”

原彦(yan)平说,文溯阁《四库(ku)全书》多(duo)达3.6万余册,数据采集、处(chu)理、编辑、出(chu)版等(deng)投入(ru)大,且多(duo)为(wei)手工完成,成本高,发行对象则主要为(wei)图书馆、文化馆、高校、研究院所等(deng)专业机构和为(wei)数不(bu)多(duo)的研究者。

2024年1月3日,文溯阁《四库(ku)全书》经部影印出(chu)版专题(ti)工作会议召开,确定(ding)了出(chu)版方案——缩印、16开本、236册。“我们将按(an)经、史、子、集四部,分期分批推出(chu)缩印本。如果全套出(chu)齐,预计共1500册。”原彦(yan)平说。

走进甘肃省(sheng)图书馆的古(gu)籍阅览室,其他三(san)阁《四库(ku)全书》的影印本旁,工作人员已(yi)为(wei)文溯阁《四库(ku)全书》的影印本腾好了书架。

“古(gu)籍影印本看似小众、销路窄,实际上,版本好、印刷精美、定(ding)价合适的古(gu)籍,自(zi)有其发行空间。”从事出(chu)版行业20多(duo)年,宋学娟对文溯阁《四库(ku)全书》影印本的市场前(qian)景颇有信(xin)心——版本独一份,价值(zhi)突出(chu),公众期待较高;自(zi)带(dai)流量和话题(ti),营销成本较低,做到客户明确、精准供给,就能减轻销售压力。

今年初,宋学娟带(dai)领团队参加2024北京图书订货会。文溯阁《四库(ku)全书》全套影印出(chu)版工作颇受关注,不(bu)仅有高校、图书馆、文博机构的负责人,还有销售商和个人前(qian)来咨询。“据市场调研,不(bu)少图书馆、藏书机构等(deng)正虚位以待,静待‘四阁四库(ku)合璧’。”宋学娟说。

“在做好保护工作基础上,我们将深入(ru)挖掘文溯阁《四库(ku)全书》价值(zhi),努力在信(xin)息服(fu)务、文化创意、文旅融合上求突破(po),让这座资(zi)源宝库(ku)在新时(shi)代活起(qi)来、用起(qi)来。”读者出(chu)版集团有限公司党委书记、董事长梁朝阳表示。

活化利用

首推精选本,开发文创产品,让更多(duo)人领略古(gu)籍魅力

“宣(xuan)传推广古(gu)籍的文创产品,既要开发周边,更要聚焦古(gu)籍本身。”甘肃省(sheng)图书馆馆长肖学智说,不(bu)妨跳出(chu)杯(bei)子、本子、袋子等(deng)样式,回归古(gu)籍做文创,出(chu)版精选本图书。

汪受宽(kuan)介绍,《四库(ku)全书》历来有“典籍总汇,文化渊薮”之(zhi)誉,不(bu)仅囊括了从先秦至清代乾隆中期之(zhi)前(qian)中国历史上的主要典籍,而且涵盖了中国传统学术文化的各(ge)个学科门类和各(ge)个专门领域。

“卷(juan)帙浩繁通常也意味着无(wu)从读起(qi),从这个意义上讲(jiang),让‘高冷’的古(gu)籍变畅销的书籍,就是(shi)好文创。”肖学智说。

启(qi)函盒、取(qu)夹板、解束带(dai),《文溯阁四库(ku)全书影印精选》露出(chu)真(zhen)容。翻开书页,映入(ru)眼帘的楷书温润大方、赏心悦目。每页8行、每行21字,虽是(shi)手抄,可字的大小、间距(ju)几无(wu)差异,工整如打印一般。

“共计40卷(juan),分为(wei)3函、5种、18册。”肖学智介绍,为(wei)突出(chu)甘肃文化特色,这套影印精选本甄选了文溯阁《四库(ku)全书》子部所收古(gu)代陇人著作两(liang)种——《潜夫论(lun)》和《拾(shi)遗记》,另外还有《文房四谱》《法(fa)书要录》《画(hua)史会要》等(deng)书画(hua)艺术史经典作品3种。

这样一套精装古(gu)籍,俘获了不(bu)少读者的心。“自(zi)去年5月出(chu)版发行,迄(qi)今已(yi)销售680多(duo)套,平均每天销售约2套,这在古(gu)籍中销量不(bu)低。”甘肃省(sheng)图书馆文创中心负责人介绍,甘肃省(sheng)图书馆10多(duo)年前(qian)就曾出(chu)版《影印文溯阁四库(ku)全书四种》,畅销至今,共售出(chu)5600多(duo)套。

“优质的古(gu)籍,就是(shi)优质的文创。”肖学智说,近年来,甘肃省(sheng)图书馆以文溯阁《四库(ku)全书》为(wei)素材,从其包装方式、撰写格式、用色寓意、人文理念等(deng)角度汲取(qu)灵感,推出(chu)了一系列文创产品,“目前(qian),我们正挖掘文溯阁《四库(ku)全书》中的龙元素,即将推出(chu)特色伴手礼。”

“古(gu)籍活化,不(bu)能止于(yu)开发文创产品。”肖学智说,为(wei)了让更多(duo)人乐于(yu)走近文溯阁《四库(ku)全书》,领略古(gu)籍魅力,甘肃省(sheng)图书馆打造了多(duo)个文创场景——线上,推出(chu)“文溯·陇迹”等(deng)专栏,在“云”上赋予古(gu)籍新话题(ti);线下,建成甘肃省(sheng)图书馆文溯阁《四库(ku)全书》藏书馆展厅,让参观者沉浸式体验(yan)纂修、流传、保护、发展等(deng)历史场景,与“书”同行……

“我们举办的‘千古(gu)巨(ju)制——《四库(ku)全书》展’是(shi)国内较早推出(chu)的《四库(ku)全书》专题(ti)展览,至今已(yi)在全省(sheng)50多(duo)个图书馆流动展出(chu)。”肖学智介绍,今年3月,省(sheng)图书馆还启(qi)动了专题(ti)展览进校园活动,未来还将推动展览进社区。

年轻读者马瑛正是(shi)通过这个展览认识了文溯阁《四库(ku)全书》,并买了一套《影印文溯阁四库(ku)全书四种》。“带(dai)回去,让更多(duo)人了解我们的典籍瑰宝。”马瑛说。

今年,甘肃省(sheng)出(chu)台《关于(yu)以“八个一”文化品牌为(wei)抓手全力推动文化传承发展的实施方案》,其中一个“一”即为(wei)“一部《四库(ku)全书》,让中国古(gu)典文化活起(qi)来”。实施方案提出(chu),加强文溯阁《四库(ku)全书》保护传承、整理研究、数字转化、版权开发、活化利用等(deng),激(ji)发古(gu)籍保护利用活力。

“影印出(chu)版,是(shi)活化利用的第一步。”肖学智说,未来还将建设完整、好用的数据库(ku),研发音(yin)视频等(deng)产品,让文溯阁《四库(ku)全书》的“数字分身”走进千家万户。

sitemapsitemap1sitemap2sitemap3sitemap4sitemap5sitemap6sitemap7