首页 理论教育 深度解析中国地方志书目数据库的建设

深度解析中国地方志书目数据库的建设

时间:2023-07-05 理论教育 版权反馈
【摘要】:经过30多年的建设,全国各级藏书单位目前基本建立了各自馆藏书目数据库,同时共同建设了联合目录数据库,实现了资源共建共享。在众多古籍书目数据库中,亦有部分方志专题书目数据库,但数据库收录范围、数据量较小。本文将以第二种方法即地方志书目为基础,以书目数据库为辅,探讨建立开放性的“中国地方志书目数据库”的建设基础及其意义。将此目录进行全文数字化之后,“中国地方志书目数据库”基本框架就建立了起来。

深度解析中国地方志书目数据库的建设

胡艳杰(1)

20世纪80年代,作为古籍数字化工作的开端,古籍书目数据库建设与开发逐渐受到各个藏书单位重视。经过30多年的建设,全国各级藏书单位目前基本建立了各自馆藏书目数据库,同时共同建设了联合目录数据库,实现了资源共建共享。

在众多古籍书目数据库中,亦有部分方志专题书目数据库,但数据库收录范围、数据量较小。据王立清《中文古籍数字化研究》统计,50余个藏书单位的书目数据库中,6家有方志书目数据库,其具体情况如下:

6家方志书目数据库情况一览(2)

建立“中国地方志书目数据库”这一专题型书目数据库有两种方法:一是各藏书单位利用已有书目数据库整理出地方志数据,共同开发联合目录,多个单位参与。这种方式需要专门成立机构、专人管理、专人负责、制定工作方案、多方面的组织协调,涉及藏书单位范围广、人员多,已经完成的《中国古籍善本书目》以及目前正在进行的古籍保护计划之古籍普查平台、《古籍普查登记目录》的编撰以及《中华古籍总目》的编撰,都是采取这种方式;二是利用前人研究成果,实现由纸质书目到数据库的转变,同时补充最新整理的书目数据成果,某一机构或个人可以独立完成。本文将以第二种方法即地方志书目为基础,以书目数据库为辅,探讨建立开放性的“中国地方志书目数据库”的建设基础及其意义。

1956年6月召开的全国一届三次人大会议上,与会代表纷纷倡导重新编修方志。同年,国务院科学规划委员会在《十二年哲学社会科学规划方案》中提出编写地方志任务,并列为20个重点项目之一。由此开始了第一次大规模旧志资料辑录类编工作。从20世纪70年代整理影印旧方志成为古籍再版热点,到八九十年代的修志热潮,再到今天古籍数字化发展之必然趋势,“地方志”这一特殊文献始终都是各大收藏单位与整理者研究开发的重点,并取得了显著的成果,这些成果奠定了建立书目数据库的坚实基础。

该目录1985年由中华书局出版,收录方志8 200余种,按版本计算有13 000余条,包括全国30个省、市、自治区190个藏书单位所收藏的方志。著录信息包括朝代、书名、卷数、纂修人、版本、藏书单位、备注,著录项基本完整。同一部方志按刻书年代先后列其版本。将此目录进行全文数字化之后,“中国地方志书目数据库”基本框架就建立了起来。该出版后,研究及整理方志的专家学者又有新发现,撰写了相关的订正、辨析文章,进一步完善、丰富了方志种类和数量,可补其不足。

在此基础上,需要对其著录信息进行完善:

(1)纂修著录者。方志中“纂修姓氏”单列,具有大量信息,且参与人数较多、分工不同,需要规范取舍。如F2915《畿辅通志》卷末“修志姓氏”,分工有总裁、提调、监临、协理、董理、总修、分纂、采辑、订正、校阅十类;总修一人,分纂九人,在著录纂修者时纂者取第一人,这样不致产生歧义;纂修者的信息如朝代、籍贯、爵里、字号、姓名等根据原书“纂修姓氏”著录内容加以整理,作为中国地方志书目数据库的一个资料库。

(2)版本。即原版及其影印本、收录数据库情况。

(3)藏书单位。按简称音序排列,以便增加新的藏书单位。

数据库为两个层级目录数据库,一是书目数据库(种)、二是类目数据库(部),即一书之目录,每部书卷目信息:卷次、门类。目录编排次序方法有两种:一是按现代行政区域划分,即采用《目录》的顺序;二是依《(嘉庆)大清一统志》的顺序。

这些成果补充了《目录》190家藏书单位之外的书目数据。2007年国家古籍保护中心在全国范围内开展古籍保护计划,古籍普查登记工作得以实施。2014年1月,《天津图书馆古籍普查登记目录》正式出版,标志着古籍普查工作进入成果展示阶段,目前已经出版22家藏书单位及地区的普查登记目录(见附录1)。这次普查工作揭示了《目录》中未著录的一些藏书单位方志的存藏情况,例如天津社会科学院图书馆、天津市河东区图书馆、河北大学图书馆等单位所藏方志,进一步展现了方志藏书的真实面貌。借助此次普查结果,在建设方志书目数据工作中:一是进一步完成藏书单位信息;二是增加品种,如天津图书馆藏、(清)沈继贤修“[雍正]岚县志十六卷”,(清)翁澍纂“[康熙]具区志十六卷”;三是在《目录》基础上增加方志数量,揭示方志传世总量;四是增加具体馆藏信息,如索书号,方便各地读者查阅和使用;五是弥补《目录》因未见原书而据卡片著录的不足。

共8 472篇提要。所收方志为编撰者目验之书,可补《目录》近300种。此外,《方志考稿》《稀见方志提要》《河北省地方志提要》《江苏旧方志提要》等地区提要可为方志书目数据库提供更多具体信息,如卷目、序跋内容等。

20世纪末以来,方志点校、影印出版成果显著。其中,以丛书的形式影印出版是方志整理工作的主要方式。按时间段划分,具体出版情况如下:

(1)《天一阁藏明代方志选刊》。111种,上海书店,1962年至1982年。(《目录》已将其列为一个版本)

(2)《中国方志丛书》。1 711种,台湾成文书局20世纪70年代以来出版。

(3)《日本藏中国罕见地方志丛刊》。37种,书目文献出版社1990年出版。

(4)《中国地方志集成》。1 546种,江苏古籍出版社、上海书店出版社、巴蜀书社从1991年起,以省为单位分辑,选择资料性强、内容最丰富的志书逐年推出,至今已经连续出版25个省的《府县志辑》和一个《乡镇志专辑》。其中,巴蜀书社推出贵州(重印过)、重庆、西藏、四川等地志书;上海书店出版社推出安徽、江西、上海、浙江、广东、天津、台湾、海南、福建、河北、河南、北京、江西等地志书;江苏古籍出版社(今为“凤凰出版社有限公司”)出版最多,涉及范围最广:有府县志21种,包括广西、河南、云南、江苏、山西、甘肃、宁夏、青海、山东、陕西、安徽、吉林、黑龙江、辽宁、湖北、新疆、内蒙古、湖南、江西等;省志22种,包括辽宁、吉林、黑龙江、江西、云南、山东、广东、浙江、湖北、贵州、河北、广西、福建、陕西、安徽、山西、河南、四川、甘肃、新疆、青海、西藏。(3)

(5)《稀见中国地方志汇刊》。中科院编,中国书店出版社1992年出版。

(6)《天一阁藏明代方志选刊续编》。109种,上海书店出版社1990年出版,未见于《目录》者有1种,即“[嘉靖]惠大纪”(明)佚名纂修,嘉靖刻本。

(7)《中国西北稀见方志续集》。36种,中华全国图书馆文献缩微复制中心1997年出版,未见于《目录》1种,阳述古编二卷,(清)李嘉绩纂辑,清光绪十五(1889)年刊本。

其中以《中国方志丛书》与《中国地方志集成》两部的规模和影响最大,《中国方志丛书》时至今日仍为新中国成立以来方志整理出版规模最大的一次。这两部方志丛刊,亦是数字化公司对古籍数字化深加工的主要底本来源。

(1)《明代孤本方志选》。23种,国家图书馆出版社2000年出版。

(2)《清代孤本方志选(第一、二辑)》。76种,线装书局2001年出版。第二辑中有1种《中国地方志联合目录》中未见著录,即“[康熙]彬州总志十二卷”(清)陈邦器修、廷谋续纂,康熙二十四年刻五十八年增刻本。

(3)《明代孤本方志专辑》。8种,线装书局2003年出版。

(4)《孤本旧方志选编》。37种,线装书局2004年出版,收录明万历到民国的府志、县志、志稿、志料,其中以清乾隆以前的志书为主,占全书三分之二。

(5)《北京师范大学图书馆藏稀见方志丛刊续编》。32种,学苑出版社2009年出版。(www.xing528.com)

(6)《天春园藏善本方志选编》。100种,学苑出版社2009年出版。其中有2种未见于《目录》,一是“[雍正]岚县志十六卷”(清)沈继贤修,清雍正八年刻本;二是“[康熙]具区志十六卷”(清)翁澍纂,清康熙二十八年刻本。

(7)《故宫博物院藏稀见方志丛刊》。120种,故宫出版社2013年出版,其中有2种未见于《中国地方志联合目录》,即“[光绪]涿鹿县乡土志”(清)不着纂修人,抄本;及“[乾隆]华竹新编十四卷”(清)檀萃纂修,清乾隆四十六年刻本。

(8)《日本藏中国罕见地方志丛刊续编》。16种,北京图书馆出版社2003年出版。

(9)《著名图书馆藏稀见方志丛刊》系列。2005—2016年国家图书馆出版社出版,先后整理出版了23家藏书单位,1 381种方志(见附录2)。其中未见著录于《目录》者有34种,分析未见著录志书情况有三:一是不在该目录收录范围,如北京大学图书馆《齐山志七卷首一卷》;二是该目录藏书单位未见,如河北大学图书馆藏方志;三是为增加品种,如《中国人民大学图书馆藏稀见方志丛刊》,[民国]津门精华实录,□□昂纂修(4),中华舆图学社编辑,民国七年(1918)中华舆图学社铅印本;《哈佛燕京图书馆藏稀见方志丛刊》,[顺治]睢州志七卷首一卷,(清)戴斌等纂修,清顺治十五年(1658)刻本;[康熙]云龙州志十二卷首一卷,(清)王符等纂修,清康熙五十五年(1716)刻本。对比影印本方志目录与《目录》,仍有大量图书馆稀见方志没有影印,如安徽省图书馆所藏,即使是北京大学图书馆馆稀见方志丛刊出版后,仍有50余种孤本方志未经影印。除稀见方志丛刊系列,国家图书馆出版社还有《四川历代方志集成》(第一辑72种、第二辑82种)等。

(10)《国家图书馆藏地方志珍本丛刊》。727种,影宋(北京)文化发展有限公司2016年出版。

大量的影印本方志丛刊在建立“中国地方志书目数据库”中的作用:一是增补地方志品种;二是增加新的版本信息,在版本项著录时增加影印本信息将有利于读者使用,为查阅资料提供方便;三是便于核对著录项信息,如书名、纂修人、版本等,提高数据库质量;四是便于获取卷端书影、凡例、书前目录、纂修人姓氏等信息。

目前,我国方志图像及全文数据库建设规模较大的有四个数据库,即中国方志库、中国数字方志库、国家图书馆方志数据库、天一阁方志数据库。此外还有雕龙中国地方志、苏州方志库、万方新方志数据库、西北五省新方志、中国历代地方志等。这些数据库或由数字化公司开发,以商品的形式出售给使用单位;或由藏书单位自建,可以对局域网内用户提供服务,也可以以数字图书馆的形式提供免费或有偿使用。这些图像及全文数据库中收录的方志,在“中国地方志书目数据库”中作为版本项出现,可揭示某一部方志的数字化情况,便于使用者研究阅读。此外,数据库除载体不同外,具有纸质方志丛刊所具备的各种用途,全文方志数据库更是弥补了影印本、图像本的不足。

随着各藏书单位书目数据库建设基本工作的完成,古籍数字化工作将进一步深入,图像数字化、全文数字化将是未来古籍保护与整理的重要工作之一。而地方志在古籍数字化工作中往往被列为首要,究其原因:一是“方志学”为独立学科;二是“方志”蕴涵史料丰富,无所不包,具有重要的史料价值;三是方志具有地域性,在历史流传过程中有些稀见版本为地方特色藏书甚至孤本,具有重要的版本价值及文物价值。各收藏单位将其列入特色藏书,十分重视,比如《著名图书馆藏稀见方志丛刊》系列的出版。这些资源为建设“中国地方志书目数据库”奠定了坚实的基础。

1.中国地方志书目数据库的建设具有开创意义,实现了地方志书目的数字化,确立了规范化、规模化、标准化的地方志书目数据库典范。

2.对于方志整理出版具有推动作用。当前方志整理工作仍以影印出版为主,但大多数影印方志选择依据是以《目录》中著录收藏单位在三、四家的方志为主,而忽略了多数图书馆都收藏的方志。这批方志的影印出版将进一步推进方志整理、研究工作的全面开展,同时有利于原版古籍的保护,为新时期方志馆的建设提供更丰富的资源,促进“中国方志馆”的建立。

3.对方志数据库建设具有指导意义。一是在中国地方志书目数据库的基础上建设子目数据库,如按地域,分为各省市方志书目数据库;按分类,有乡土志数据库、府、州、县志书目数据库,等等。二是对于地方志图像及全文数据库建设具有指导意义,数据库建设尤其是全文数据库建设工作中,可避免重复中国地方志书目数据库版本项中包含的数据库信息,对后来的数字化工作提供参考和指导;同时,读者在检索目录时见到数字化情况,即可查阅图像及全文数据库,实现书目数据库与全文数据库的联动。三是专题数据库建设,方志类目设置详细,可按类目进行专题性数据库建设,如沿革、星野、疆域、风俗、物产、方言、人物,等等。

(1)方志理论研究:对方志学分段研究提供文献目录支持,如古代方志学、近代方志学、现代方志学乃至当代方志学。对当代方志学研究可增加“方志学书目数据库的使用”一节。

(2)方志应用研究:推动方志目录学的发展,形成各地方志目录及门类目录。方志整理、专题资料汇编无论是方志数据库的开发,还是方志影印出版,均可查重,从而节约成本,有效开发。同时,可为分类整理出版提供集成目录,如艺文志数据库、艺文志汇编,实现数字出版与影印出版的有效联动,促进“地方文献”研究提供丰富第一手资料。比如可以考察“一地乡贤”所作之文章作品,成为“地方文献”的重要组成部分。

(3)方志事业研究:如历史状况,整理出版情况,包括数字出版与影印出版。

可利用书目数据库进行分类统计、门类统计、地域统计、出版时间统计,通过多维度的数据分析,运用统计学的方法实现“大数据”下的科学分析,揭示我国方志数量、方志流存状况、方志的分布状况、方志的收藏情况等。

为新时期方志的编撰工作提供更广阔的视野,在文献收集方面提供便利。

中国地方志书目数据库是一个开放性、动态性的书目数据库,随着古籍普查登记目录陆续完成,书目数据将不断增加,藏书单位也随之增加。数据的更新以及分析结果亦有细微的变化与浮动,是一种动态分析与检测。其中著者项信息中包含的朝代、籍贯等信息,形成了大量的人物传记资料,可为文学史研究提供新的史料。

建设“中国地方志书目数据库”将完善地方志数字化工作,实现方志的图像数据库、全文数据库与书目数据库的共同发展,为方志学研究提供新的研究思路与方法;为修志工作提供全面、系统的资源信息;进一步助推地方志的整理与出版。在大数据时代,应推进地方志整理与研究向全面、深入、细化的方向发展,充分开发方志史料库的价值。

续表

续表

续表

(1) 作者单位为天津图书馆。

(2) 部分数据2011年有所更新。

(3) 参见全国古籍整理规划领导小组办公室:《新中国古籍整理图书总目》,岳麓书社2007年版。

(4) “□”表示难以辨认的字,一“□”为一字。

(5) 表中数据由笔者统计,截止时间为2016年5月。

(6) 数据由笔者统计,截止时间为2016年5月。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈