首页 理论教育 数字馆藏建设模式全面解析

数字馆藏建设模式全面解析

时间:2023-07-06 理论教育 版权反馈
【摘要】:商业数字馆藏引进主要采用单个图书馆购买和集团联合购买两种方式。在创建采集阶段,非商业数字馆藏的建设一直是数字馆藏建设的重要组成部分,随着商业数字馆藏同质化现象的加剧,非商业数字馆藏建设将成为未来数字馆藏建设工作的核心内容。非商业数字馆藏建设方面,目前主要采用本馆数字化加工、外包数字化加工、图书馆用户缴存与捐赠、图书馆搜集整理以及图书馆联合构建五类方式。

数字馆藏建设模式全面解析

模式,英文常被译为“Mode”或“Pattern”,是解决某一类问题可能的习惯或推荐的方法。在现实世界中,把解决某类问题的方法归纳总结到理论高度,那就是模式。良好的模式对现实实践中相关问题、解决方案和实施效果都进行了系统深入的归纳,借助于良好模式,可以逼近找到解决问题的最佳方法,达到事半功倍的效果。数字馆藏建设模式就是图书馆数字馆藏建设实践中相关问题、解决问题方法的归纳和总结,是指导图书馆数字馆藏建设的有力武器

数字馆藏建设是数字时代,乃至泛在信息时代图书馆对外提供高质量服务的基础。人们在图书馆馆藏建设的实践中,根据工作需要和社会的发展探索着不同的建设模式。[8]结合本书第三章对数字馆藏生命周期的分析,数字馆藏建设涵盖了数字馆藏创建和采集阶段、数字馆藏组织阶段、数字馆藏的老化处理阶段,但数字馆藏建设的重点仍是前两个阶段,本书关于数字馆藏建设模式的探讨将主要停留在创建采集和组织层面。

(一)创建采集阶段的数字馆藏建设现状分析

在创建采集阶段,商业数字馆藏引进仍是数字馆藏建设的主要内容。商业数字馆藏引进主要采用单个图书馆购买和集团联合购买两种方式。单个图书馆购买是数字馆藏引进初期采用的基本建设方式,但随着商业数字资源的频频涨价,几个馆(主要是大型图书馆)联合购买方式开始出现,发展到后来就出现了CALIS和NSTL这种集团购买方式。在当前大馆的商业数字馆藏引进中,这两种模式并行存在,而一些中小型图书馆甚至已经停用了单个图书馆购买的方式,全部采用联合购买的方式。

在创建采集阶段,非商业数字馆藏的建设一直是数字馆藏建设的重要组成部分,随着商业数字馆藏同质化现象的加剧,非商业数字馆藏建设将成为未来数字馆藏建设工作的核心内容。非商业数字馆藏建设方面,目前主要采用本馆数字化加工、外包数字化加工、图书馆用户缴存与捐赠、图书馆搜集整理以及图书馆联合构建五类方式。非商业数字馆藏建设在馆藏中主要体现载体是各馆的特色数据库,特色数据库建设主要是利用引进和自己开发的数据库平台,将通过各种方式创建和采集的数字资源揭示和发布出来,为用户所用。特色数据库建设初期,图书馆对自有特色馆藏资源数字化加工的方式比较普遍,但囿于各馆的财力、设备和人员,本馆数字化加工的数量不多,质量也不太高,标引也比较简单。随着数字图书馆建设热潮的到来,大量以数字化加工为主要工作的公司应运而生,也有一些公司专门打造了特色数据库建设和服务平台,馆藏数字化加工通过外包形式实现逐渐成为馆藏数字化加工工作的常态。图书馆用户缴存数字馆藏则是指用户按照相关规定向图书馆提交的数字资源,比如大学图书馆和研究机构图书馆对本机构各类学生学位论文和已经发表研究成果收缴而建设的学位论文数据库和机构知识库。图书馆在构建特色数据库过程中也可以向用户征集相关的印刷版资料或数字版资料,比如美国纽约图书馆构建“菜单”特色数据库时向纽约市民征集其就餐过程中拍摄的特色菜单,普林斯顿大学图书馆钱币数据库中的钱币照片完全由学生用户捐赠。图书馆也会通过其他方式搜集一些网络免费高质量资源构建特色数据库为用户服务,比如北京大学图书馆收集整理的北大博文数据库和各个学校构建的网络资源导航数据库等。此外,图书馆之间以及图书馆与其他机构之间也可以通过协作的方式构建特色数据库,比如北京大学与香港大学、北京大学历史地理研究所联合构建北京历史地理数据库,清华大学图书馆与教务处经济与管理学院联合构建学生优秀作品数据库等。

(二)资源组织阶段的馆藏建设现状分析

在数字馆藏的资源组织阶段,数字馆藏都存在资源描述和组织问题,主要涉及印本馆藏的数字描述组织(最突出的就是机读目录格式MARC书目数据)、商业数字馆藏的描述组织和非商业数字馆藏的描述组织。

印本馆藏的描述组织,目前主要是采取图书馆编目人员编目、中等层次的编目外包(除CNMARC 905字段外所有书目数据的编目外包)、高等层次的编目外包(包含CNMARC 905字段在内所有书目数据的编目外包)、图书馆间的联合编目(比如CALIS的联合编目、国家图书馆主导的联合编目以及诸如ILAS这种国内部分自动化系统提供商用户之间的联合编目)四类方式。其中,图书馆尤其是中小型图书馆的原始编目量,现在越来越少,采用编目外包和联合编目基本上可以获得自己所需要的绝大多数可套录的书目数据。一些大中型图书馆印本馆藏的原始编目主要转向于外文馆藏,尤其是英文文献之外的日俄法等小语种的馆藏。中等层次的编目外包是国内图书馆印本馆藏书目数据获得的主要方式,这部分编目外包严格意义上讲只是一种准外包。此种外包编目数据主要由图书供应商为其提供图书进行编目,一般而言,图书馆并不和图书供应商专门因书目数据编制而签订合同,而是在签订印本图书购买合同时约定有关内容,甚至并没有在合同中进行约定或者只是口头承诺,图书供应商为获得图书馆图书订单主动提供,对编目数据质量并没有严格的要求。高等层次的编目外包需要外包数据商对本馆的分类号和索书号有更好的把握,这需要长期的摸索和实践。高等层次的编目外包风险更大一些,具体实践中采用的比较少。此外,图书馆之间联合编目也是书目数据建设和共享的重点途径之一。图书馆之间借助相关约定和标准,对印本图书实现描述组织并纳入整个书目数据库中,其他机构则可以直接下载已经描述组织的书目数据。

商业数据库资源描述与组织,目前主要采取的方式是数据库商负责具体数据库资源内容层面描述,图书馆负责数据库描述。不管是传统的期刊类、报纸类、图书类等传统媒体内容数据库,还是日渐增多的音视频的多媒体数据库,具体资源内容层面的描述在数据库商构建数据库的时候已经完成,图书馆购买数据库时购买到的是一种经过描述可以进行检索浏览的成品,当前情况下数据库资源内容层面描述组织的质量主要取决于数据库商的技术、态度、人员素质、业界标准采用情况和责任心等。虽然国内外少量的数据库商,尤其是新入行的数据库商的元数据质量还有待改进,但绝大多数数据库的元数据质量还是比较令人满意的。以商业数据库为主要内容的数字馆藏在泛在信息社会若想支持知识服务,将主要依赖于商业数据库商资源描述的细化和深入。值得庆幸的是,相当多的数据库商,比如国内的CNKI、万方,国外的ISI Web of Science等已经开始进行学术定义、学术趋势分析等方面知识内容的挖掘并取得了一些卓有成效的建设成果。相比较而言,图书馆在商业数据库层面能够进行描述的内容并不太多,基本停留在数据库层面的描述,比如数据库名,数据库商名,数据库涵盖的学科、主题、资料类型、揭示程度、涵盖时间和范围等。图书馆通过这些描述为商业数据库建立各类导航,并试图通过商业或自开发的跨库检索软件提供跨库检索。在进行跨库检索时,还需要对各个数据库的检索规则进行描述和应用。但这种利用方式实际上仍旧是数据库商对资源和内容描述的元数据,对图书馆的知识服务支持力度有限。目前在图书馆行业应用日渐广泛的知识发现系统提供商正在通过商业谈判、合作等方式将商业数据库的元数据整合在一起,经过去重、完善等工作为图书馆用户提供检索浏览服务,但目前很难说是一种知识发现系统,还是只提供跨库检索服务。若想提供真正的知识服务,还需要对获得的元数据做进一步的整理和分析,揭示学科趋势、研究热点、新兴领域等知识内容。(www.xing528.com)

非商业数字馆藏资源描述与组织,目前主要采用图书馆馆员资源描述、外包资源描述、用户参与的资源描述和众包的资源描述四种方式。这里的非商业数字馆藏主要是指图书馆建设特色数据库和收集整理的互联网免费资源,包括开放获取资源。这类数字馆藏的描述组织主要由相关图书馆馆员来完成,图书馆馆员需根据馆藏建设的实际需要和相关标准设置相应的元数据描述字段,并对具体资源进行描述。也有一些资源描述工作是在图书馆提供相应元数据描述字段和描述要求的基础上,由参与数字化加工的外包公司利用扫描的数字化版本的OCR识别来实现的,图书馆馆员负责元数据质量的评估和验收。也有一些资源是用户利用图书馆特定数据库系统已经设定的元数据字段在提交数字资源内容时对资源进行描述,图书馆馆员负责数据的审核,比如高校图书馆的学位论文就是由用户在提交论文的时候按照设定好的描述元数据字段进行自描述;还包括用户提交到机构知识库中的资源以及其他由用户提交的特色数据库,比如美国普林斯顿大学图书馆钱币数据库中的钱币照片,不但是用户捐赠的,而且用户还需要对这些照片进行描述。此外,图书馆在非商业数字馆藏描述与组织过程中,还可以通过非特定群体描述和修改描述的众包方式来实现。具体参与方式包括利用馆藏OPAC的Web 2.0用户参与功能(目前包括ALEPH、汇文等在内的国内外主要图书馆自动化系统和独立的新一代OPAC系统WOPAC、SOPAC、Vufind等都提供了供用户对资源进行评论、设置标签、资源评级和排序等的功能)、图书馆提供馆藏描述参与平台(如澳大利亚国家图书馆的数字报纸归档系统就允许用户设置标签和评论)、图书馆借助于第三方社交网络收集用户描述信息(如美国国会图书馆就将3115幅无版权的照片在其Flickr的主页上发布,用户可以对这些历史照片进行标注和评论)等。澳大利亚国家图书馆报纸数字化、芬兰国家图书馆数字化报纸等项目中都采用众包的方式邀请不特定的大众对资源数字化过程中OCR技术识别错误进行挑错和改错。

综合图书馆数字馆藏创建采集阶段和描述组织阶段建设的主要方式,数字馆藏建设的模式大体可以分为自建模式、协作建设模式、外包模式、用户参与建设模式和众包模式五大类。相对于其他几种建设模式,用户参与建设模式和众包模式出现时间较晚,正处于上升时期,但这五大类模式各有其适用空间,虽出现了此消彼长的排斥现象,但却并不完全排斥,一般情况下也不会完全替代彼此,在将来相当长的时间内会相互依存,共同应用于图书馆的数字馆藏建设。

(三)数字馆藏建设模式转变和多元化原因分析

与印本馆藏建设时代的馆藏建设模式相比,数字时代的馆藏建设模式发生了很大的转变,也更加复杂和多样。究其原因,主要有以下四个方面:

(1)馆藏来源的多元化和复杂化导致了模式的转变和多元化。传统印本馆藏时代的图书馆馆藏基本上都是通过出版社、书店等机构获得,后来增加了第三方图书供应商,这些供应商本身一般并没有资源,只是从图书馆获得采购需求,然后根据需求到出版社采购后再售卖给图书馆,以此获得中间利益。随着第三方图书供应商的增加,供应商之间的竞争愈加激烈,于是出现了图书编目业务外包形式,供应商以提供配套书目数据的方式获得更多的图书馆采购订单。相对于印本馆藏,数字馆藏的来源则更多,既可以从数据库商那里购买,也可以自己数字化和描述组织数据库商无法提供的本馆特色馆藏,还可以收集整理互联网上各类有价值的资源,图书馆在具体实践中也探索了多种有效的建设模式。在构建特色馆藏实践过程中,由于有的特色库建设的资源直接来自用户的捐赠和数字化,而且量也非常大,于是就出现了由用户按照设定好的描述字段内容对资源进行描述组织的用户参与建设的模式。

(2)降低馆藏构建成本的需求推动了联合建设模式。虽然国内图书馆的资源采购经费大多能够保持稳定或持续增长,但商业数字资源价格的持续攀升(部分数据库每年有百分之十几的增幅),远远超过了采购经费的增长率,这就使图书馆在购买商业数据库数字资源的时候有些捉襟见肘。要想利用有限的经费最大限度地满足用户需求,就要降低购买成本,于是就出现了几家图书馆甚至几十家、几百家图书馆联合购买模式。不管联合购买成员采用的采购费分摊方式是FTE(全时当量),还是按使用量或是平均分摊,单个图书馆购买的费用都会有不同程度的降低,而数字资源商则可以借机扩大市场,增加销售总额。联合购买模式为图书馆和数字资源商双方接受,成为当前商业数字资源采购的主要模式。此外,在特色数据库建设过程中也存在类似的问题,由于某类特色资源馆藏为多个图书馆共有,若要保证特色数据库涉及内容的全面性,任何一个图书馆收集全该类特色资源的成本都会非常高,几个图书馆联合构建,利用别馆共享的资源则可以大大降低相关成本。

(3)馆藏建设量急剧增长,但相关工作人员增长缓慢催生新建设模式。外包、用户参与和众包在馆藏建设中出现的一个最为重要的原因就是馆藏建设量的急剧增长而相关工作人员增长缓慢,相关工作人员无力应对或者虽然可应对但耗时较长影响用户正常使用。比如,编目外包,第三方图书供应商提供配书的书目数据虽然是图书供应商的一种商业促销手段,但根本原因则是高校规模扩张、本科教学评估等造成的购书量增加、未编目图书大量积压影响读者正常使用而出现的尽快完成编目的需求。又如,由用户捐赠资源构建数字馆藏的资源描述工作即学位论文的提交工作,如果作者只提交数字原文,而元数据描述工作由工作人员完成,少则几千篇,多则数万篇的论文编目工作量可想而知,而每个用户按照设定好的字段对自己提交的论文进行描述只会耗费用户很短时间,借助于用户力量则可以在较短的时间内顺利完成。再如,澳大利亚国家图书馆报纸数字化后OCR错误识别和纠错工作单纯依靠工作人员来做,其工作量可想而知,而采用众包方式则大大缩短了工作完成时间。

(4)用户的变化为新模式实施提供了人力保障。随着Web 2.0理念的普及,用户在利用数字资源过程中,已经不再只使用图书馆提供的固有组织方式,更愿意按照自己的喜好和习惯利用tag标签等描述组织数字资源,也愿意通过评论、评级或补充相关元数据的方式实现对数字资源的组织、建设与管理。用户这些参与习惯的养成为图书馆数字馆藏建设中用户参与和众包都提供了一定的人力保障。此外,随着信息技术的快速发展与普及,用户手中的手机和其他终端设备已经可以轻松完成某些数字化工作,而无处不在的无线互联网则允许用户轻松共享数字化资源。比如,美国纽约州建设的菜单数据库,用户在就餐的时候就可以随手用手机拍下特色菜单立即上传到图书馆网站。移动设备智能化使用户可以最大化利用碎片时间。这些变化有利于用户参与模式和众包模式的顺利实施,也使相关工作具有更强的吸引力

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈