首页 理论教育 高校图书馆创新实践中的数据共享模式

高校图书馆创新实践中的数据共享模式

时间:2023-11-05 理论教育 版权反馈
【摘要】:数据共享体现在数据的开放性与可扩展性上。如上海图书馆将馆藏24万余种名人手稿及档案元数据开放出来,以众包参与的方式开展开放数据应用大赛。数据的编码格式,与数据共享的便利性密切相关。关联数据技术使用URI和RDF发布、共享、链接各类数据、信息和资源,在数据集成与共享方面具有广泛的应用。关联数据使用URI作为对象统一标识符;使用HTTP URI实现全网范围内的统一访问;使用RDF三元组发布结构化数据。

高校图书馆创新实践中的数据共享模式

数据共享体现在数据的开放性与可扩展性上。开放性是指提供平台数据集的开放共享程度,使研究人员、学者、普通用户能够免费获取元数据信息,进行二次开发与创新研究,进而促进资源的深度挖掘与有效利用。如上海图书馆将馆藏24万余种名人手稿及档案元数据开放出来,以众包参与的方式开展开放数据应用大赛。可扩展性是指Web GIS系统提供开放数据API接口,允许数据众包,实现同主题下历史地理异构资源的统一呈现。要实现上述目标,就需要采用符合统一规范标准的数据模型,采用标准化的、通用性强的数据编码格式。数据的编码格式,与数据共享的便利性密切相关。标准化的、通用的数据编码格式有助于数据在异构系统间的传输和互操作,也有利于数据在不同应用开发环境中的读取和处理。

关联数据技术使用URI和RDF发布、共享、链接各类数据、信息和资源,在数据集成与共享方面具有广泛的应用。关联数据使用URI作为对象统一标识符;使用HTTP URI实现全网范围内的统一访问;使用RDF三元组发布结构化数据。RDF标准规范体系包括以“主体—谓词—客体”组成的三元组为最小单位的RDF抽象数据模型,和RDF/XML、Turtle、N3、JSON等一系列满足不同数据传输或处理目的、适应不同应用开发环境的数据编码格式,也叫序列化(Serialization)格式。三元组是知识组织与描述的通用模型,与本体的“对象—属性—属性值”一脉相承,有着很好的通用性和兼容性。RDF的各种编码格式是W3C的推荐标准,可很好地支持异构系统间的数据交换和传输,也可方便地被各种流行的编程语言处理。更重要的是,编码后的RDF数据可以存储在专用的RDF存储库而非关系数据库中,这样的RDF存储库也被称为“图数据库(Graph Database)”。RDF有着很好的通用性和兼容性。因此,采用关联数据技术与本体技术相结合,构建语义网环境下的关联数据模型,有助于数据在异构系统间传输和互操作,也有利于数据在不同应用开发环境中的读取和处理。具体到GIS元数据的规范和知识本体设计,应结合现有历史地理数据模型,最大限度采用成熟的、兼容性强的本体设计方案。一方面有助于本体中类和属性的复用;另一方面有助于提升多源数据的融合效率。(www.xing528.com)

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈