首页 理论教育 数字图书馆中基于内容的多媒体检索技术优化策略

数字图书馆中基于内容的多媒体检索技术优化策略

时间:2023-07-02 理论教育 版权反馈
【摘要】:目前,世界各国都在积极开展数字图书馆研究和开发工作。现代化的数字图书馆不再局限于传统的图书检索,照片、歌曲、视频片段等都可以作为信息查询的基本单元。我国数字图书馆的研究和建设晚于美国等发达国家。图2-4是基于内容的图像检索模块的查询示例。CADAL项目的书法字检索子系统对传统基于内容的图像检索技术进行了创新,开发出适合书法这一特殊字体的检索系统。

数字图书馆中基于内容的多媒体检索技术优化策略

目前,世界各国都在积极开展数字图书馆研究和开发工作。现代化的数字图书馆不再局限于传统的图书检索,照片、歌曲、视频片段等都可以作为信息查询的基本单元。我国数字图书馆的研究和建设晚于美国等发达国家。20世纪90年代初期,在图书馆学刊物上出现了介绍国外电子图书馆的论文,到了90年代中期,逐渐形成数字图书馆研究热潮,国家也开始投入大量资金和人力,开展数字图书馆的研究、建设、标准制定等多方面的课题和工作。国内一些重点大学根据各自图书馆的资源特色,纷纷开展了数字图书馆项目的研究和开发,如:北京大学的古籍数字图书馆、清华大学的中国科技史数字图书馆(主要为建筑史部分)、兰州大学的敦煌艺术数字图书馆、中山大学孙中山数字图书馆,等等。

在“十五”期间,由浙江大学中国科学院研究生院共同承建了CADAL(China Academic Digital Associative Library,CADAL)项目[2],该项目是中国教育部“211工程”公共服务体系建设子项目的重要组成部分,与“中国高等教育文献保障系统(CALIS)”一起,共同构成中国高等教育数字化图书馆的框架。CADAL项目旨在建设为我国高校教学科研服务的、100TB级规模的数字资源管理和查询平台,包括两个数字图书馆技术中心(浙江大学和中国科学院研究生院)、14个数字资源中心(北京大学、清华大学、浙江大学、复旦大学南京大学、中国科学院研究生院、上海交通大学、西安交通大学、武汉大学、华中科技大学吉林大学、中山大学、四川大学北京师范大学),以分布和开放式的架构,实现海量信息资源的数字化、管理和服务。

除了书籍、论文等文字资源检索服务之外,CADAL项目重点研究了基于内容的多媒体分析和检索,主要包括基于内容的图像检索、视频结构化与摘要生成、中国书法字检索与鉴别、基于综合推理的内容创新等模块。图2-4是基于内容的图像检索模块的查询示例。

图2-4 CADAL项目中基于内容的图像检索模块的查询示例

用户选择一幅样图作为查询请求提交给系统,系统经过处理后,从数据库中找到在视觉特征上与查询样图相似的图像,并返回给用户。这种检索模式也称为基于查询例子的(Query by Example)图像检索系统。如图2-4所示,该系统还提供了内容反馈功能,用户可以对检索结果进行评价,用“√”和“×”标注正确和错误的检索结果,系统根据一定的相关反馈算法从用户标注的图像中挖掘潜在的语义信息,并用于对检索结果的二次优化和求精。

图2-5是CADAL项目中视频结构化和摘要生成子系统的示例图,图中右上角是正在播放的一段视频,中间区域的Group[001],Group[002],Group[003]等是实时生成的结构化信息,图中下方是由图像组成的视频摘要,在此技术的基础上,可以实现基于内容的视频检索。

(www.xing528.com)

图2-5 CADAL项目中视频结构化和摘要生成子系统

此外,书法字检索是CADAL项目的一个特色功能,书法作品是中华民族传统文化的重要组成部分。例如:王羲之的《兰亭集序》,原先只是保存于纸张、绢丝等介质上,容易破损,为此,这些珍贵的书法作品通常都保存在博物馆中,不能随便浏览。CADAL项目的书法字检索子系统对传统基于内容的图像检索技术进行了创新,开发出适合书法这一特殊字体的检索系统。

书法作品首先通过高精度扫描仪转换成数字图像,然后通过自动书法字切分进行文字识别,如图2-6所示。之后采用基于形状的检索算法实现书法字检索,如图2-7所示,用户提交一个书法字作为查询条件,系统自动检索出与其在视觉特征上相似的书法字,得到了较高的检索效率

图2-6 书法作品中的文字自动切分示意图

图2-7 书法字检索示例

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈