首页 理论教育 图像数据库检索技术分析-现代数据库原理与索引设计优化

图像数据库检索技术分析-现代数据库原理与索引设计优化

时间:2023-10-21 理论教育 版权反馈
【摘要】:检索是衡量数据库系统性能的重要标准。目前的IDB检索操作是根据多方面数据的不同,利用表格实现查询数据在图像库的相应检索的。因此,我们应该在检索方法上展开新的研究,以便在诸多图像数据库中实现对用户需要的图像的查找。例如,图像库就是根据其树形进行相应的结构组织。通过比较可知第二种方式是比较合适的,即用一张嵌套表来表示检索树。

图像数据库检索技术分析-现代数据库原理与索引设计优化

检索是衡量数据库系统性能的重要标准。目前的IDB检索操作是根据多方面数据的不同,利用表格实现查询数据在图像库的相应检索的。与传统数据库检索相比,IDB检索操作具有一定的不足之处,主要体现在:第一,相比图像库的检索,它是盲目的,如果在量上比图像库检索大,就会大大延长检索的时间;第二,它比查询语言更为用户所熟悉;第三,它对检索信息是有明确要求的,且检索信息与图像本身的内容是无关的。

因此,我们应该在检索方法上展开新的研究,以便在诸多图像数据库中实现对用户需要的图像的查找。相比用户所提供的检索信息而言,若其本身是不充分的,则用户在检索信息时不仅需要提供图像本身的属性,而且需要提供图像的内容。首先,应用图像处理技术可以提取图像中的特征信息(也被称为广义关键子图),同时对其进行规范化,使其成为图像的特征向量。其次,在特征向量这一基础上通过对模式应用识别技术的利用,建立适合进行智能检索的检索树,也就是对特征向量进行相应的组织。例如,图像库就是根据其树形进行相应的结构组织。最后,在检索过程中要采用启发式深度优先的搜索策略实现对树的搜索。根据启发函数数值的不同,确定检索树上各层结点的优先权,对优先权最大的结点进行相应的向下搜索,直到叶子结点找到其所需的图像。在对叶子结点进行搜寻后,如果仍无法寻找到目标,就要进行逐层回溯,实现对其他分支上的查找。

(一)特征提取

对于一幅图像,在对其特征进行提取时,需要结合其领域上的知识。这与建库问题是无关的。对于特征提取来说,图像在对象物体上的反应与在性能和物理上的关系是很大的,可以对一幅图像的特征进行提取。其一般不是唯一的,往往是多样的,因此要对其进行规范化处理,也就是进行特征选择,对其中有一定代表性的和适合的特征进行特征向量上的图像组成。就目前而言,特征提取的方法分为两种:一种是根据准则对特征进行提取,另一种是要保证这种提取在最小的错误概论下进行。

在研究中发现,人类图像在特征点上的提取是“积分投影”。但各个特征点之间的关系是孤立的,人脸不能被直观、形象地表征出来。对于特征点,要对其在人脸构成的特征向量上进行组合,对15个点间的距离和夹角的各个分量上进行选择,从而实现对人脸特征的分析。

(二)建立检索树

图像库中的图像是具有特征向量的,需要对其进行聚类分析,可以根据树形结构对图像库进行重新组织,并建立适合进行检索的检索树。

聚类算法需要通过最大/最小(MAX/MIN)距离算法进行选择。这种算法具有一定的启发性。它是一种启发式的聚类算法,其基础是欧式距离。在实质上,这种算法可分为两个步骤:第一步是寻找聚类中心,第二步是根据最近距离将模式样本在最近的聚类中心进行分离。(www.xing528.com)

我们可以将聚类树上所具有的非叶子结点称为子类结点,如果其在特征向量上,就是类特征向量。

然后在聚类树的第k层,其上的某子类结点在类特征向量上是其下层子结点的组成部分,称为“族心”。这样就可以明确聚类树上的非叶子结点所具有的类特征向量,其中的结点也都相应地有一个类特征向量和特征向量。这样的聚类树就是一棵检索树,检索是很方便的。在实验中,检索树的编写是用LISP语言进行的,因此,检索树可以用以下两种方式表示。

1.检索树上的每个结点对应着LISP语言中的一个原子,每个原子的性质表中增加以下三项性质:①性质Vector项,其值为用表表示的对应结点的特征向量或类特征向量;②性质Sue-cessor项,其值为该结点的子结点对应的原子组成的表,若此项性质为空NIL,则表明此结点为叶子结点(对应于图像);③性质Precedence项,其值为父辈结点对应的原子,当该项值为NIL时,说明此原子对应的结点为根结点。

2.检索树用一张嵌套表来表示,其定义如下:①若检索树为空,则用空表NIL表示;②若检索树只有一个结点L,则用表(L)表示;③对检索树上任意一个结点N1t,其子结点设为S1、S2、S3,则可表示为(N1t[(S1)(S2)(S3)])。

在这里,无论是根结点、N1t还是另一棵更大的检索树上所具有的子类结点,对于S1、S2、S3来说,它们都具有同一个父结点,但也可能是叶子结点。对于其他的子树而言,也可能是父辈结点,其定义可参考上述①、②、③。

以上两种方式都具有一定的优点和缺点。对于第一种方式,其在结构上比较简单,操作也很方便,但是如果检索树本身比较大,则会占据很多空间。对于第二种方式,其结构是比较紧凑的,节省了存储空间,但如果检索树比较大时,可能会导致多层嵌套,而且操作比较麻烦,运算时间也相应较长。通过比较可知第二种方式是比较合适的,即用一张嵌套表来表示检索树。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈