首页 理论教育 泛地铁环境中的掌纹掌脉融合识别技术

泛地铁环境中的掌纹掌脉融合识别技术

时间:2023-09-20 理论教育 版权反馈
【摘要】:景象匹配是一项重要的图像分析与处理技术,它指的是将一个图像区域从别的传感器摄取的另一个相应景象区域中确定出来,或找到它们之间的对应关系。

泛地铁环境中的掌纹掌脉融合识别技术

景象匹配是一项重要的图像分析与处理技术,它指的是将一个图像区域从别的传感器摄取的另一个相应景象区域中确定出来,或找到它们之间的对应关系。当图像由不同的传感器或者不同的时间、不同的视角获取时,往往首先要进行景象匹配的处理。景象匹配在导航、地图与地形匹配、自然资源分析、天气预报环境研究、变迁检测、生理病变、文字识别、指纹识别等许多领域有重要的应用价值,它也是其他一些图像分析技术,如立体视觉、运动分析、数据融合等的基础。

景象匹配技术的数学描述:假设I1(x,y)为景象区域的成像,I2(x,y)中不仅包含景象区域,还包含与该景象区域相连的其他景象区域,则景象匹配是两幅图像之间的空间位置和灰度的映射,记为:

景象匹配算法大致分为基于区域的算法和基于特征的算法,本节主要对SIFT和fractal code方法进行简要介绍。

3.2.1.1 SIFT

使用DOG(difference of gaussians)滤波器在尺度空间寻找极值并得到一个新的特征描述,即SIFT变换。它具有旋转不变性和尺度变换不变性,对应图像的局部变形(如三维视角点变化等)也具有一些不变性。SIFT主要是通过对原始图像进行依次下采样得到一系列尺度空间,并应用DOG滤波器于这些尺度空间,选取局部极大值和局部最小值的特征点位置,具体步骤如下:

1)子空间极值检测

通过DOG滤波器对输入图像I(x,y)建立尺度空间L(x,y,σ):

DOG尺度空间的三个相邻尺度如图3.7所示。在检测尺度空间极值时,图3.7中标记为叉号的像素需要跟包括同一尺度的周围邻域8个像素和相邻尺度对应位置的周围邻域9×2个像素总共26个像素进行比较,以确保在尺度空间和二维图像空间都检测到局部极值。

图3.7 DOG尺度空间极值检测

2)关键点表达和检测

通过拟和三维二次函数以精确确定关键点的位置和尺度,同时去除低对比度的关键点和不稳定的边缘响应点(因为DOG算子会产生较强的边缘响应),以增强匹配稳定性、提高抗噪声能力。利用关键点邻域像素的梯度方向分布特性为每个关键点指定方向参数,使算子具备旋转不变性。

图像的关键点检测完毕,每个关键点有三个信息:位置、所处尺度、方向。由此可以确定一个SIFT特征区域。

3)剔除不稳定点,生成SIFT特征向量

剔除那些对比度小和对噪声非常敏感的关键点,在关键点处计算极值:

(www.xing528.com)

如果这个值的绝对值小于等于阈值,那么将被舍弃,本节实验中根据经验取该阈值为0.008。

由关键点邻域梯度信息生成特征向量,首先将坐标轴旋转为关键点的方向,以确保旋转不变性。接下来以关键点为中心取8×8的窗口。图3.8左部分的中央黑点为当前关键点的位置,每个小格代表关键点邻域所在尺度空间的一个像素,箭头方向代表该像素的梯度方向,箭头长度代表梯度模值,图中蓝色的圈代表高斯加权的范围(越靠近关键点的像素梯度方向,信息贡献越大)。然后在每4×4的小块上计算8个方向的梯度方向直方图,绘制每个梯度方向的累加值,即可形成一个种子点,如图3.8右部分所示。此图中一个关键点由2×2共4个种子点组成,每个种子点有8个方向向量信息。这种邻域方向性信息联合的思想增强了算法抗噪声的能力,同时对于含有定位误差的特征匹配也提供了较好的容错性。

图3.8 由关键点邻域梯度信息生成特征向量

当两幅图像的SIFT特征向量生成后,下一步采用关键点特征向量的欧式距离来作为两幅图像中关键点的相似性判定度量。取图像1中的某个关键点,并找出其与图像2中欧式距离最近的前两个关键点,在这两个关键点中,如果最近的距离除以次近的距离少于某个比例阈值,则接受这一对匹配点。降低这个比例阈值,SIFT匹配点数目会减少,但更加稳定。

3.2.1.2 Fractal code

Sloan最早提出了分形编码在基于内容的图像检索中的可能应用,他把查询图与目标图的Range块与Domain块分别并起来做联合分形编码,与图像检索中的交叉相关类似,计算量较大。通过进一步对目标图像做Nona树分解,在得到的每个子图像内独立进行分形编码,把得到的分形编码去掉全局位置信息,保留相对位移信息作为特征,并与查询图的分形编码做比较,得到相似性度量。另有文献提出了一个直接利用像素灰度值的特征编码方法fractal code,在图像检索和匹配过程中,只要进行特征值的相等比较,计算复杂度大大降低,快速匹配使得实时性也有了较大的提高。fractal code编码方法如下所述。

首先将整幅图像平均划分为k×k尺寸且互不重叠的图像块(参数k的选择根据具体图像和具体需要来确定),并定义这些图像块为R块。如果图像的边长不是k的整数倍,则可以将底部和最右边剩余的几行几列裁剪掉。

定义某个特定R块R,与其周围8个相邻的R块R1、R2、R3、R4 、R6、R7、R8、R9组成R块的邻域。将R块的邻域分为4个部分D 1、D2、D3、D4,如图3.9所示,并将其定义为R块的D邻域。D邻域的表达如下所示:

图3.9 R块的特征定义

D1 =R1 UR2 U R4 U R5,D2 =R4 UR5 UR7 U R8

D3=R5 U R6 U R8 U R9,D4=R2 U R3 U R5 U R6

每个D邻域包含4个R块,规定一个顺序后(顺时针或者逆时针),对4个R块的各个像素灰度值和进行排序:如果4个R块的像素灰度值和互不相同,则可以得到4! =24个可能的排序结果;如果只有2个R块的像素灰度值和相同,则可以得到36个可能的排序结果;如果有3个R块的像素灰度值和相同,则可以得到8个可能的排序结果;如果4个R块的像素灰度值和相同,则可以得到1个可能的排序结果。总共可以得到4! +36+8+1=69个排序结果,每个排序结果都可以依次用7位的二进制编码来表示:

P(Dj)∈(0000000,0000001,…,1000101)

R块的fractal code由它所在的4个D邻域编码进行串拼接来得到:

F(Ri)=(P(D1 )<<21)+(P(D2)<< 14)+(P(D3)<<7)+P(D4

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈