首页 理论教育 多源视觉信息感知与识别:人脸识别问题及挑战

多源视觉信息感知与识别:人脸识别问题及挑战

时间:2026-01-27 理论教育 浅陌 版权反馈
【摘要】:近几年来,尽管一些研究人员也针对无约束环境下的人脸识别问题提出了一些解决方案,但目前该领域仍然存在着诸多挑战:现有人脸识别算法在无约束环境下,特别是模糊人脸图像大量出现的场景下,难以获得优秀的准确率。如利用手持数码相机拍摄得到的PaSC数据库,现有性能最优的人脸识别算法在该数据库上准确率也仅在50%左右。一般称上述这些问题为异质人脸生成与识别问题。图2-1视觉人脸感知识别的整体结构框图

视觉信息感知识别技术中的重中之重是研究基于生物特征、自然语言和动态图像理解为基础的“以人为中心”的智能信息处理和控制技术。生物特征识别技术包括:人脸识别、指纹识别、虹膜识别、声纹识别、步态识别和情感计算等。人脸作为一种生物特征,它能够直观并有效地反应个体差异。因而,人脸识别技术成为生物特征识别领域,乃至模式识别和人工智能领域中一个研究热点。人脸识别技术相比其他生物特征而言,具有诸多优势:(1)生物信号可以隐蔽采集,适用于安防监控等公共安全场景;(2)信号采集过程中不需要接触,无侵犯性;(3)交互性强,用户体验良好;(4)因为人脸图像中不仅包含了身份信息,还提供了多种与人脸图像相关的判别信息,如情感、性别、年龄和种族等。因此,人们还可以在进行人脸识别任务的同时,利用提供的人脸图像进行其他人脸分析任务,这是其他生物特征所不具备的优势。正是由于上述的诸多优势,人脸识别技术作为生物特征识别领域的一个重要组成部分,具有极高的学术研究价值和应用前景。

由于同一个人在不同环境下(如光照、表情、遮挡或姿态等)会得到不同表现形式的图像,称这种差异为由于类内因素变化导致的类内差异。相应地,不同人也会得到不同表现形式的图像,这种差异称为类间差异。人脸识别作为一种典型的机器学习任务,它的目标即为从人脸图像中提取特征表示,使得类内差异尽可能小,而类间差异尽可能大。但在无约束环境下的人脸识别问题中,会涉及诸多因素的影响,如:成像设备的差异、被摄者的姿态、光源强度、图像采集设备与被摄者之间的相对运动等。这些因素使得无约束环境下的人脸识别问题成为一种新颖的、极富挑战的研究课题。近几年来,尽管一些研究人员也针对无约束环境下的人脸识别问题提出了一些解决方案,但目前该领域仍然存在着诸多挑战:

(1)现有人脸识别算法在无约束环境下,特别是模糊人脸图像大量出现的场景下,难以获得优秀的准确率。如利用手持数码相机拍摄得到的PaSC数据库,现有性能最优的人脸识别算法在该数据库上准确率也仅在50%左右。一般称这个问题为在无约束环境下人脸图像模糊问题。

(2)在无约束条件下,即使是某种在约束条件下已经得到很好解决的类内因素(如光照、姿态、老化或遮挡等),也会产生极端的变化。这些极端变化的出现,使得训练样本与测试样本统计分布存在不一致的情况。一般称上述这些问题为在无约束环境下单一类内因素极端变化问题。

(3)多重类内因素的同时出现,使得模板集(gallery set)中图像到输入图像的变换过程成为高度非线性的过程,导致了现有基于数据驱动的深度学习方法在面对多重类内因素同时变化问题时,特征描述能力不足且运行成本过高。一般称上述这些问题为在无约束环境下多重类内因素同时变化问题。(https://www.xing528.com)

(4)在公安场景(刑侦破案、寻找走失儿童等)、人机交互等现实场景中,不仅需要进行人脸识别,而且需要进行人脸生成。因此,将人脸生成和人脸识别结合于同一模型中,同时实现最佳的人脸生成和人脸识别效果,能够促进人脸生成和人脸识别技术应用于上述场景中。一般称上述这些问题为异质人脸生成与识别问题。

本章将从视觉感知的角度研究人脸识别问题,包括人脸图像去模糊,人脸图像的二值特征提取及深度人脸感知识别模型的建立等。人脸感知识别的整体结构框图如图2-1所示。

图示

图2-1 视觉人脸感知识别的整体结构框图

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈