首页 理论教育 从传统走向智能:智能化浪潮

从传统走向智能:智能化浪潮

时间:2023-06-26 理论教育 版权反馈
【摘要】:CBIR自起步就受到来自各国政府组织、商业机构和研究部门的普遍重视,以及MPEG等国际标准化组织的认同和支持。

从传统走向智能:智能化浪潮

基于内容的图像检索自从20世纪90年代起步以来,大致经历了早期、快速发展和智能化三个发展阶段。其中,早期阶段和快速发展阶段属于传统的图像检索研究阶段。

一、早期阶段(1994—2000年)

早期的CBIR研究已经注意到,人们在观察一幅图像时,往往更关注灰度变化剧烈的部分(如边缘),而非图像全部内容,因此在提取图像特征之前,首先通过图像预处理,如增强对比度锐化以突出细节信息,尽可能减少感知鸿沟(sensory gap),即真实世界与图像等记录之间存在的差异。CBIR自起步就受到来自各国政府组织、商业机构和研究部门的普遍重视,以及MPEG等国际标准化组织的认同和支持。一些代表性图像检索系统,包括QBIC(1995)、VIRAGE(1997)、Photobook(1994)、VisualSEEK和WebSEEK(1997)、NeTra(1995)、WBIIS(1998)等,都是在这个阶段开发的。在这个阶段,图像内容大多采用图像的颜色、纹理、形状等全局特征来描述。

二、快速发展阶段(2000—2006年)

进入21世纪以后,无论是工业界还是学术界,人们对于CBIR研究的热情继续高涨。其中一个表现是:以“Image retrieval”作为关键词,可检索到的公开发表的论文数量呈指数增长。这一阶段的研究与早期阶段相比,体现出以下几个方面的特色:

(1)在图像特征表达方面:图像特征出现多样化趋势,不仅描述图像颜色、纹理、形状的全局特征更加丰富,而且加强了对图像局部不变特征的描述;同时,更注重图像的区域特征描述,并且在图像同质区域特征的基础上,通过对各区域之间的空间关系进行建模,有效增强了图像特征的空间表达能力。此外,除了传统的人工设计特征之外,得益于机器学习理论和技术的发展,人们还提出了一些从图像数据中学习特征的方法。

(2)在相似性度量方面:突破传统的向量空间度量模型,提出度量学习的思想,即针对不同的检索任务,采用不同的距离度量函数。(www.xing528.com)

(3)在应用领域方面:随着成像技术的发展,基于内容的图像检索的应用领域拓宽到特定领域(如医学和遥感领域),以解决特定领域的检索难题。

此外,为了进一步提高检索性能,检索中应用了聚类技术并加强了相关反馈机制,以满足不断增长的数据量和不断提高的应用需求。

三、智能化阶段(2006年至今)

在这一阶段,大数据和硬件技术革命极大地推进了人工智能技术的发展,人工智能无处不在。作为人工智能领域发展最快的一个分支,深度学习通过构建深层神经网络结构,将图像的内容表示为逐级分层的抽象模式,其强大的特征学习能力不仅可以获取比人工设计特征更高的图像语义特征,而且具有较好的泛化能力;除了从大量的训练数据中学习图像特征,还可以学习度量图像之间相似性的函数。智能化阶段的查询条件不再是单一模态,检索的目的也不再局限于搜索与查询图像视觉上高度相似的图像,而是从感知和认知层面,检索更符合用户意图、包含潜在隐含语义特征的各种模态的数据。

总之,大数据、大模型让机器具备了解决过去只有人类才能解决的问题的能力,同时也改变了人类获取信息和知识的思维方式。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈