首页 理论教育 检索算法设计优化技巧

检索算法设计优化技巧

时间:2023-07-02 理论教育 版权反馈
【摘要】:网格环境里的计算机终端称为节点,包括提交多媒体检索请求的查询节点、存储多媒体数据及其索引等信息的数据节点,以及执行检索算法的高性能执行节点。因此,根据上述问题描述,设网格中有j个具有高性能CPU和较高传输速率的节点E1,…

检索算法设计优化技巧

网格环境里的计算机终端称为节点,包括提交多媒体检索请求的查询节点、存储多媒体数据及其索引等信息的数据节点,以及执行检索算法的高性能执行节点。数据节点中多媒体资源的存储根据前一节中描述的虚拟资源空间分为四个层次,即:多媒体资源库、结构化和语义标注信息、元数据目录和虚拟集。网格环境中多媒体资源检索的问题描述,以及问题分析和求解表示如下:

问题描述:从网格查询节点Qi发出查询请求,要求从多媒体数据库Ω中搜索与查询例子Ir相关的多媒体信息,并将查询结果返回到查询节点Qi

问题分析与求解:网格是一个软硬件资源共享的协同计算环境,网格环境中的资源,如:多媒体数据、CPU、磁盘等设备都可以被任何一个用户共享和使用。因此,根据上述问题描述,设网格中有j个具有高性能CPU和较高传输速率的节点E1,…,Ej,检索算法中将其作为执行搜索引擎任务的执行节点,完成相似度匹配和检索结果的求精,再把结果传输到发出查询请求的节点Qi,整个算法包括下列几个部分:

1.候选集计算

步骤1 将用户在查询节点Qi提交的查询请求(即查询样例Ir)发送到最近的数据节点Di

步骤2 在节点Di根据虚拟资源空间中的虚拟集和元数据目录信息,将不相关的多媒体数据快速过滤,计算出候选集;(www.xing528.com)

步骤3 找到候选集对应的结构化特征和语义标注等信息,记为Ω'(即:图13-3中的多媒体内容特征、多媒体语义标注及索引)。

2.数据散列和相似度计算

步骤1 通过网格资源发现机制,得到h个与数据节点Di连接速率较高的空闲执行节点Ei(i∈[1,h]);

步骤2 将候选集Ω'通过哈希映射以“打包”的方式发送至空闲的执行节点,例如:将数据包Ω'(1)传输到空闲的执行节点E1,并在该节点计算相似度,由于Ω'不是非结构化的多媒体源数据,从而有效减少从数据节点发送至执行节点的网络传输代价;

步骤3 根据前面章节中介绍的相似度计算方法,在执行节点从候选集Ω'中找到符合查询条件的多媒体信息T(T∈Ω'),按照相似度大小进行排序得到T',需要说明的是,这里的T'并不是多媒体数据本身,而是相应的元数据;

步骤4 根据元数据中的地址信息,将数据节点中存储的多媒体数据按照T'的顺序进行排序,并作为检索结果返回给查询节点Qi

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈