首页 理论教育 视频浏览:场景转换与紧凑表示

视频浏览:场景转换与紧凑表示

时间:2023-07-02 理论教育 版权反馈
【摘要】:对于视频来说,浏览与有明确目的的检索同样重要。浏览需要视频具有在语义层次上的表示,有学者提出了场景转换图的概念,以一个有向图的节点表示场景,其中边表示时间上的转换。通过对STG的化简,可以去掉不重要的镜头,得到视频的紧凑表示。视频浏览一般采用分层结构和集束分类技术。分层浏览提供对视频任何点的随机存取,显示空间以镜头的代表帧表示,从而提供长视频内容的快速总览和存取。

视频浏览:场景转换与紧凑表示

对于视频来说,浏览与有明确目的的检索同样重要。浏览需要视频具有在语义层次上的表示,有学者提出了场景转换图(STG)的概念,以一个有向图的节点表示场景,其中边表示时间上的转换。通过对STG的化简,可以去掉不重要的镜头,得到视频的紧凑表示。由于单纯从图像中获得语义信息非常困难,也有学者提出了综合采用视频中的图像、语音及文字信息的方法。

视频浏览一般采用分层结构和集束分类技术。分层浏览提供对视频任何点的随机存取,显示空间以镜头的代表帧表示,从而提供长视频内容的快速总览和存取。为了支持基于分类的浏览,需要使用集束算法,一般采用分层的集束算法。用关键帧和镜头特征对镜头进行集束分类,每一类分别由相似内容的一组镜头组成。集束分类后,每类镜头用一个图标表示,显示在分层浏览器的高层上。这样,用户就可以大致知道每个镜头的内容,而不需要进入下一层次。(www.xing528.com)

目前对基于内容的视频检索的研究,比较成熟的是镜头边界检测方法和镜头动态特征的描述等。未来研究的主要问题将集中在综合的多特征检索技术(综合利用多种媒体的特征、综合利用其他学科的成果)、高层语义和低层特征的关联、视频数据高级语义的提取、高维索引技术及直接对压缩视频数据进行处理的方法等方面。此外,由于视频的数据量相当大,对它进行处理需要消耗大量的时间,因此寻找快速算法也是实现基于内容的视频检索所必须研究的一个问题。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈