首页 理论教育 音频检索及其特性分析

音频检索及其特性分析

时间:2023-07-02 理论教育 版权反馈
【摘要】:声音的一些感知特性,如音调、响度、音色等,它们与音频信号的测量属性非常接近,因此,可在音频数据库中记录这些特征,并利用这些特征进行示例和指定特征查询。现有的声音数据库一般只允许用户把有限数目的文本关键字和描述赋予每个声音,而采用关键字进行检索。对声音进行数字化处理得到的结果称为音频。对于音频,需要通过听觉特征进行检索。声音其实是一种正弦波,故具有振幅、频率、相位等特性。

音频检索及其特性分析

声音查询是指利用声学的和主观的特性对声音进行查询。声音的一些感知特性,如音调、响度、音色等,它们与音频信号的测量属性非常接近,因此,可在音频数据库中记录这些特征,并利用这些特征进行示例和指定特征查询。

自然界的声音极其广泛,其中语音和音乐是最常见的声音媒体,对声音进行数字化处理得到的结果称为音频。现有的声音数据库一般只允许用户把有限数目的文本关键字和描述赋予每个声音,而采用关键字进行检索。虽然音频如音乐可以用题名、作者、主题、分类等进行索引,但用户常常会要求用一段音乐旋律来检索乐曲。对于音频,基于内容的处理涉及音频信号的分析、自动语音识别等技术。索引可以基于韵律、和音、旋律以及其他的感知或声学特征。声音的一些感知特征有音调、响度、音色、带宽、谐音等,可以对这些特性进行示例和特征值检索,也就是采用一个或多个客观的声学参数,或者输入一个参考的声音,要求系统检索相似或不相似的声音可以承载很大的信息量,是生活和工作中一种不可或缺的信息媒体。声音媒体是除视觉媒体外最重要的媒体,占总信息量的20%左右,语音和音乐是最常见的声音媒体。对声音进行数字化处理得到的结果称为音频。对于音频,需要通过听觉特征进行检索。(www.xing528.com)

声音其实是一种正弦波,故具有振幅、频率、相位等特性。但由于声音是能感觉到的媒体,因此声音具有物理和心理两种属性,并且是相互关联的。物理属性与波形有关,包括声强、频率、声波复合、谐波结构等属性。心理属性则与感觉有关,且因人而异,包括强度、音调、音色、音量、和谐等属性。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈