首页 理论教育 语音编码技术及其应用研究

语音编码技术及其应用研究

时间:2023-06-27 理论教育 版权反馈
【摘要】:语音编码器有三种编码类型:波形编码、参量编码和混合编码。对于低速率语音编码信号,语音质量明显下降。在发端对模拟信号中提取的各个特征参量进行量化编码,在接收端根据接收到的滤波器参数和声源参数来恢复语音,它是根据特征参数重建语音信号的,所以称其为参量编码。混合编码是近几年提出的一种语音编码技术,它将波形编码和参量编码结合起来。LTP通过去除语音的元音部分,使得残余数据的编码更为有利。

语音编码技术及其应用研究

语音编码是信源编码,用于将模拟语音信号变成数字信号以便在信道中传输,数字移动通信中GSM系统采用规则脉冲激励-长期预测(RPE-LTP)编码方式。

语音编码器有三种编码类型:波形编码、参量编码和混合编码。

波形编码的基本原理是在时间轴上对模拟信号按一定的速率抽样,然后,将幅度样本分层量化,用代码表示。解码过程是将收到的数字序列经过解码和滤波恢复成模拟信号。

波形编码对比特速率较高的编码信号能够提供相当好的语音质量。对于低速率语音编码信号(比特速率低于16kbit/s),语音质量明显下降。目前使用较多的脉冲编码调制(PCM)和增量调制(ΔM),及它们的各种改进型都属于波形编码技术。

参量编码又称为声源编码,它是将信号在频域提取的特征参量变换成数字代码进行传输。解码为其反过程,将接收到的数字序列经变换恢复特征参量,再根据特征参量重建语音信号。也就是说,声源编码是以发音机制模型为基础,用一套模拟声带频谱特性的滤波器参数和若干声源参数来描述发音机制模型。在发端对模拟信号中提取的各个特征参量进行量化编码,在接收端根据接收到的滤波器参数和声源参数来恢复语音,它是根据特征参数重建语音信号的,所以称其为参量编码。这种编码技术可实现低速率语音编码,比特速率可压缩到2~4.8kbit/s,甚至更低,但是语音质量只能达到中等。

混合编码是近几年提出的一种语音编码技术,它将波形编码和参量编码结合起来。混合编码的数字语音信号中既包含若干语音特征参量,又包括部分波形编码信息。规则脉冲激励-长期预测(RPE-LTP)就是一种混合编码(见图2-1-23)。

RPE-LTP处理过程是先进行8kHz抽样,调整每20ms为一帧,每帧长为4个子帧,每个子帧长5ms,纯比特率为13kbit/s。(www.xing528.com)

978-7-111-47988-8-Part02-38.jpg

图2-1-23 RPE-LTP编码

现代数字通信系统往往采用语音压缩编码技术,GSM也不例外。它利用语声编码器为人体喉咙所发出的音调和噪声以及人的口和舌的声学滤波效应建立模型,这些模型参数将通过TCH进行传送。

语音编码器是建立在残余激励线性预测编码器(REIP)的基础上的,并通过长期预测器(LTP)增强压缩效果。LTP通过去除语音的元音部分,使得残余数据的编码更为有利。语音编码器以20ms为单位,经压缩编码后输出260bits,因此码速率为13kbit/s。根据重要性不同,输出的比特分成182bits和78bits两类。较重要的182bits又可以进一步细分出50个最重要的比特。

与传统的PCM线路上语声的直接编码传输相比,GSM的13kbit/s的语音速率要低得多。未来的更加先进的语音编码器可以将速率进一步降低到6.5kbit/s(半速率编码)。

免责声明:以上内容源自网络,版权归原作者所有,如有侵犯您的原创版权请告知,我们将尽快删除相关内容。

我要反馈