WO2009117967A1

WO2009117967A1 - 编码、解码的方法及装置

Info

Publication number: WO2009117967A1
Application number: PCT/CN2009/071030
Authority: WO
Inventors: 舒默特·艾雅; 张立斌; 代金良
Original assignee: 华为技术有限公司
Priority date: 2008-03-26
Filing date: 2009-03-26
Publication date: 2009-10-01
Also published as: US8370135B2; EP2224428A4; EP2224428A1; KR101147878B1; BRPI0906521A2; US20100280823A1; CN101335000A; RU2010130664A; RU2461898C2; US20100324917A1; CN101335000B; EP2224428B1; US7912712B2; KR20100105733A

Description

编码、解码的方法及装置

本申请要求于 2008 年 03 月 26 日提交中国专利局、申请号为 200810084077.6、发明名称为"编码、解码的方法及装置"的中国专利申请的优先权，其全部内容通过引用结合在本申请中。技术领域本发明涉及通信技术领域，特别是涉及编码、解码的方法及装置。

背景技术

在语音通信中，对于背景噪声的编解码是按 ITU(International Telecom Union,国际电信联盟)制定的 G.729B中规定的噪声处理方案进行的。在语音编码器中引入了静音压缩技术，其信号处理原理框图如图 1所示。静音压缩技术主要包括三大模块： VAD( Voice Activity Detection , 语音激活检测）、DTX( Discontinuous Transmission,非连续传输）和 CNG( Comfort Noise Generator, 舒适噪声生成），其中 VAD、 DTX是编码器中的模块， CNG是解码端中的模块。图 1为一个简单的静音压缩系统原理框图，其基本流程为：首先在发送端（编码端），对每一输入信号帧， VAD模块对当前的输入信号进行分析和检测，检测当前信号中是否包含语音信号，如果包含，则将当前帧设为语音帧，否则设为非语音帧。其次，编码器根据 VAD检测结果对当前信号进行编码，如果 VAD检测结果为语音帧，则信号进入语音编码器进行语音编码，输出为语音帧；如果 VAD检测结果为非语音帧，则信号进入 DTX模块用非语音编码器进行背景噪声处理，并输出非语音帧。最后，在接收端（解码端）对接收到的信号帧（包括语音帧和非语音帧）进行解码。如果接收到的信号帧为语音帧，则用语音解码器对其解码，否则进入 CNG模块，在 CNG模块根据非语音帧传过来的参数对背景噪声进行解码，产生舒适背景噪声或静音，使解码后的信号听起来更为自然和连续。在编码器中引入这种变速率的编码方式，通过对静音阶段的信号进行适当的编码，静音压缩技术有效的解决了背景噪声不连续的问题，提高了信号合成质量，因此，解码端的背景噪声也可称为舒适噪声。另外，由于背景噪声的编码速率要远远小于语音编码速率，因此系统的平均编码速率也大大降低，从而有效的节省了带宽。 G.729B处理信号时对信号釆用分帧处理，帧长为 10ms。为了节省带宽，

G.729.1还定义了静音压缩系统的需求，要求其在背景噪声的情况下在不降低信号整体编码质量的前提下釆用低速率的编码方式对背景噪声进行编码传输，即定义了 DTX和 CNG的需求，更重要的一点是要求其 DTX/CNG系统要能够兼容 G.729B。虽然可以将 G.729B的 DTX/CNG系统简单移植到 G.729.1中，但有两个问题需要解决：一是这两个编码器的处理帧长不同，直接移植会带来一些问题，而且 729B的 DTX/CNG系统有些简单，尤其是参数提取部分，为了满足 G.729.1DTX/CNG系统的需求需要对 729B的 DTX/CNG系统进行扩展。二是 G.729.1处理的信号带宽为宽带，而 G.729B处理的带宽为窄带，在 G.729.1 的 DTX/CNG 系统还要加入背景噪声信号高频带部分（ 4000Hz ~ 7000Hz ) 的处理方式，使其成为一个完整的系统。现有技术中至少存在如下问题：现有的 G.729B系统由于处理的带宽为窄带背景噪声，在移植到 G.729.1系统中时，不能保证编码信号的质量。

发明内容

有鉴于此，本发明一个或多个实施例的目的在于提供一种编码、解码的方法及装置，以实现在将 G.729B进行扩展后，能够符合 G.729.1技术标准的要求，实现了在保证编码质量的情况下，显著降低信号的通信带宽。

为解决上述问题，本发明实施例提供了一种编码的方法，包括：

提取拖尾时间内的背景噪声特征参数；

对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取和 DTX 判决；

对第一个超帧后的超帧 ,根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。

还提供了一种解码方法，包括：从第一个超帧的第一帧之前的语音编码帧，获得第一个超帧的第一帧的 CNG参数; 根据所述 CNG参数,对第一个超帧的第一帧进行背景噪声解码，所述 CNG 参数包括：目标激励增益，所述目标激励增益由长时平滑的语音编码帧量化的固定码本增益确定； LPC滤波器系数，所述 LPC滤波器系数由长时平滑的语音编码帧量化的

LPC滤波器系数定义。还提供了一种编码装置，包括：第一提取单元，用于：提取拖尾时间内的背景噪声特征参数；

第二编码单元，用于：对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；第二提取单元，用于：对所述第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取；

DTX判决单元，用于：对所述第一个超帧后的超帧，对每一帧都进行 DTX 判决；第三编码单元，用于：对所述第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。还提供了一种解码装置，包括： CNG参数获得单元，用于：从第一个超帧的第一帧之前的语音编码帧，获得第一个超帧的第一帧的 CNG参数；第一解码单元，用于：根据所述 CNG参数，对第一个超帧的第一帧进行背景噪声解码，所述 CNG参数包括：目标激励增益，所述目标激励增益由长时平滑的语音编码帧量化的固定码本增益确定；

LPC滤波器系数，所述 LPC滤波器系数由长时平滑的语音编码帧量化的 LPC滤波器系数定义。与现有技术相比，本发明实施例具有以下优点：

本发明实施例通过提取拖尾时间内的背景噪声特征参数；对所述拖尾时间后的第一个超帧 ,根据提取的所述背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取和 DTX判决；对第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。实现了：

首先，在保证编码质量的情况下，显著降低信号的通信带宽。

其次，通过对于 G.729B系统的扩展，符合了 G.729.1系统指标的要求。再次，通过灵活准确的背景噪声特征参数的提取，使得背景噪声的编码更加精确。

附图说明

图 1所示，为一个简单的静音压缩系统原理框图；图 2所示，是 G.729.1编码器功能框图；图 3所示，是 G.729.1解码器系统框图；图 4所示，是本发明的编码的方法的实施例一的流程图；图 5所示，是对第一个超帧编码的流程示意图；图 6所示，是窄带部分参数提取及 DTX判决的流程图；图 7所示，是当前超帧中的窄带部分背景噪声参数提取及 DTX判决流程图；图 8所示，是本发明的解码方法的实施例一的流程图；图 9所示，是本发明的编码装置的实施例一的框图；图 10所示，是本发明的解码装置的实施例一的框图。

具体实施方式下面结合附图对本发明具体实施方式做进一步的详细阐述。

首先，介绍 G.729B系统的有关原理。

1.1.2.语音编码码流和背景噪声编码码流中编码参数的异同在当前的语音编码器中，背景噪声的合成原理与语音的合成原理相同，釆用的模型均是 CELP ( Code Excited Linear Prediction, 码激励线性预测）模型。语音的合成原理是：语音可以看成是一个激励信号激励一个合成滤波器 «)所产生的输出，即^ = 这就是语音产生的数学模型。在合成背景噪声时用的也是这个模型 ,所以背景噪声编码码流中所传输的描述背景噪声和静音特性的特征参数内容与语音编码码流中的特征参数基本相同，为信号合成时的合成滤波器参数和激励参数。在语音编码码流中，合成滤波器参数主要为线谱频率 LSF量化参数，而激励信号参数包括：基音延迟参数、基音增益参数、固定码本参数和固定码本增益参数。不同的语音编码器，这些参数的量化比特数和量化形式有所不同；相同的编码器，如果其包含多个速率，在不同速率下，由于描述信号特性的侧重点不同，编码参数的量化比特数和量化形式也有所不同。与语音编码参数不同，背景噪声编码参数描述的是背景噪声特性，由于背景噪声的激励信号可以认为是简单的噪声随机序列，而这些序列在编解码端均可以简单的用随机噪声产生模块产生，然后用能量参数控制这些序列的幅度，就可产生最终的激励信号，因此激励信号特征参数可以简单的用能量参数来表示，而不需要用其它的一些特征参数来进一步描述，所以在背景噪声编码码流中，其激励参数为当前背景噪声帧的能量参数，这与语音帧不同；与语音帧相同的是，背景噪声编码码流中的合成滤波器参数也为线谱频率 LSF量化参数，只是具体的量化方法有所差别。通过以上分析，可以认为对背景噪声的编码方式本质上就是一种简单的 "语音 "编码方式。 G.729B的噪声处理方案（引用 729B协议）

1.2.1 DTX/CNG总体技术介绍

G.729B 的静音压缩方案是较早的一种静音压缩技术，其背景噪声编解码技术基于的算法模型是 CELP, 因此其所传输的背景噪声参数也是基于 CELP 模型来提取的，是描述背景噪声的合成滤波器参数与激励参数，其中激励参数是描述背景噪声能量的能量参数，没有描述语音激励的自适应和固定码本参数，滤波器参数与语音编码参数基本一致，是 LSF参数。在编码端，对每帧输入的语音信号，若 VAD的判决结果为 "0", 表示当前的信号为背景噪声，那么编码器将信号送入 DTX模块，在 DTX模块对背景噪声参数进行提取，然后根据每帧参数变化情况来对背景噪声编码：若当前帧提取的的滤波器参数和能量参数与前几帧的变化较大，那么表示当前的背景噪声特性与之前的背景噪声特性相比有较大的差别 ,则在噪声编码模块将当前帧提取的背景噪声参数进行编码，组装成 SID帧（ Silence Insertion Descriptor, 静音描述帧）发送到解码端，否则发送 NODATA帧（无数据）到解码端。 SID帧和 NODATA帧称为非语音帧。在解码端，若进入背景噪声阶段，则在 CNG模块中根据接收的非语音帧合成出描述编码端背景噪声特性的舒适噪声。

G.729B处理信号时对信号釆用分帧处理，帧长为 10ms。下面分三节分别描述 729B的 DTX、噪声编码和 CNG模块。

1.2.2 DTX模块 DTX模块主要用来做背景噪声参数的估计与量化以及 SID帧的发送。在非话音阶段， DTX模块需要将背景噪声信息发送到解码端，背景噪声信息被封装在 SID帧中发送，若当前的背景噪声不平稳那么发送 SID帧，否则不发送 SID帧，而发送没有任何数据的 NODATA帧。另外两个相邻 SID帧间的间隔是有限制的，限制为两帧，若背景噪声不平稳，需要连续的发送 SID帧，那么后一个 SID帧的发送会延迟。在编码端， DTX模块会从编码器中接收 VAD模块的输出，自相关系数以及过去的激励样点，在每一帧， DTX模块会用三个值 0、 1、 2来分别描述非发送帧，语音帧和 SID帧，它们的帧类型分别为 ¾p = 0、 Ftyp = ^ Ftyp = 2。背景噪声估计的内容是背景噪声的能量电平和频谱包络，这个和语音编码参数在本质上是一致的，因此频谱包络的计算和语音编码参数的计算基本一致，用到的参数包括了前两帧的参数；而能量参数也是前几帧能量的一个平均值。

DTX模块的主要操作： a、每帧自相关系数的存储对每一输入的信号帧，包括语音帧的和非语音帧，将当前帧 t的自相关系数保留在緩存中，这些自相关系数表示为： r;( ), = 0...10。其中 _/·为每帧自相关函数的序号。 b、估计当前的帧类型如果当前是一个语音帧，即 VAD = 1, 那么将当前的帧类型设为 1, 若为非语音帧，则依据前一帧和本帧的自相关系数计算一个当前的 LPC 滤波器 A_t{z) , 在计算 4( 之前会首先计算相邻两帧自相关系数的平均值：

R j)= ∑r;U)J = 0...\0 其中 N = 2 , 计算出 R f)后依据 Levinson-Durbin 算法计算出 4( 。另外 Levinson-Durbin 算法也会计算出残差能量 , 并以此做帧激励能量的简单估计。当前帧的帧类型会用以下的方式进行估计：

(1)、如果当前的帧是第一个非活动帧，那么将此帧设为 SID帧，并令表征信号能量的变量等于 A , 表征帧数目的参数会设成 1:

Ftyp = 2

E=E_t (2)、对于其它的非语音帧，算法将之前的 SID帧参数与当前相应的参数进行对比，如果当前的滤波器与之前的滤波器差别较大或者当前的激励能量与之前的激励能量较大，那么令标志 ¾g__cto«g_e等于 1 , 否则标志的值不变。

(3)、当前的计数器 count _fr表示了当前帧与上一个 SID之间的帧的数目。如果其值大于 N_mm , 那么发送 SID帧；另外如果 flag—change等于 1 , SID帧也会发送，其它情况下，不发送当前帧：

count fr≥ N_mm )

flag _chang = \ J

Otherwise Ftyp_t = 0 在 SID帧的情况下，计数器 count _fr和标志 flag change重新初始化成 0。 c、 LPC滤波器系数：

设上一个 SID的 LPC滤波器的系数为 _d /), ' = 0...10 ,如果当前帧和上一帧的 SID-LPC滤波器的 Itakura距离超过了一定的门限，就认为二者有很大的不同：

10

^R_a(i) xR' (i)≥ E_t x thrl 其中， R_fl /), = 0...10是 SID滤波器系数的自相关系数：

U) = 2∑a_sld (k) ya_sid (k + j) if(j≠ 0)

R_a (0) =∑a_sid (kf d、帧能量：

计算帧能量的和：

然后对用 5比特的对数量化器量化。解码之后的对数能量会与上一个解码后的 SID对数能量 £ 进行比较，如果二者的差超过了 2dB, 那么认为二者的能量差别较大。

1.2.3 噪声编码及 SID帧

SID帧中的参数就是 LPC滤波器系数（频谱包络）和能量的量化参数。在对 SID-LPC滤波器计算时考虑了相邻噪声帧之间的稳定情况：首先，计算当前 SID帧之前 ^帧的平均 LPC滤波器 (z) , 这要用到自相关函数和 ( ) ,然后将送入 Levinson-Durbin算法中得到 0) ,而表示为：

R_P(J = ∑r_k (j)J = 0... \0

k=t -N_p 其中^的值定为 6。帧数目 t'的范围是 [t_l, t _ NJ。这样， SID-LPC滤波器表

if dis tan ce(A_t (z), A_p (z)) > thr3

otherwise

即算法会计算前几帧的平均 LPC滤波器系数 ( ，然后用其与当前的 LPC滤波器系数 4( 进行比较，若二者差值较小，那么当前帧在量化 LPC系数时选择的就是前几帧的平均值 ( ，否则就是当前帧的 4( 。选择好 LPC滤波器系数之后，算法将这些 LPC滤波器系数转化到 LSF域，然后进行量化编码，而量化编码选择的方式与语音编码的量化编码方式是一样的。能量参数的量化在对数域完成，釆用的是线性的量化，然后用 5bit进行编码。这样对背景噪声的编码就已完成，然后将这些编码比特封装在 SID帧中。如表 A所示：表 A

TABLE B..2/G.729

SID帧中的参数由四个码本索引构成，其中一个用来指示能量量化索引（5 比特），另三个指示频谱量化的索引（10比特）。

1.2.4 CNG模块

在解码端，算法用一个电平可控的伪白噪声激励一个经内插得到的 LPC 合成滤波器得到舒适的背景噪声，这在本质上与语音的合成方式一样。其中激励电平和 LPC滤波器系数分别从上一个 SID帧中得到。子帧的 LPC滤波器系数通过 SID帧中的 LSP参数的内插来得到，而内插方法与语音编码器中的内插方式是一致的。

伪白噪声激励 ex(n)是语音激励 exl(n)和高斯白噪声激励 ex2(n)的一个混合。 exl(n)的增益较小，而釆用 exl(n)的目的是为了让语音和非语音间的过渡更为自然。

这样得到激励信号后用其激励合成滤波器即可得到舒适的背景噪声。由于编解码双方的非语音编解码要保持同步，所以在双方都要为 SID帧和不发送帧产生激励信号。

首先，定义目标激励增益 , 令其作为当前帧激励平均能量的平方根，由下面的平滑算法得到，其中 ^是解码后的 SID帧的增益：〜 = 1)

80个釆样点被分成两个子帧，对每个子帧， CNG模块的激励信号会用如下的方式来合成：

(1)、在 [40,103]范围内随机选择基音延迟；

(2)、子帧的固定码本矢量中非零脉冲的位置和符号随机选择（这些非零脉冲的位置和符号的结构与 G.729是一致的）；

(3)、选择一个带增益的自适应码本激励信号，将其标记为 = 0...39 , 而选择的固定码本激励信号标记为 («),« = 0...39。然后以子帧能量为依据计算自适应增益 G。和固定码本增益 G_f：

—∑{G_axe_a(n) + G_fxe_f(n)f

需要注意的是 G_f可以选择负值 , K = 40xG , 而由 ACELP的激励

如果将自适应码本增益 G。固定，那么表现的方程就变成了一个关于 G_f 的二阶方程： r 2 , G_axl^ , E_axG_a ²-K _n

r_f H r_f H = U

^J 2 ^J 4 G。的值会被限定以确保上面的方程有解，更近一步，可以对一些大的自适应码本增益值的应用进行限制，这样，自适应码本增益 G。可以在如下的范围内随机的选择： 0， Maxl 0.5, J— , with A = E -I²/4

A 将方程丄！

的根中绝对值最小的作为 G_f的值。最后，用下式构建 G.729的激励信号：

e j (ri) = G_axe_a(n) + G_fxe_f[n],n = 0...39

合成激励 ex(")可由如下方法合成：

设是的能量， £₂是 ex₂(")的能量， £₃是和 ex₂(")的点积：

E₂ =^∑ex₂ ²(n)

而计算的点数超过自身的大小。

令《和分别是混合激励中和 ex₂(«)的比例系数，其中设为 0.6, 而 β依照下面的二次方程确定：

β²Ε₂ + 2 βΕ₃ + (a² - 1^ = 0, with β>0

如果没有解，那么将被设成 0, 而"设成 1。最终的 CNG模块的激励变为 ex(n)：

ex(n) = aex (n) + ββχ₂ (η) 以上即为 729.Β编码器的 DTX/CNG模块的基本原理。 1.3 G.729.1 编解码器的基本流程

G.729.1是 ITU最新发布的新一代语音编解码标准 (见参考文献 [1]), 其是 111； 0.729在8-321^^/8可分级宽带(50-70001^)上的扩展。默认情况下，编码器输入和解码器输出端釆样频率为 16000Hz。编码器产生的码流具有可分级性，包含 12个嵌入式层，分别被称作第 1 ~ 12层。第 1层为核心层，对应比特率为 8kbit/s。该层与 G.729码流一致，从而使得 G.729EV与 G.729具有互操作性。第 2层为窄带增强层，增加了 4 kbit/s,而第 3 ~ 12层是宽带增强层，以每层 2 kbit/s 速度共增加 20 kbit/s。

G.729.1编解码器基于三阶段结构：嵌入式码激励线性估计 (CELP)编解码，时域带宽扩展 ( TDBWE ) 以及被称为时域混叠消除（TDAC ) 的估计转换编解码。嵌入式 CELP阶段产生第 1和第 2层，生成 8 kbit/s和 12 kbit/s窄带合成信号 (50-4000 Hz)。TDBWE阶段产生第 3层，生成 Mkbit/s宽带输出信号 (⁵0-⁷000 Hz)。 TDAC阶段工作在改进离散余弦变换（MDCT )域，生成第 4 ~ 12层，将信号质量从 14 kbit/s提高到 32 kbit/s。 TDAC编解码同时代表 50-4000 Hz频带加权 CELP编解码误码信号和 4000-7000 Hz频带输入信号。

参考图 2所示，给出了 G.729.1编码器功能框图。编码器工作于 20 ms输入超帧。默认情况下，输入信号 («)在 16000 Hz进行釆样。因此，输入超帧具有 320个釆样点长度。

首先，输入信号¾»经过 QMF滤波 (H^ H ( )分成两个子带，低子带信号经过 50Hz截止频率的高通滤波器进行预处理，输出信号 («)使用 8kb/s~12kb/s 的窄带嵌入式 CELP 编码器进行编码，和 12Kb/s码率下

CELP编码器的本地合成信号^；^)之间的差值信号为 d» , 将其经过知觉加权滤波后得到信号 (") , 将 (")通过 MDCT变换到频域。加权滤波器 W_LB (z)包含了增益补偿，用来保持滤波器输出 d»与高子带输入信号之间的谱连续性。高子带分量乘上 (-1)"进行语折叠之后获得信号^ , 将^ »通过截止频率为 3000HZ的低通滤波器进行预处理，滤波后的信号使用 TDBWE 编码器进行编码。信号也通过 MDCT变换为频域信号。两组 MDCT系数/ 和^ 最后使用 TDAC编码器进行编码。另外，还有一些参数用 FEC (丟帧错误隐蔽)编码器进行传输，用以改进在传输中出现丟帧时造成的错误。

解码器系统框图如图 3所示，解码器的实际工作模式由接收到的码流层数决定，也等价于由接收到的码率决定。 (1)、如果接收到的码率为 8kb/s或 12kb/s (即仅接收到第一层或者前两层）：第一层或者前两层的码流由嵌入式 CELP解码器进行解码，得到解码后的信号 s _LB(n) , 再进行后滤波得到并经高通滤波获得 ^(") = ^/(")。输出信号由 QMF合成滤波器组产生，其中高频合成信号 ^ ^被置零。

(2)、如果接收到的码率为 14kb/s (即接收到前三层）：除了 CELP解码器解码出窄带分量以外， TDBWE解码器也解码出高带信号分量 s («)。对进行 MDCT变换，把高子带分量语中 3000Hz以上（对应于 16kHz釆样率中

7000Hz以上）频率分量置 0, 然后进行逆 MDCT变换，迭加之后并进行谱翻转，然后在 QMF滤波器组中将重建的高频带信号 ^SHB (" 与 CELP解码器解出的低带分量 (")=^»—起合成 16kHz的宽带信号（不进行高通滤波）。 (3)、如果接收到 14kb/s以上速率的码流（对应于前四层或者更多层）：除了 CELP解码器解码出低子带分量 («)、 TDBWE解码器解码出高子带分量以外， TDAC解码器还负责重建 MDCT系数和 ^« ( ) , 二者分别对应于低频带（0-4000 Hz )重建加权差值和高频带（ 4000-7000 Hz )重建信号（注意到在高频带中，非接收子带和 TDAC零码分配子带被替换为电平调整子带信号 ) 。 )及^^ )通过反向 MDCT和重叠相加变换为时域信号。然后，低频带信号 ("）经由感知加权滤波器进行处理。为减少变化编码带来的影响，对低频带和高频带信号 »和^ 进行前向 /后向回声监测和压缩。低频带合成信号^ (")经由后滤波处理，而高频带合成信号 ^ (")经由 (-l)n频语折叠处理。然后 , QMF合成滤波器组对信号 = 和进行组合和上釆样，得到最终的 16kHz的宽带信号。

1.4 G.729.1 DTX/CNG系统的需求

为了节省带宽， G.729.1还定义了静音压缩系统的需求，要求其在背景噪声的情况下在不降低信号整体编码质量的前提下釆用低速率的编码方式对背景噪声进行编码传输，即定义了 DTX和 CNG的需求，更重要的一点是要求其 DTX/CNG系统要能够兼容 G.729B。虽然可以将 G.729B的 DTX/CNG系统简单移植到 G.729.1中，但有两个问题需要解决：一是这两个编码器的处理帧长不同，直接移植会带来一些问题，而且 729B的 DTX/CNG系统有些简单，尤其是参数提取部分，为了满足 G.729.1DTX/CNG系统的需求需要对 729B的 DTX/CNG系统进行扩展。二是 G.729.1处理的信号带宽为宽带，而 G.729B处理的带宽为窄带，在 G.729.1的 DTX/CNG系统还要加入背景噪声信号高频带部分（ 4000Hz ~ 7000Hz ) 的处理方式，使其成为一个完整的系统。

在 G.729.1中，可以将背景噪声的高频带和低频带分别进行处理。其中高频带的处理方式比较简单，其背景噪声特征参数的编码方式可参考语音编码器的 TDBWE编码方式，判决部分简单比较频域包络和时域包络的稳定性即可。本发明的技术方案及要解决的问题是在低频带，也即窄带。以下所指的 G.729.1DTX/CNG系统，是指应用于对窄带 DTX/CNG部分的有关处理过程。

参考图 4所示，是本发明的编码的方法的实施例一，包括步骤：步骤 401、提取拖尾时间内的背景噪声特征参数；

步骤 402、对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码，得到第一个 SID帧；

步骤 403、对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取和 DTX判决；

步骤 404、对第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。

利用本发明实施例，通过提取拖尾时间内的背景噪声特征参数；对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取和 DTX 判决；

对第一个超帧后的超帧 ,根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。实现了：

在本发明的各个实施例中，如果为了适应 G.729.1相关技术标准的要求，可以通过将每个超帧设置为 20毫秒，将每个超帧所包含的帧设置为 10毫秒。利用本发明的各个实施例，均可以实现对于 G.729B的扩展，满足 G.729.1 的技术指标。同时，对于所属领域的技术人员而言，可以明白，对于非 G.729.1 系统，应用本发明的各个实施例所提供的技术方案，同样可以达到对背景噪声以较低的频带占用，带来较高的通信质量。即本发明的应用范围不仅仅局限于 G.729.1系统之内。

下面结合附图，详细介绍本发明的编码的方法的实施例二：

由于 G729.1和 G729B的编码帧长不同，其中，前者是 20ms—帧，后者是 10ms—帧。也就是说， G729.1的一帧与 G729B的两帧的长度相对应。为描述方便，这里将 G729.1 的一帧为超帧（ superframe ), G729B 的一帧为帧 ( frame ), 本发明主要针对这种差别来描述 G729.1的 DTX/CNG系统，即通过对 G729B DTX/CNG系统进行升级和扩展，以适应 ITU729.1的系统特点。

一、噪声的学习：

首先，用语音编码速率对背景噪声的前 120ms进行编码；

为了准确的对背景噪声的特征参数进行提取，在语音帧结束（根据 VAD 结果的指示，表明当前帧已经从活动的语音变为非活动的背景噪声）之后一段时间内，并不马上进入背景噪声处理阶段，而是继续用语音编码速率对背景噪声进行编码。这一拖尾的时间一般为 6个超帧，即 120ms (可参考 AMR及 AMRWB )。

其次，在这一拖尾时间内，对每一个超帧的每一 10ms帧，均对背景噪声的自相关系数 ^ ( ·), · = 0... 10进行緩存，其中 t为超帧序号， k=l,2为每个超帧中第 1个和第 2个 10ms帧的序号。由于这些自相关系数表征了拖尾阶段背景噪声的特性，因此在对背景噪声进行编码时就可以依据这些自相关系数，准确的提取出背景噪声的特征参数，从而使得对背景噪声的编码更加精确。在实际运用中，噪声学习所持续的时间长度，可以根据实际需要进行设定，不限于 120ms; 可以根据需要将拖尾时间设置为其他的数值。

二、对拖尾阶段后第一个超帧进行编码

在拖尾阶段结束之后，釆用背景噪声的处理方式对背景噪声进行处理。参考图 5所示，是对第一个超帧编码的流程示意图，包括步骤：在拖尾阶段结束后的第一个超帧，对噪声学习阶段以及当前超帧提取出来的背景噪声特征参数进行编码，得到第一个 SID超帧，由于在拖尾阶段之后的第一个超帧要进行背景噪声参数的编码传输，因此这一超帧一般称为第一个 SID超帧；编码后生成的第一个 SID超帧在发送到解码端后进行解码。由于一个超帧对应两个 10ms帧，为了准确获得编码参数，会在第 2个 10ms帧提取出背景噪声的特征参数 4( 和£,：

LPC滤波器 4( 和残差能量 A的计算方式如下：步骤 501、计算緩存中所有自相关系数的平均值：

^Rt^ = ^T ∑ ∑ r ( ), = 0...10 其中 =5 , 也就是緩存的大小为 10个 10ms帧。步骤 502、由自相关系数的平均值 ( ，根据 Levinson-Durbin算法计算出 LPC滤波器 4( ，其系数为 = 0,...,10 , 同时 Levinson-Durbin算法也会计算出残差能量 , 并以此作为当前超帧能量参数的简单估计。其中，在实际运用中，为了获得更加稳定的超帧能量参数估计，还可以对估计出的残差能量 A进行了长时的平滑，并将平滑后的能量估计 £_JJ作为当前超帧能量参数的最终估计重新赋给 A，平滑操作如下： E LT = ocE LT + (1 - a)E_t

E_t =E_LT 其中， "取值范围为： 0<« <1, 作为优选实施例中， "取值可以为 0.9。也可以根据需要设置为其他值。

步骤 503、算法将 LPC滤波器系数 4( 转化到 LSF域，然后进行量化编码；

步骤 504、残差能量参数 A的量化在对数域完成，釆用的是线性的量化。在背景噪声窄带部分的编码完成之后，将这些编码比特封闭在 SID帧中传送到解码端，这样就完成了第一个 SID帧窄带部分的编码。

在本发明的实施例中，对于第一个 SID帧窄带部分的编码充分考虑了拖尾阶段背景噪声的特性，将背景噪声在拖尾阶段的特性反映在了编码参数中，从而使得这些编码参数最大限度地表征了当前背景噪声的特性。因此，本发明的实施例中的参数提取相对于 G.729B更加准确合理。

三、 DTX的判决

为了清楚描述的需要，设提取的参数的表现形式是 Λ47? Λ, 其中 t为超帧序号， "k=l,2，，为每个超帧中第 1个和第 2个 10ms帧的序号。那么对于除了第一个超帧之外的其他非语音超帧，需要对每一 10ms帧的参数进行提取和 DTX 判决。

参考图 6所示，是窄带部分参数提取及 DTX判决的流程图，包括步骤：首先，进行第一个超帧后的第一个 10毫秒帧的背景噪声参数提取及 DTX 判决；

对于所述第一个 10毫秒帧，背景噪声的谱参数 4»和激励能量参数的计算方式如下：步骤 601、根据最近四个相邻 10ms帧自相关系数 r_(t__l)2(j) . τ_(ί__ι)Λ(]) 和 r __{2 2} ( 的值，计算当前自相关系数的稳态平均值 R" (j)：

R^tlU) = 0.5*r_mml( ) + 0.5*r_mm2( ), = 0...10 其中， _ml /)和 _m2 /)表示 (7·) 、 (7·) 、 ^__1λ1( ·)和^ _ ₂( 中具有次最小和次次最小自相关系数范数值的自相关系数，也就是除去具有最大和最小自相关系数范数值所剩下的具有中间自相关系数范数值的两个 10ms 帧的自相关系数： r{_t__l)2(j) , r __O )和^_ ₂( 的自相关系数范数分别为：

10 , 2

norm_tl = r_u ( )

"隱 _(ί— ",2

«隱(,— _1λ1

10 ₂

"隱 _(ί— ₂ =∑ 2 CO 将这四个自相关系数范数值进行排序，则 r_mml /)和 r_mm2 /)对应于具有中间自相关系数范数值大小的两个 10ms帧的自相关系数。

步骤 602、由当前自相关系数的稳态平均值 R" /)，根据 Levinson-Durbin 算法计算出背景噪声的 LPC滤波器 4, ），其系数为《,( '), ' = 0,...,10 , 同时 Levinson-Durbin算法也会计算出残差能量；

其中，在实际运用中，算法为了获得更加稳定的帧能量估计，对估计出的

Ε_ιΛ ,还可以进行长时的平滑，并将平滑后的能量估计 £_Jr作为当前帧激励能量估计重新赋值给，操作如下：

E_LT\ = oE_LT+ (\ -a)E_{t l}

Ε_ίΛ = E_LT\

"取值为 0.9。

步骤 603、参数提取之后，进行当前 10ms帧的 DTX判决； DTX判决的具体内容是：

算法将之前的 SID超帧 ( SID超帧就是经 DTX判决后最终要编码发送的背景噪声超帧，如果 DTX判决结果，该超帧不发送，则不称之为 SID超帧）中窄带部分编码参数与当前 10毫秒帧相应的编码参数进行对比，如果当前的 LPC滤波器系数与之前 SID超帧中的 LPC滤波器系数差别较大，或者当前的能量参数与之前 SID超帧中的能量参数差别较大（见下面的公式），则将当前 10ms帧的参数变化标志 flag—change—first置 1 , 否则清零。本步骤中的具体的确定方法与 G.729B类似：

首先，设上一个 SID超帧中的 LPC滤波器 Ο)的系数为 a_si人 j、,j = 0...10 , 如果当前 10ms帧和上一 SID超帧的 LPC滤波器的 Itakura距离超过了一定的门限，令 flag—change—first 3Λ , 否则置零： 10

if R_a (/) x R^{t l} (/) > E_{t l} x thr) flag _ change _ first = 1

else

flag _ change _ first = 0

其中， t/?r是具体的门限值，一般在 1.0到 1.5之间，本实施例中为 1.342676475, R_flOU = 0...l0是上一 SID超帧 LPC滤波器系数的自相关系数： U) = 2∑a_sid(k) a_sid(k + j) if(j≠ 0)

R_a(0) =∑a_sid(kf 其次，计算当前 10ms帧和最近三个 10ms帧共四个 10ms帧残差能量的平均值：

E_t, ― (E_t +£^,2 + E_t_^ + E_t_₂₂) / 4 需要注意的是，如果当前超帧是噪声编码阶段的第二个超帧 (即前一个超帧是第一个超帧），那么 _₂₂的值为 0。对用对数量化器量化。将解码之后的对数能量 i与上一 SID超帧解码后的对数能量 £ 进行比较,如果二者的差超过

3 dB , 就令 flag _ change _ first置一 , 否则置零：

if abs(E ^d -E_ql)>3

flag change first = 1

else

flag change first = 0

对于所属领域的技术人员而言，可以根据实际需要将两个激励能量的差设置为其他的值，这没有超出本发明的保护范围。

在进行了第一个 10ms帧的背景噪声参数提取及 DTX判决之后，就进行第二个 10ms帧的背景噪声参数提取及 DTX判决。第二个 10ms帧的背景噪声参数提取及 DTX判决流程与第一个 1 Oms帧一致，其中第二个 10ms帧的相关参数为：相邻四个 10ms帧自相关系数的稳态平均值 R^U /) , 相邻四个 10ms帧帧能量的平均值 ₂以及第二个 10ms帧的 DTX标志 flag—change— second。四、当前超帧中的窄带部分背景噪声参数提取及 DTX判决。

参考图 7所示，是当前超帧中的窄带部分背景噪声参数提取及 DTX判决流程图，包括步骤：

步骤 701、确定当前超帧窄带部分的最终 DTX标志 flag—change , 其确定方式如下：

flag _ change = flag _ change _ first 11 flag _ change _ sec ond

即只要有一个 10ms帧的 DTX判决结果为 1 , 则当前超帧窄带部分的最终判决结果为 1。

步骤 702、确定当前超帧的最终 DTX判决结果；包括当前超帧高频带部分在内的当前超帧的最终 DTX判决结果，则还要考虑高频带部分的特性，由窄带部分和高频带部分综合决定当前超帧的最终 DTX判决结果。如果当前超帧的最终 DTX判决结果为 1 , 则进入步骤 703; 如果当前超帧的 DTX判决结果为 0, 则不进行编码，只向解码端发送没有任何数据的 NODATA帧。

步骤 703、如果当前超帧的最终 DTX判决结果为 1 , 则对当前超帧的背景噪声特征参数进行提取；提取当前超帧的背景噪声特征参数的来源是当前两个 1 Oms帧的参数，即将当前两个 1 Oms帧的参数进行平滑得到当前超帧的背景噪声编码参数。提取背景噪声特征参数并进行背景噪声特征参数平滑的过程如下：首先, 确定平滑因子 smooth rate：

if {flag _ change _ first == 0 & & flag _ change _ sec ond == 1)

smooth _ rate = 0.1

else

smooth rate = 0.5 即：如果第一个 10ms帧的 DTX判决结果为 0, 而第二个 10ms帧的 DTX判决结果为 1 , 则在平滑时，第一个 10ms帧背景噪声特征参数的平滑权重为 0.1,第二个 10ms帧背景噪声特征参数的平均权重为 0.9, 否则两个 10ms帧背景噪声特征参数的平滑权重都为 0.5。然后，对两个 10ms帧的背景噪声特征参数进行平滑，得到当前超帧的 LPC 滤波器系数和计算两个 10ms帧帧能量的平均值，其过程包括：首先，计算两个 10ms帧自相关系数稳态平均值的滑动平均值 ( ： Rt (j)= smooth _ rateR''¹ - smooth _ rate)R''² (j) 得到自相关系数的滑动平均值 ( 之后，根据 Levinson-Durbin算法，得到 LPC 滤波器 4 ( ，其系数为 a_t (j'), = 0,...,10；其次，计算两个 10ms帧帧能量的平均值^ :

E = smooth _ rateE_t j+(l - smooth _rate)E_{t 2} 这样就得到当前超帧的窄带部分的编码参数： LPC滤波器系数和帧能量平均值。背景噪声特征参数提取以及 DTX控制充分靠了了当前超帧每一 10ms 帧的特性，因此算法较为严谨。五、 SID帧的编码与 G.729B—样，在对 SID帧的谱参数最终编码时，考虑了相邻噪声帧之间的稳定情况，具体的操作与 G.729B—致：

首先，计算当前超帧之前^个超帧的平均 LPC滤波器 (z) , 这要用到自相关函数平均值 (_/·) , 然后将 (_/·)送入 Levinson-Durbin算法中得到 0) , 而 ( )表示为：

其中^的值定为 5。这样， SID-LPC滤波器表示为：

A_t ∑) if dist ce(A_t (z), A_p (z)) > thr3

A_p (z) otherwise 即算法会计算前几个超帧的平均 LPC 滤波器系数 ( 然后，用其与当前的 LPC滤波器系数 4( 进行比较，若二者差别较小，那么当前超帧在量化 LPC 系数时选择的就是前几个超帧的平均值 ( ，否则就是当前超帧的 4( ，具体的比较方法与步骤 602中 10ms帧 DTX判决的方法一样，其中 t/?r3是具体的门限值，一般在 1.0到 1.5之间，本实施例中为 1.0966466。所述领域的技术人员可以根据实际需要，取其他的值，这没有超出本发明的保护范围。

选择好 LPC滤波器系数之后，算法将这些 LPC滤波器系数转化到 LSF域，然后进行量化编码，而量化编码选择的方式与 G.729B的量化编码方式类似。

能量参数的量化在对数域完成，釆用的是线性的量化，然后进行编码。这样对背景噪声的编码就已完成，然后将这些编码比特封装在 SID帧中。六、 CNG的方式

在基于 CELP模型的编码中，为了获得最佳的编码参数，在编码端也包含了解码的过程，对于 CNG系统也不例外，即在 G.729.1中编码端也要包含 CNG 模块。对于 G.729.1中的 CNG来说，其处理的流程基于 G.729B, 虽然其帧长为 20ms, 但还是以 10ms为基本的数据处理长度来处理背景噪声。但是，从上一节可知，第一个 SID超帧的编码参数在第 2个 10ms帧才会对进行编码，但这时系统需要在第一个 SID超帧的第一个 10ms帧就产生 CNG的参数。显然，第一个 SID超帧的第一个 10ms帧的 CNG参数不能从 SID超帧的编码参数中得到，而只能从之前语音编码超帧中得到。由于存在这种特殊情况，因此 G.729.1的第一个 SID超帧的第一个 10ms帧的 CNG方式与 G.729B有所不同，相对前述有关内容介绍的 G.729B的 CNG方式，这种不同表现在：

(1) 目标激励增益由长时平滑的语音编码超帧量化的固定码本增益定义：

G=LT_G_f *y

其中， 0< <1, 本实施例中可以选择 ^ = 0.4。

(2) LPC滤波器系数由长时平滑的语音编码超帧量化的 LPC滤波器系数 Jr_：? (z)定义：

A_sid(z) = LT_A(z)

其他的操作与 729B—致。

设语音编码帧量化的固定码本增益和 LPC滤波器系数分别为 gain— code和 A_q(z), 则这些长时平滑的参数分别计算如下：

LT _G_f = βυΓ _G_f + (1 - β) gain code

LT _A(z) = LT _A(z) + (\- )A_q(z)

以上操作在语音超帧的每一子帧都进行平滑，其中平滑因子的取值范围为 0<β<1, 本实施例中为 0.5。另外，除了第一个 SID超帧的第一个 10ms帧与 729B略有不同外，其他所有 10ms帧的 CNG方式均与 G.729B—致。

其中，在上述实施例中，所述拖尾时间为 120毫秒或 140毫秒。

其中，在上述实施例中，所述提取拖尾时间内的背景噪声特征参数具体为：在所述拖尾时间内 ,对每一个超帧的每一帧，保存每帧背景噪声的自相关系数。

其中，在上述实施例中，对所述拖尾时间后的第一个超帧，所述根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码包括：

在第一帧和第二帧保存每个帧背景噪声的自相关系数；

在第二帧，根据所述提取出的所述两帧的自相关系数和所述拖尾时间内的背景噪声特征参数，提取出所述第一个超帧的 LPC滤波器系数和残差能量，进行背景噪声编码。

其中，在上述实施例中，所述提取所述 LPC滤波器系数具体为：计算所述第一个超帧和所述第一个超帧之前的所述拖尾时间内的四个超帧的自相关系数的平均值；

由所述自相关系数的平均值，根据 Levinson-Durbin算法计算出 LPC滤波器系数；

所述提取所述残差能量 A具体为：

根据 Levinson-Durbin算法计算出残差能量；

所述在第二帧进行背景噪声编码具体为：

将所述 LPC滤波器系数转化到 LSF域，进行量化编码；

将所述残差能量在对数域进行线性量化编码。

其中，在上述实施例中，在计算出所述残差能量后，进行量化编码之前，还包括：对所述残差能量进行长时的平滑；平滑公式为： E_LT = oE_LT + (\_o E_t, 取值范围为： 0< <1; 将平滑后的能量估计 £_JJ的值作为残差能量的值。其中，在上述实施例中，所述对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取具体为：

根据最近四个相邻帧自相关系数的值，计算当前自相关系数的稳态平均值，所述自相关系数的稳态平均值是所述最近四个相邻帧中具有中间自相关系数范数值的两帧的自相关系数的平均值；

对所述稳态平均值，根据 Levinson-durbin算法计算背景噪声 LPC滤波器系数和残差能量。

其中，在上述实施例中，在计算所述残差能量后，还包括：

对所述残差能量进行长时平滑，得到当前帧能量估计；平滑方式为：

E _LT = aE _LT\ + (\-a)E_tk-

"取值为： 0< « <1;

将平滑后的当前帧能量估计赋值给所述残差能量；赋值方式为：

E_t,_k=E一 LT。

其中 k=l,2, 分别表示第一帧和第二帧。

其中，各个实施例中：《 =0.9。

其中，在上述实施例中，所述对第一个超帧后的超帧，对每一帧都进行 DTX判决具体为：

如果当前帧 LPC滤波器系数和上一 SID超帧 LPC滤波器系数的值超过预设的门限值，或者当前帧的能量估计与上一 SID超帧中的能量估计相比差别较大，则将当前帧的参数变化标志设为 1；

如果当前 10毫秒帧 LPC滤波器系数和上一 SID超帧 LPC滤波器系数的值没有超过预设的门限值，或者当前 10毫秒帧的能量估计与上一 SID超帧中的能量估计相比差别不大，则将当前 10毫秒帧的参数变化标志设为 0。

其中，在上述实施例中，所述当前帧的能量估计与前一 SID超帧中的能量估计相比差别较大具体为：计算当前 10毫秒帧和之前最近 3个帧共 4个帧的残差能量的平均值作为当前帧的能量估计；

将所述残差能量的平均值使用对数量化器量化；

如果解码后的对数能量与上一 SID超帧解码后的对数能量的差超过预设值，则确定所述当前帧的能量估计与前一 SID超帧中的能量估计相比差别较大。

其中，在上述实施例中，所述对每一个帧都进行 DTX判决具体为：如果当前超帧中有一个帧的 DTX判决结果为 1 , 则当前超帧窄带部分的 DTX判决结果为 1。

其中，在上述实施例中，述当前超帧的所述最终 DTX判决结果为 1 , 则所述： "对第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码"过程包括：

对于所述当前超帧，确定平滑因子，包括：

如果当前超帧第一帧的 DTX为零，第二帧的 DTX为 1 , 则所述平滑因子为 0.1 , 否则所述平滑因子为 0.5;

对所述当前超帧的两个帧进行参数平滑，将参数平滑后的参数作为对所述当前超帧的进行背景噪声编码的特征参数，所述参数平滑包括：

计算所述两个帧自相关系数稳态平均值的滑动平均值 ( ：

Rt (j)= smooth rateR" ( )+(l - smooth rate)R^t (j) , 戶斤 i^l smooth rate为所述平滑因子，）为第一帧的自相关系数稳态平均值， '²( 为第二帧的自相关系数稳态平均值；

对所述两个帧自相关系数稳态平均值的滑动平均值 ( ·) , 根据 Levinson-Durbin算法，得到 LPC滤波器系数，

计算所述两个帧帧能量估计的滑动平均值

Έ = smooth _rateE _l+{\― smooth _rate)E_{t 2} ,所述 _a为第一帧的能量估计， E ₂为第二帧的能量估计。

其中，在上述实施例中，所述"根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码"具体为：计算当前超帧之前若干超帧的自相关系数的平均值；

根据所述自相关系数的平均值，计算当前超帧之前若干个超帧的平均 LPC 滤波器系数；

如果所述平均 LPC滤波器系数与当前超帧的 LPC滤波器系数差值小于或等于预设值，则将所述平均 LPC滤波器系数转化到 LSF域，进行量化编码；如果所述平均 LPC滤波器系数与当前超帧的 LPC滤波器系数差值大于预设值，则将所述当前超帧的 LPC滤波器系数转化到 LSF域，进行量化编码；对能量参数，在对数域进行线性量化编码。其中，在上述实施例中，所述若干帧的数量为 5。所属领域的技术人员也可以根据需要选择其他数量的帧数。

其中，在上述实施例中，在所述提取拖尾时间内的背景噪声特征参数步骤之前，还包括：

用语音编码速率对所述拖尾时间内的背景噪声进行编码。

参考图 8所示，是本发明的解码方法的实施例一，包括步骤：

步骤 801、从第一个超帧的第一帧之前的语音编码帧，获得第一个超帧的第一帧的 CNG参数；

步骤 802、根据所述 CNG参数，对第一个超帧的第一帧进行背景噪声解码，所述 CNG参数包括：

目标激励增益，所述目标激励增益由长时平滑的语音编码帧参数量化的固定码本增益确定；

其中，在实际运用中，所述确定目标增益可以具体为：目标激励增益 = * 固定码本增益， 0 < < 1 ; 滤波器系数 ,所述滤波器系数由长时平滑的语音编码帧参数量化的滤波器系数定义；

其中，在实际运用中，所述定义所述滤波器系数可以具体为：滤波器系数 =长时平滑的语音编码帧量化的滤波器系数。其中，上述实施例中，所述长时平滑因子取值范围为:大于 0且小于 1。其中，上述实施例中，所述长时平滑因子可以为 0.5。其中，上述实施例中，所述 = 0.4。其中，上述实施例中，所述对第一个超帧的第一帧进行背景噪声解码过程之后，还可以包括：对除所述第一个超帧的第一帧之外的所有帧，从上一个 SID超帧获取 CNG 参数后，根据获取的所述 CNG参数进行背景噪声解码。参考图 9所示，是本发明的编码装置的实施例一，包括：第一提取单元 901 , 用于：提取拖尾时间内的背景噪声特征参数；第二编码单元 902, 用于：对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；

第二提取单元 903 , 用于：对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取；

DTX判决单元 904,用于：对第一个超帧后的超帧，对每一帧都进行 DTX 判决；

第三编码单元 905 , 用于：对第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。其中，上述实施例中，所述拖尾时间为 120毫秒或 140毫秒。其中，上述实施例中，所述第一提取单元具体为：緩存模块，用于：在所述拖尾时间内，对每一个超帧的每一帧，保存每帧背景噪声的自相关系数。其中，上述实施例中，所述第二编码单元具体为：提取模块，用于：在第一帧和第二帧保存每帧背景噪声的自相关系数；编码模块，用于：在第二帧，根据所述提取出的所述两个帧的自相关系数和所述拖尾时间内的背景噪声特征参数，提取出所述第一个超帧的 LPC滤波器系数和残差能量，进行背景噪声编码。其中，上述实施例中，所述第二编码单元还可以包括：残差能量平滑模块，用于：对所述残差能量进行长时的平滑；

平滑公式为： E—LT = E—LT + (\_a、E_t, 取值范围为： 0< <1; 将平滑后的能量估计 £_JJ的值作为所述残差能量的值。其中，上述实施例中，所述第二提取单元具体为：

第一计算模块，用于：根据最近四个相邻帧自相关系数的值，计算当前自相关系数的稳态平均值，所述自相关系数的稳态平均值是所述最近四个相邻帧中具有中间自相关系数范数值的两个帧的自相关系数的平均值；

第二计算模块，用于：对所述稳态平均值，根据 Levinson-durbin算法计算背景噪声 LP C滤波器系数和残差能量。

其中，上述实施例中，所述第二提取单元还可以包括：

第二残差能量平滑模块，用于：对所述残差能量进行长时平滑，得到当前帧能量估计；平滑方式为：

E _LT = aE _LT\ + (\-a)E_tk-

"取值为： 0< « <1;

E_t,_k=E一 LT。

其中 k=l,2, 分别表示第一帧和第二帧。

其中，上述实施例中，所述 DTX判决单元具体为：

门限比较模块，用于：如果当前帧 LPC滤波器系数和上一 SID超帧 LPC滤波器系数的值超过预设的门限值，则生成判决指令；

能量比较模块，用于：计算当前帧和之前最近 3个帧共 4个帧的残差能量的平均值作为当前帧的能量估计，将所述残差能量的平均值使用对数量化器量化，如果解码后的对数能量与上一 SID超帧解码后的对数能量的差超过预设值，则生成判决指令；第一判决模块，用于：根据所述判决指令，将当前帧的参数变化标志设为

1。

其中，上述实施例中，还可以包括：第二判决单元，用于：如果当前超帧中有一个帧的 DTX判决结果为 1, 则当前超帧窄带部分的 DTX判决结果为 1;

所述第三编码单元具体为：平滑指示模块，用于：如果当前超帧的所述最终 DTX判决结果为 1, 则生成平滑指令；；平滑因子确定模块，用于：收到所述平滑指令后，确定所述当前超帧的平滑因子：

如果当前超帧第一帧的 DTX为零，第二帧的 DTX为 1, 则所述平滑因子为 0.1, 否则所述平滑因子为 0.5; 参数平滑模块，用于：对所述当前超帧的两个帧进行参数平滑，将平滑后的参数作为对所述当前超帧的进行背景噪声编码的特征参数，包括：计算所述两个帧自相关系数稳态平均值的滑动平均值 ( ：

R' (j)= smooth _ rateR^t )+(l - smooth _ rate)^'² (j) ,所逸 smooth— rate为所述平滑因子， ^ /)为第一帧的自相关系数稳态平均值， '²( )为第二帧的自相关系数稳态平均值；

对所述两个帧自相关系数稳态平均值的滑动平均值 (·) , 根据 Levinson-Durbin算法，得到 LPC滤波器系数，

计算所述两个帧帧能量估计的滑动平均值

E= smooth _rateE_tl+(l - smooth _rate)E_t2 ,所述为第一帧的能量估计， ₂为第二帧的能量估计。其中，上述实施例中，所述第三编码单元具体为：第三计算模块，用于：根据计算得到的当前超帧之前若干超帧的自相关系数的平均值，计算当前超帧之前若干个超帧的平均 LPC滤波器系数；第一编码模块，用于：如果所述平均 LPC滤波器系数与当前超帧的 LPC 滤波器系数差值小于或等于预设值，则将所述平均 LPC滤波器系数转化到 LSF 域，进行量化编码；第二编码模块，用于：如果所述平均 LPC滤波器系数与当前超帧的 LPC 滤波器系数差值大于预设值，则将所述当前超帧的 LPC滤波器系数转化到 LSF 域，进行量化编码；第三编码模块，用于：对能量参数，在对数域进行线性量化编码。其中，上述实施例中，《 = 0.9。其中，上述实施例中，还可以包括：

第一编码单元，用于：用语音编码速率对拖尾时间内的背景噪声进行编码；本发明的编码装置具体与本发明的编码方法相适应的工作过程，相应地，也具有与相应的方法实施例同样的技术效果。参考图 10所示，是本发明的解码装置的实施例一，包括：

CNG参数获得单元 1001 , 用于：从第一个超帧的第一帧之前的语音编码帧 , 获得第一个超帧的第一帧的 CNG参数；第一解码单元 1002, 用于：根据所述 CNG参数，对第一个超帧的第一帧进行背景噪声解码，所述 CNG参数包括：目标激励增益，所述目标激励增益由长时平滑的语音编码帧量化的固定码本增益确定，其中，在实际运用中，所述目标激励增益确定具体为：目标激励增益 = *固定码本增益，所述的取值范围是： 0 < < 1 ;

LPC滤波器系数，所述 LPC滤波器系数由长时平滑的语音编码帧量化的 LPC滤波器系数定义，其中，在实际运用中，所述定义 LPC滤波器系数可以具体为：

LPC滤波器系数 =长时平滑的语音编码帧量化的 LPC滤波器系数。其中，在上述实施例中，所述长时平滑因子取值范围为：大于 0且小于 1。在优选的情况下，所述长时平滑因子可以为 0.5。其中，在上述实施例中，还可以包括：

第二解码单元，用于：对除所述第一个超帧之外的所有帧，从上一个 SID 超帧获取 CNG参数后，根据获取的所述 CNG进行背景噪声编码。其中，在上述实施例中，所述 = 0.4。本发明的解码装置具体与本发明的解码方法相适应的工作过程，相应地，也具有与相应的解码方法实施例同样的技术效果。以上所述的本发明实施方式，并不构成对本发明保护范围的限定。任何在本发明的精神和原则之内所作的修改、等同替换和改进等，均应包含在本发明的保护范围之内。

Claims

权利要求

1、一种编码方法，其特征在于，包括：

提取拖尾时间内的背景噪声特征参数；

对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取和非连续传输 DTX判决；对第一个超帧后的超帧 ,根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。

2、如权利要求 1所述的方法，其特征在于，所述拖尾时间为 120毫秒或 140毫秒。

3、如权利要求 1所述的方法，其特征在于，所述提取拖尾时间内的背景噪声特征参数具体为：在所述拖尾时间内，对超帧的每一帧，得到每帧背景噪声的自相关系数。

4、如权利要求 1所述的方法，其特征在于，对所述拖尾时间后的第一个超帧，所述根据提取的所述拖尾时间内的所述背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码包括：在第一帧和第二帧保存每个帧背景噪声的自相关系数；在第二帧，根据提取出的所述两帧的自相关系数和所述拖尾时间内的背景噪声特征参数，提取出所述第一个超帧的 LPC滤波器系数和残差能量进行背景噪声编码。

5、如权利要求 4所述的方法，其特征在于，所述提取所述 LPC滤波器系数具体为：

计算所述第一个超帧和所述第一个超帧之前的所述拖尾时间内的四个超帧的自相关系数的平均值；由所述自相关系数的平均值，根据 Levinson-Durbin算法计算出 LPC滤波器系数；所述提取所述残差能量 A具体为：根据 Levinson-Durbin算法计算出残差能量；所述在第二帧进行背景噪声编码具体为：将所述 LPC滤波器系数转化到 LSF域，进行量化编码；将所述残差能量在对数域进行线性量化编码。

6、如权利要求 5所述的方法，其特征在于，在计算出所述残差能量后，进行量化编码之前，还包括：对所述残差能量进行长时的平滑；平滑公式为： E_LT = oE_LT + (\_o E_t, 取值范围为： 0< <1; 将平滑后的能量估计 £_JJ的值作为残差能量的值。

7、如权利要求 1所述的方法，其特征在于，所述对第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取具体为：

根据最近四个相邻帧自相关系数的值，计算当前自相关系数的稳态平均值，所述自相关系数的稳态平均值是所述最近四个相邻帧中具有中间自相关系数范数值的两个帧的自相关系数的平均值；

8、如权利要求 7所述的方法，其特征在于，在计算所述残差能量后，还包括：

对所述残差能量进行长时平滑，得到当前帧能量估计；平滑方式为： E _LT = aE _LT\ + (\-a)E_tk-

"取值为： 0< « <1;

E_t,_k=E一 LT。

其中 k=l,2, 分别表示第一帧和第二帧。

9、如权利要求 1所述的方法，其特征在于，所述对第一个超帧后的超帧，对每一帧都进行 DTX判决具体为：

如果当前帧 LPC滤波器系数和上一 SID超帧 LPC滤波器系数的值没有超过预设的门限值，或者当前帧的能量估计与上一 SID超帧中的能量估计相比差别不大，则将当前帧的参数变化标志设为 0。

10、如权利要求 9所述的方法，其特征在于，所述当前帧的能量估计与前一 SID超帧中的能量估计相比差别较大具体为：

计算当前帧和之前最近 3个帧的残差能量的平均值作为当前帧的能量估计；

将所述残差能量的平均值使用对数量化器量化；

11、如权利要求 1所述的方法，其特征在于，所述对每一帧都进行 DTX判决具体为：

如果当前超帧中有一个帧的 DTX判决结果为 1 , 则当前超帧窄带部分的 DTX判决结果为 1。

12、如权利要求 11所述的方法，其特征在于，如果所述当前超帧的所述最终 DTX判决结果为 1 , 则所述： "对第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码"过程包括：

对于所述当前超帧，确定平滑因子，包括：

如果当前超帧第一帧的 DTX为零，第二帧的 DTX为 1 , 则所述平滑因子为

0.1 , 否则所述平滑因子为 0.5;

计算所述两个帧自相关系数稳态平均值的滑动平均值 ( ： R ( (j)= smooth _ rateR ^tA ( )十(1 - smooth _ rate)R ^t (j) ,所述 smooth _ rate为所述平滑因子， ^ /)为第一帧的自相关系数稳态平均值， '² ( )为第二帧的自相关系数稳态平均值；

计算所述两个帧帧能量估计的滑动平均值

E_t = mooth _ rateE_{t l}+(\― smooth _rate)E_{t 2} ,所述为第一帧的能量估计， E_t 为第二帧的能量估计。

13、如权利要求 1所述的方法，其特征在于，所述"根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码"具体为：计算当前超帧之前若干超帧的自相关系数的平均值；根据所述自相关系数的平均值，计算当前超帧之前若干个超帧的平均 LPC 滤波器系数；如果所述平均 LPC滤波器系数与当前超帧的 LPC滤波器系数差值小于或等于预设值，则将所述平均 LPC滤波器系数转化到 LSF域，进行量化编码；如果所述平均 LPC滤波器系数与当前超帧的 LPC滤波器系数差值大于预设值，则将所述当前超帧的 LPC滤波器系数转化到 LSF域，进行量化编码；对能量参数，在对数域进行线性量化编码。

14、如权利要求 13所述的方法，其特征在于，所述若干超帧的数量为 5。

15、如权利要求 1所述的方法，其特征在于，在所述提取拖尾时间内的背景噪声特征参数步骤之前，还包括：用语音编码速率对所述拖尾时间内的背景噪声进行编码。

16、如权利要求 6、 8任一项所述的方法，其特征在于，《 = 0.9。

17、一种解码方法，其特征在于，包括：从第一个超帧的第一帧之前的语音编码帧，获得第一个超帧的第一帧的舒适噪声生成 CNG参数；

根据所述 CNG参数,对第一个超帧的第一帧进行背景噪声解码，所述 CNG 参数包括：

目标激励增益，所述目标激励增益由长时平滑的语音编码帧量化的固定码本增益确定；

LPC滤波器系数，所述 LPC滤波器系数由长时平滑的语音编码帧量化的 LPC滤波器系数定义。

18、如权利要求 17所述的方法，其特征在于，所述长时平滑的因子取值范围为：大于 0且小于 1。

19、如权利要求 17所述的方法，其特征在于，所述对第一个超帧的第一帧进行背景噪声解码过程之后，还包括：

对除所述第一个超帧的第一帧之外的所有帧，从上一个 SID超帧获取 CNG 参数后，根据获取的所述 CNG参数进行背景噪声解码。

20、如权利要求 18所述的方法，其特征在于，所述长时平滑的因子为 0.5。

21、如权利要求 17所述的方法，其特征在于，所述确定所述目标激励增益具体为：所述目标激励增益 = *固定码本增益， 0 < < 1。

22、如权利要求 21所述的方法，其特征在于，所述 = 0.4。

23、如权利要求 17所述的方法，其特征在于，所述定义所述 LPC滤波器系数具体为：所述 LPC滤波器系数 =长时平滑的语音编码帧量化的 LPC滤波器系数。

24、一种编码装置，其特征在于，包括：第一提取单元，用于：提取拖尾时间内的背景噪声特征参数；

第二编码单元，用于：对所述拖尾时间后的第一个超帧，根据提取的所述拖尾时间内的背景噪声特征参数和所述第一个超帧的背景噪声特征参数，进行背景噪声编码；

第二提取单元，用于：对所述第一个超帧后的超帧，对每一帧都进行背景噪声特征参数提取；

DTX判决单元，用于：对所述第一个超帧后的超帧，对每一帧都进行 DTX 判决；

第三编码单元，用于：对所述第一个超帧后的超帧，根据提取的当前超帧的背景噪声特征参数和所述当前超帧之前若干超帧的背景噪声特征参数，以及最终 DTX判决结果，进行背景噪声编码。

25、如权利要求 24所述的装置，其特征在于，所述拖尾时间为 120毫秒或 140毫秒。

26、如权利要求 24所述的装置，其特征在于，所述第一提取单元具体为：緩存模块，用于：在所述拖尾时间内，对超帧的每一帧，得到每帧背景噪声的自相关系数。

27、如权利要求 24所述的装置，其特征在于，所述第二编码单元具体为：提取模块，用于：在第一帧和第二帧保存每个帧背景噪声的自相关系数；编码模块，用于：在第二帧，根据所述提取出的所述两帧的自相关系数和所述拖尾时间内的背景噪声特征参数，提取出所述第一个超帧的 LPC滤波器系数和残差能量 , 进行背景噪声编码。

28、如权利要求 27所述的装置，其特征在于，所述第二编码单元还包括：残差能量平滑模块，用于：对所述残差能量 A进行长时的平滑；

平滑公式为： E—LT = E—LT + (\ _ a、E_t , 取值范围为： 0 < < 1 ; 将平滑后的能量估计 £_JJ的值作为所述残差能量的值。

29、如权利要求 24所述的装置，其特征在于，所述第二提取单元具体为：第一计算模块，用于：根据最近四个相邻帧自相关系数的值，计算当前自相关系数的稳态平均值，所述自相关系数的稳态平均值是所述最近四个相邻帧中具有中间自相关系数范数值的两帧的自相关系数的平均值；

30、如权利要求 29所述的装置，其特征在于，所述第二提取单元还包括：第二残差能量平滑模块，用于：对所述残差能量进行长时平滑，得到当前帧能量估计；平滑方式为：

E _ LT = aE _ LT \ + (\ - a)E_{t k} -

"取值为： 0 < « < 1 ;

E_t,_k =E一 LT。

其中 k=l,2, 分别表示第一帧和第二帧。

31、如权利要求 24所述的装置，其特征在于，所述 DTX判决单元具体为：门限比较模块，用于：如果当前帧 LPC滤波器系数和上一 SID超帧 LPC滤波器系数的值超过预设的门限值，则生成判决指令；

能量比较模块，用于：计算当前帧和之前最近 3个帧的残差能量的平均值作为当前帧的能量估计，将所述残差能量的平均值使用对数量化器量化，如果解码后的对数能量与上一 SID超帧解码后的对数能量的差超过预设值，则生成判决指令；第一判决模块，用于：根据所述判决指令，将当前帧的参数变化标志设为

1。

32、如权利要求 31所述的装置，其特征在于，还包括：第二判决单元，用于：如果当前超帧中有一个帧的 DTX判决结果为 1 , 则当前超帧窄带部分的 DTX判决结果为 1 ; 所述第三编码单元具体为：平滑指示模块，用于：如果当前超帧的所述最终 DTX判决结果为 1 , 则生成平滑指令；平滑因子确定模块，用于：收到所述平滑指令后，确定所述当前超帧的平滑因子：

如果当前超帧第一帧的 DTX为零，第二帧的 DTX为 1 , 则所述平滑因子为 0.1 , 否则所述平滑因子为 0.5; 参数平滑模块，用于：对所述当前超帧的两帧进行参数平滑，将平滑后的参数作为对所述当前超帧的进行背景噪声编码的特征参数，包括：计算所述两帧自相关系数稳态平均值的滑动平均值 ( ：

R' (j)= smooth _ rateR^t )+(1 - smooth _ rate)^'² (j) ,所述層 c»c»t z_rate为所述平滑因子， ^ /)为第一帧的自相关系数稳态平均值， '² ( )为第二帧的自相关系数稳态平均值；

计算所述两个帧帧能量估计的滑动平均值

E = smooth _rateE_{t l}+(l - smooth _rate)E_{t 2} ,所述为第一帧的能量估计， ₂为第二帧的能量估计。

33、如权利要求 24所述的装置，其特征在于，所述第三编码单元具体为：第三计算模块，用于：根据计算得到的当前超帧之前若干超帧的自相关系数的平均值，计算当前超帧之前若干个超帧的平均 LPC滤波器系数；第一编码模块，用于：如果所述平均 LPC滤波器系数与当前超帧的 LPC 滤波器系数差值小于或等于预设值，则将所述平均 LPC滤波器系数转化到 LSF 域，进行量化编码；第二编码模块，用于：如果所述平均 LPC滤波器系数与当前超帧的 LPC 滤波器系数差值大于预设值，则将所述当前超帧的 LPC滤波器系数转化到 LSF 域，进行量化编码；第三编码模块，用于：对能量参数，在对数域进行线性量化编码。

34、如权利要求 28或 30任一项所述的装置，其特征在于，《 = 0.9。

35、如权利要求 24所述的装置，其特征在于，还包括：第一编码单元，用于：用语音编码速率对所述拖尾时间内的背景噪声进行编码。

36、一种解码装置，其特征在于，包括：

CNG参数获得单元，用于：从第一个超帧的第一帧之前的语音编码帧，获得第一个超帧的第一帧的 CNG参数；

第一解码单元，用于：根据所述 CNG参数，对第一个超帧的第一帧进行背景噪声解码，所述 CNG参数包括：目标激励增益，所述目标激励增益由长时平滑的语音编码帧量化的固定码本增益确定；

37、如权利要求 36所述的装置，其特征在于，所述长时平滑的因子取值范围为：大于 0且小于 1。

38、如权利要求 37所述的装置，其特征在于，所述长时平滑的因子为 0.5。

39、如权利要求 36所述的装置，其特征在于，还包括：

第二解码单元，用于：对除所述第一个超帧之外的所有帧，从上一个 SID 超帧获取 CNG参数后，根据获取的所述 CNG进行背景噪声编码。

40、如权利要求 36所述的装置，其特征在于，所述确定所述目标激励增益具体为：所述目标激励增益 = *固定码本增益，所述的取值范围是： 0 < < 1。

41、如权利要求 40所述的装置，其特征在于，所述 = 0.4。

42、如权利要求 36所述的装置，其特征在于，所述定义所述 LPC滤波器系数具体为：

所述 LPC滤波器系数 =长时平滑的语音编码帧量化的 LPC滤波器系数。