CN101138174B - 可扩展解码装置和可扩展解码方法 - Google Patents

可扩展解码装置和可扩展解码方法 Download PDF

Info

Publication number
CN101138174B
CN101138174B CN2006800079411A CN200680007941A CN101138174B CN 101138174 B CN101138174 B CN 101138174B CN 2006800079411 A CN2006800079411 A CN 2006800079411A CN 200680007941 A CN200680007941 A CN 200680007941A CN 101138174 B CN101138174 B CN 101138174B
Authority
CN
China
Prior art keywords
power
extension layer
core layer
unit
gain
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2006800079411A
Other languages
English (en)
Other versions
CN101138174A (zh
Inventor
河嶋拓也
江原宏幸
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
III Holdings 12 LLC
Original Assignee
Matsushita Electric Industrial Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Matsushita Electric Industrial Co Ltd filed Critical Matsushita Electric Industrial Co Ltd
Publication of CN101138174A publication Critical patent/CN101138174A/zh
Application granted granted Critical
Publication of CN101138174B publication Critical patent/CN101138174B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04LTRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
    • H04L1/00Arrangements for detecting or preventing errors in the information received
    • H04L1/004Arrangements for detecting or preventing errors in the information received by using forward error control
    • H04L1/0056Systems characterized by the type of code used
    • H04L1/0057Block codes

Abstract

公开了能够避免收听者的主观质量恶化的可扩展解码装置等。该装置为对核心层编码数据和包含扩展层增益系数的扩展层编码数据进行解码的可扩展解码装置,在该装置中,语音分析单元检测从核心层编码数据获得的核心层解码语音信号的功率的变动。增益衰减率计算单元(140)根据功率的变动而可变地设定衰减强度。在第1期间的扩展层编码数据丢失时,增益衰减单元(143)将第1期间之前的第2期间的扩展层增益系数根据所设定的衰减强度进行衰减,从而将第1期间的扩展层增益系数进行插值。

Description

可扩展解码装置和可扩展解码方法
技术领域
本发明涉及对被分层编码的信号进行解码的可扩展解码装置以及可扩展解码方法。 
背景技术
例如,在对语音信号进行分层编码/解码的技术中,即使失去某个层(layer)的编码数据,也能够从其他的层的编码数据解码出语音信号。一般,这样的编码技术称为可扩展语音编码(或可扩展语音编解码)。在可扩展语音编码中,有被称为频带可扩展语音编码。在频带可扩展语音编码中,使用对窄带信号进行编码、解码的处理层和进行使窄带信号高质量化、宽带化的编码、解码的处理层。以下,前者的处理层称为核心层,后者的处理层称为扩展层。 
例如,假设将频带可扩展语音编码适用在不能保证传输频带,从而因为丢失或延迟而有可能引起编码数据一部分欠缺(在以下说明中,编码数据欠缺称为“丢失”)的通信网络上的语音数据通信。此时,在接收端,有时能够接收核心层以及扩展层的双方的编码数据(核心层编码数据以及扩展层编码数据),有时也能够只接收核心层编码数据。 
作为用于将在传输路径上丢失的信息进行插值的方法,例如有非专利文献1所描述的方法。在使用单层的CELP(Code Excited Linear Prediction)的语音编解码中利用该文献所描述的方法。此外,在出现语音帧丢失的情况下,该方法为基于前面的信息,对合成语音所需的各个参数进行插值的方法。特别是有关增益系数,相对于前面的正常接收时的增益系数,用单调减少函数来表示被插值的增益系数。 
【非专利文献1】″AMR Speech Codec;Error Concealment of lost frames″,3GPP TS26.091 V5.0.0,2002-06 
发明内容
发明要解决的问题 
但是,在上述现有的方法中,在语音帧丢失期间,基本上仅基于过去的信息而减少插值增益。由于拖长插值后解码插值语音与原来的解码语音相差很大,所以这是防止异音的必要的措施。然而,简单地在可扩展语音编解码中适用这种处理,有可能产生如下问题。也就是说,存在以下问题,在扩展层的信号丢失时通过上述方法对该信号进行插值的情况下,根据核心层解码语音信号的功率变动和扩展层解码语音信号的增益衰减量,可能给收听者带来异音感或频带变动感而使主观质量恶化。 
例如,扩展层的信号丢失时,核心层解码语音信号的功率急剧减少且扩展层解码语音信号的增益非常缓慢地衰减的情况下,由于插值而恶化了的扩展层解码语音很明显。此外,例如,在扩展层的信号丢失时,核心层解码语音信号的功率几乎不变动且扩展层解码语音信号的增益急剧衰减的情况下,出现频带变动感。 
因此,本发明的目的在于提供一种能够避免收听者的主观质量的恶化的可扩展解码装置和可扩展解码方法。 
解决该问题的方案 
本发明的可扩展解码装置,用于对核心层编码信息和包含扩展层增益系数的扩展层编码信息进行解码,该可扩展解码装置包括:核心层解码单元,对所述核心层编码信息进行解码,以生成核心层解码语音信号;当前帧功率计算单元,计算通过所述核心层解码单元得到的核心层解码语音信号的当前帧的功率;过去帧功率存储单元,存储所需帧数的、由所述当前帧功率计算单元计算出的当前帧功率;功率变动比计算单元,将由所述当前帧功率计算单元计算出的当前帧功率与由所述过去帧功率存储单元存储的过去帧功率相比较,以检测核心层解码信号的功率的变动;增益衰减率计算单元,根据所检测出的功率的变动而可变地计算衰减强度,以在检测出核心层解码信号的功率减少时,与检测出核心层解码信号的功率增大时相比,增大衰减强度,在检测出核心层解码信号的功率增大时,与检测出核心层解码信号的功率减少时相比,减小衰减强度;以及增益衰减单元,在正常接收扩展层编码信息时,不衰减扩展层增益系数而直接输出,在当前帧的扩展层编码信息丢失时,将当前帧之前的过去帧的扩展层增益系数根据所设定的衰减强度进行衰减,并将当前帧的扩展层增益系数进行插值。 
发明有益效果 
根据本发明,能够避免收听者的主观质量的恶化。 
图1是表示本发明实施方式1的可扩展解码装置的结构的方框图。 
图2是表示本发明实施方式1的语音分析单元的结构的方框图; 
图3是表示本发明实施方式1的扩展层解码单元的结构的方框图; 
图4是表示本发明实施方式1的扩展层增益解码单元的结构的方框图; 
图5是用于说明本发明实施方式1的扩展层增益系数控制动作的图; 
图6是表示本发明实施方式2的可扩展解码装置的结构的方框图。 
图7是表示本发明实施方式2的语音分析单元的结构的方框图; 
图8是表示本发明实施方式2的扩展层解码单元的结构的方框图; 
图9是表示本发明实施方式2的扩展层增益解码单元的结构的方框图; 
图10是表示本发明实施方式3的可扩展解码装置的结构的方框图。 
图11是表示本发明实施方式3的语音分析单元的结构的方框图; 
图12是表示本发明实施方式3的扩展层解码单元的结构的方框图; 
图13是表示本发明实施方式3的扩展层增益解码单元的结构的方框图;以及 
图14是用于说明本发明实施方式3的扩展层增益系数控制动作的图。 
具体实施方式
下面将参照附图详细说明本发明的实施方式。 
(实施方式1) 
图1是表示本发明实施方式1的可扩展解码装置的结构的方框图。 
图1的可扩展解码装置100包括:核心层解码单元102、信号调整单元104、语音分析单元106、扩展层解码单元108、扩展层丢失检测单元110以及解码语音加法单元112。 
核心层编码数据被输入到核心层解码单元102。核心层解码单元102将核心层编码数据解码,生成核心层解码语音信号。 
这里,核心层编码数据为,与通过由未图示的可扩展编码装置对语音信号进行分层编码而生成的编码数据中的、窄带相对应的核心层的编码数据。此外,通过在可扩展编码装置的分层编码而生成的编码数据除了包含核心层编码数据以外,还包含扩展层编码数据。扩展层编码数据为用于对窄带的语音信号进行宽带化/高质量化的扩展层的编码数据。 
扩展层丢失检测单元110检测是否能对扩展层编码数据进行解码,换言之,检测扩展层编码数据是否丢失。检测结果作为扩展层丢失信息被输出到扩展层解码单元108。另外,在以下的说明中,扩展层丢失信息用loss[t]来表示,loss[t]=0表示扩展层编码数据丢失,loss[t]=1表示正常接收(没有丢失)扩展层编码数据。这里t为帧的序号。 
例如,作为扩展层编码数据的可否解码的检测方法,除了扩展层编码数 据以外,还列举了接收用于通知出现差错的信息即差错信息的方法。或者,扩展层丢失检测单元110使用附加在扩展层编码数据的CRC(CyclicRedundancy Check)等的差错检查码来进行差错检测。或者,扩展层丢失检测单元110判断直至解码时间为止扩展层编码数据还未收到。或者,在扩展层解码单元108的扩展层编码数据的解码过程中,通过在扩展层编码数据中所包含的差错检测码等检测出重大差错时,扩展层丢失检测单元110从扩展层解码单元108获得该意旨的信息。或者,在采用在扩展层的解码中核心层信息为必不可少那样的可扩展语音编解码的情况下,在检测出核心层有差错时,扩展层丢失检测单元110判断检测出扩展层有差错。 
由语音分析单元106进行解码语音信号的分析,具体而言,分析并检测由核心层解码单元102所生成的核心层解码语音信号的功率变动。包含功率变动的分析结果的分析信息被输出到扩展层解码单元108。语音分析单元106的更具体的内部结构后面论述。 
根据从语音分析单元106输入的分析信息以及从扩展层丢失检测单元110输入的扩展层丢失信息,扩展层解码单元108将扩展层编码数据解码,生成扩展层解码语音信号。扩展层解码单元108的更具体的内部结构后面论述。 
信号调整单元104进行使分别由核心层解码单元102以及扩展层解码单元108生成的核心层解码语音信号以及扩展层解码语音信号的取样速率、延迟以及相位一致的调整处理。在本实施方式中,信号调整单元104使核心层解码语音信号的取样速率、延迟以及相位与扩展层解码语音信号的取样速率、延迟以及相位一致。调整后的核心层解码语音信号被输出到解码语音加法单元112。 
解码语音加法单元112将在扩展层解码单元108所生成的扩展层解码语音信号和在信号调整单元104经调整的核心层解码语音信号相加。相加后的语音信号作为可扩展解码装置100的输出语音信号被输出。 
这里,具体说明语音分析单元106的内部结构。如图2所示,语音分析单元106包括当前帧功率计算单元120、过去帧功率存储单元122以及功率变动比计算单元124。 
当前帧功率计算单元120例如使用下面的算式(1),计算核心层解码语音信号的当前帧的功率。计算出的当前帧功率被输出到过去帧功率存储单元122以及功率变动比计算单元124。 
POWcore [ t ] = Σ i = 0 L _ FRAME - 1 ( Oc [ i ] * Oc [ i ] ) . . . ( 1 )
其中,POWcore[t]为各个帧的功率,t为帧的序号,L_FRAME为帧的长度,i为样本的序号,Oc[t]为核心层解码语音信号。 
过去帧功率存储单元122存储相当于所需帧数的从当前帧功率计算单元120输入的当前帧功率。所存储的当前帧功率作为过去帧功率而被功率变动比计算单元124参照。 
功率变动比计算单元124将由当前帧功率计算单元120计算出的当前帧功率和过去帧功率存储单元122中所存储的过去帧功率进行比较,检测核心层解码语音信号的功率变动。更具体地说,从当前帧功率计算单元120输入当前帧功率例如POWcore[t]时,功率变动比计算单元124参照在过去帧功率存储单元122中所存储的过去帧功率、例如POWcore[t-1],并例如使用下面的算式(2)计算功率变动比。 
PCratio [ t ] = POWcore [ t ] / POWcore [ t ] . . . ( 2 )
其中,PCratio[t]是将当前帧与过去帧之间的功率比换算为振幅比后得到的。 
另外,功率变动的检测方法不限于上述方法。例如,为了抑制功率变动的过度变动,抑制解码语音的变动,也可以使用多个不同的平滑系数将当前帧功率和过去帧功率平滑化,将例如用下面的算式(3)表示的核心层解码语音信号的长期平滑化功率与例如用下面的算式(4)表示的短期平滑化功率相比较,并使用下面的算式(5)计算功率变动比。 
POWLong=POWLong*βL+POWcore[t]*(1-βL)  ...(3) 
POWShort=POWShort*βS+POWcore[t]*(1-βS) ...(4) 
PCratio [ t ] = POWShort / POWLong . . . ( 5 )
其中,POWLong为长期平滑化功率,受到过去帧的功率的较强影响。此外,POWShort为短期平滑化功率,计算它以使其受到当前帧的功率较强的影响。此外,βL为长期平滑化系数,βS为短期平滑化系数,βL与βS存在0.0≤βS<βL<1.0的关系。 
接着,具体说明扩展层解码单元108的内部结构。扩展层解码单元108为 使用以CELP(Code Excited Linear Prediction)方式为基础的语音编码方式,此外,如图3所示,其包括编码数据分离单元130、扩展层增益解码单元131、扩展层自适应码本解码单元132、扩展层噪声码本解码单元133、扩展层LPC解码单元134、音调增益放大单元135、码增益放大单元136、声源加法单元137以及扩展层合成滤波单元138。 
编码数据分离单元130将扩展层编码数据分离为增益系数(扩展层增益系数)的编码数据、自适应向量(扩展层自适应向量)的编码数据、噪声向量(扩展层噪声向量)的编码数据以及LPC系数的编码数据。扩展层增益系数的编码数据被输出到扩展层增益解码单元131,扩展层自适应向量的编码数据被输出到扩展层自适应码本解码单元132,扩展层噪声向量的编码数据被输出到扩展层噪声码本解码单元133,以及LPC系数的编码数据被输出到扩展层LPC解码单元134。 
扩展层自适应码本解码单元132将前面生成的声源信号存储在内部存储区,并基于从编码数据分离单元130输入的编码数据所指定的延迟,提取相当于音调周期的声源信号。所提取出的声源信号作为扩展层自适应向量被输出到音调增益放大单元135。另外,通过从扩展层丢失检测单元110输入的扩展层丢失信息而被通知扩展层编码数据丢失即loss[t]=0时,扩展层自适应码本解码单元132利用过去的延迟(lag)或核心层的解码信息等来对扩展层自适应向量进行插值。 
扩展层噪声码本解码单元133生成用于表示噪声的信号分量的扩展层噪声向量,所述噪声的信号分量为用扩展层自适应码本所表示的音调周期分量不能完全表现的噪声的信号分量。具体而言,扩展层噪声码本解码单元133基于从编码数据分离单元130输入的编码数据以代数方式生成扩展层噪声向量,并将生成的扩展层噪声向量输出到码增益放大单元136。通过从扩展层丢失检测单元110输入的扩展层丢失信息而被通知扩展层编码数据丢失即loss[t]=0时,扩展层噪声码本解码单元133利用过去的扩展层的解码信息、核心层的解码信息或随机数值等来对扩展层噪声向量进行插值。 
扩展层LPC解码单元134对从编码数据分离单元130输入的编码数据进行解码后获得扩展层LPC系数。LPC系数被输出到扩展层合成滤波单元138。另外,通过从扩展层丢失检测单元110输入的扩展层丢失信息而被通知扩展层编码数据丢失即loss[t]=0时,扩展层LPC解码单元134使用过去的扩展层LPC系 数解码结果或核心层的LPC系数等来对扩展层LPC系数进行插值。另外,使用核心层的LPC系数对LPC系数进行插值时,而且核心层与扩展层的线性预测的分析阶数不同时,扩展核心层的LPC系数的阶数,使用阶数扩展后的LPC系数进行插值。 
扩展层增益解码单元131从编码数据分离单元130输入的编码数据解码出扩展层增益系数。此外,通过从扩展层丢失检测单元110输入的扩展层丢失信息而被通知扩展层编码数据丢失即loss[t]=0时,扩展层增益解码单元131通过使用过去的扩展层增益系数解码结果以及从语音分析单元106输入的分析信息进行后述的扩展层增益系数的控制,进行扩展层增益系数的插值。扩展层增益系数包含与扩展层的音调周期分量对应的音调增益系数Gep和与扩展层的背景噪声分量对应的码增益系数Gec。音调增益系数Gep被输出到音调增益放大单元135,码增益系数Gec被输出到码增益放大单元136。另外,扩展层增益解码单元131的更加具体的内部结构后面论述。 
音调增益放大单元135使用从扩展层增益解码单元131输入的音调增益系数Gep来放大从扩展层自适应码本解码单元132输入的扩展层自适应向量,并将放大后的扩展层自适应向量输出到声源加法单元137。 
码增益放大单元136使用从扩展层增益解码单元131输入的码增益系数Gec来放大从扩展层噪声码本解码单元133输入的扩展层噪声向量,并将放大后的扩展层噪声向量输出到声源加法单元137。 
声源加法单元137将从音调增益放大单元135输入的扩展层自适应向量与从码增益放大单元136输入的扩展层噪声向量进行相加,从而生成扩展层声源信号。所生成的扩展层声源信号被输出到扩展层合成滤波单元138。 
扩展层合成滤波单元138使用从扩展层LPC解码单元134输入的扩展层LPC系数构成合成滤波器,同时通过使用从声源加法单元137输入的扩展层声源信号作为驱动声源信号,生成扩展层解码语音信号。所生成的扩展层解码语音信号被输出到解码语音加法单元112。另外,也可以对扩展层解码语音信号进行后置滤波处理。 
接着,具体说明扩展层增益解码单元131的内部结构以及扩展层增益系数的控制。如图4所示,扩展层增益解码单元131包括增益衰减率计算单元140、扩展层增益码本解码单元141、增益选择单元142、增益衰减单元143以及过去增益存储单元144。 
从编码数据分离单元130输入编码数据时,扩展层增益码本解码单元141对输入的编码数据进行解码,并获得当前帧的扩展层的音调增益系数DGep[t]以及码增益系数DGec[t]。所获得的音调增益系数DGep[t]以及码增益系数DGec[t]被输出到增益选择单元142。 
通过扩展层丢失信息而被通知了正常接收扩展层编码数据即loss[t]=1时,增益选择单元142将通过在扩展层增益码本解码单元141的解码而获得的音调增益系数DGep[t]以及码增益系数DGec[t]分别作为当前帧的音调增益系数Gep[t]以及当前帧的码增益系数Gec[t]输出到增益衰减单元143。 
此外,通过扩展层丢失信息而被通知了扩展层编码数据丢失即loss[t]=0时,增益选择单元142将在过去增益存储单元144中所存储的过去帧的音调增益系数例如Gep[t-1]以及存储在过去增益存储单元144中的过去帧的码增益系数例如Gec[t-1]分别作为当前帧的音调增益系数Gep[t]以及当前帧的码增益系数Gec[t]输出到增益衰减单元143。 
增益衰减率计算单元140基于作为扩展层丢失信息loss[t]以及分析信息而被输入的功率变动比PCratio[t],设定由增益衰减单元143进行的衰减,即音调增益系数Gep[t]以及码增益系数Gec[t]的衰减的强度。衰减强度的设定通过计算增益衰减率Gatt[t]来实现。增益衰减率Gatt[t]被输出到增益衰减单元143。 
更具体地说,被通知正常接收扩展层编码数据即loss[t]=1时,增益衰减率计算单元140决定增益衰减率Gatt[t]为“1.0”。此外,被通知扩展层编码数据丢失即loss[t]=0时,且检测出核心层解码语音信号的功率增大即PCratio[t]1.0时,增益衰减率计算单元140决定增益衰减率Gatt[t]为“1.0”。此外,被通知扩展层编码数据丢失即loss[t]=0时,且检测出核心层解码语音信号的功率减少即PCratio[t]<1.0时,增益衰减率计算单元140决定增益衰减率Gatt[t]与PCratio[t]为相同值。因此,在检测出核心层解码语音信号的功率增大时,与检测出核心层解码语音信号的功率减少时相比,可获得降低衰减的衰减强度。另一方面,在检测出核心层解码语音信号的功率减少时,与检测出核心层解码语音信号的功率增大时相比,可获得增加衰减的衰减强度。所述的增益衰减率决定方法也可用下面的式(6)来表示。 
Figure S2006800079411D00081
增益衰减单元143将从增益衰减率计算单元140输入的增益衰减率Gatt[t]乘以从增益选择单元142输入的音调增益系数Gep[t]以及码增益系数Gec[t],并将相乘后的音调增益系数Gep[t]以及码增益系数Gec[t]分别输出到音调增益放大单元135以及码增益放大单元136。此外,相乘后的音调增益系数Gep[t]以及码增益系数Gec[t]被存储到过去增益存储单元144。在进行对后续的帧的音调增益系数以及码增益系数的插值时,过去增益存储单元144所存储的音调增益系数以及码增益系数作为过去帧的音调增益系数以及码增益系数被参照。 
因此,在正常接收扩展层编码数据时,增益衰减单元143不对通过将当前帧的编码数据解码而获得的音调增益系数DGep[t]以及码增益系数DGec[t]进行衰减而直接输出。另一方面,在扩展层编码数据丢失时,增益衰减单元143使用计算出的增益衰减率Gatt[t]对过去帧的音调增益系数Gep[t-1]以及码增益系数Gec[t-1]进行衰减后输出。该衰减处理可通过下面的式(7)来表示。 
Gep[t]=Gep[t-1]*Gatt[t]*β 
...Gec[t]=Gec[t-1]*Gatt[t]*γ  ...(7) 
其中,β、γ分别是用于调整衰减量的系数。 
接着,说明由具有上述结构的可扩展解码装置100的扩展层增益解码单元131进行的扩展层增益系数控制动作。这里,使用图5A、图5B以及图5C说明3个动作例。 
在图5A、图5B以及图5C中,横轴是时间轴。在各图中所描绘的波形表示解码语音信号(核心层解码语音信号或扩展层解码语音信号)的功率的变动,时间轴下方的波形表示扩展层丢失信息的值的变动。 
参照图5A所示的例子时可见,扩展层从时点T0开始直至时点T1为止处于正常接收状态,从时点T1开始直至T2为止处于丢失状态。此外,扩展层从正常接收状态切换到丢失状态时,核心层功率(POWcore)大致为一定的状态,即处于不变的状态或者有轻微减少或增加的倾向。在现有技术中,在扩展层处于丢失状态时,与核心层的功率变动的状态无关,将常数(例如0.9等)乘以过去帧的扩展层增益系数而使其单调减少。另一方面,在本实施方式中,在扩展层处于丢失状态时,可变地设定与过去帧的扩展层增益系数相乘的衰减率Gatt。但是,在本例中,由于在扩展层处于丢失状态时的核心层功率(POWcore)大致为一定的状态,所以本实施方式的扩展层功率(POWenh)的波形与现有技术的扩展层功率的波形大致相同。 
参照图5B所示的例子时可见,扩展层从时点T0开始直至时点T3为止处于正常接收状态,从时点T3开始直至T4为止处于丢失状态。此外,扩展层从正常接收状态切换到丢失状态时,核心层功率(POWcore)存在急剧增加的倾向。此时,即使不对扩展层增益系数进行衰减,也对核心层解码语音信号的扩展层解码语音信号的影响度变小。因此,设定降低扩展层增益系数的衰减强度的增益系数Gatt。其结果,与核心层的功率变动的状态无关而单调减少的现有技术的扩展层功率相比,能够缓慢地减少本实施方式的扩展层功率(POWenh)。 
参照图5C所示的例子时可见,扩展层从时点T0开始直至时点T5为止处于正常接收状态,时点T5以后处于丢失状态。此外,扩展层从正常接收状态切换到丢失状态时,核心层功率(POWcore)存在急剧减少的倾向。此时,对核心层解码语音信号的扩展层解码语音信号的影响度变大。因此,设定增加扩展层增益系数的衰减强度的增益系数Gatt。其结果,与核心层的功率变动的状态无关而单调减少的现有技术的扩展层功率相比,能够急剧地减少本实施方式的扩展层功率(POWenh)。 
这样,根据本实施方式,在当前帧的扩展层编码数据丢失时,使用根据核心层解码语音信号的功率变动而可变地设定的衰减率来对过去帧的扩展层增益系数进行衰减,从而对当前帧的扩展层增益系数进行插值。因此,能够防止给收听者有随着扩展层丢失而引起的异音感和频带变动感,并能够避免主观质量的恶化。 
此外,根据本实施方式,在核心层解码语音信号的功率存在增大倾向时和核心层解码语音信号的功率存在减少倾向时,设定彼此不同的增益衰减率。具体而言,检测出核心层解码语音信号的功率减少时,与检测出核心层解码语音信号的功率增大时相比,设定增强衰减强度的衰减率,而检测出核心层解码语音信号的功率增大时,与检测出核心层解码语音信号的功率减少时相比,设定减弱衰减强度的衰减率。因此,能够根据核心层的功率变动的状态适当地调整扩展层的功率。 
另外,在本实施方式中,使用功率变动比作为用于检测核心层的功率变动的参数,但是可以使用的参数不限于此,能够使用与解码语音信号的功率有关的任何参数、变数。例如,在使用CELP方式作为核心层的语音编码方式时,也可以使用核心层的增益系数和声源信号的功率变动比作为核心层的功 率变动检测用的参数。 
此外,在本实施方式中,使用语音编码处理的时间单位即帧作为扩展层增益系数插值处理的时间单位,但是也可以使用比帧短的子帧作为扩展层增益系数插值处理的时间单位。 
(实施方式2) 
图6是表示本发明实施方式2的可扩展解码装置的结构的方框图。另外,在本实施方式中说明的可扩展解码装置具有与在实施方式1已说明的可扩展解码装置100相同的基本结构。因此,对与在实施方式1已说明的构成要素相同的构成要素赋予相同的参照标号,而且省略对其的详细说明。 
图6的可扩展解码装置200具有将可扩展解码装置100的语音分析单元106以及扩展层解码单元108置换为语音分析单元202以及扩展层解码单元204的结构。 
语音分析单元202具有与在实施方式1已说明的语音分析单元106不同的内部结构。具体而言,如图7所示,语音分析单元202除了具有在实施方式1已说明的当前帧功率计算单元120、过去帧功率存储单元122以及功率变动比计算单元124以外,还具有当前扩展层帧功率计算单元210、扩展层影响度计算单元212以及扩展层影响度存储单元214。 
当前扩展层帧功率计算单元210使用下面的式(8),计算当前帧的扩展层解码语音信号的功率。 
POWenh [ t ] = Σ i = 0 L _ FRAME - 1 ( Oe [ i ] * Oe [ i ] ) . . . ( 8 )
其中,POWenh[t]表示帧t中的扩展层解码语音信号的功率。此外,Oe[i]表示样本序号i的扩展层解码语音信号。 
扩展层影响度计算单元212计算扩展层解码语音信号相对于从可扩展解码装置200输出的输出语音信号的影响度。在本实施方式中,扩展层影响度计算单元212计算当前帧的扩展层解码语音信号的功率POWenh[t]与当前帧的核心层解码语音信号的功率POWcore[t]之比。也就是说,该比值越大,所述影响度越大。在影响度的计算中,使用下面的式(9)。 
PI[t]=POWenh[t]/POWcore[t]  ...(9) 
其中,PI[t]表示帧t中的扩展层的影响度。 
扩展层影响度存储单元214存储由扩展层影响度计算单元212计算出的影响度。将在扩展层影响度存储单元214中所存储的影响度与由功率变动比计算单元124计算出的功率变动比一起作为分析信息被输出到扩展层解码单元204。在扩展层影响度存储单元214中所存储的影响度在后续的帧中,作为前面的影响度例如PI[t-1]而被参照。 
扩展层解码单元204具有与在实施方式1已说明的扩展层解码单元108不同的内部结构。如图8所示,扩展层解码单元204具有将扩展层解码单元108的构成要素中的扩展层增益解码单元131置换为扩展层增益解码单元220的结构。 
扩展层增益解码单元220具有与在实施方式1已说明的扩展层增益解码单元131不同的内部结构。如图9所示,扩展层增益解码单元220具有将扩展层增益解码单元131的构成要素中的增益衰减率计算单元140置换为增益衰减率计算单元230的结构。 
被通知了正常接收扩展层编码数据即loss[t]=1时,增益衰减率计算单元230决定增益衰减率Gatt[t]为“1.0”。 
此外,被通知了扩展层编码数据丢失即loss[t]=0时,增益衰减率计算单元230基于扩展层丢失信息loss[t]以及分析信息来设定从增益选择单元142输入的码增益系数Gec[t]以及音调增益系数Gep[t]的各个衰减强度。衰减强度的设定与实施方式1相同,通过计算增益衰减率Gatt[t]来实现。最好是,增益衰减率计算单元230基于功率变动比PCratio[t]设定有关码增益系数Gec[t]的衰减强度,不仅基于功率变动比PCratio[t]而且基于影响度PI[t-1]设定有关音调增益系数Gep[t]的衰减强度。 
具体而言,在扩展层解码语音信号的影响度高且扩展层解码语音信号的音质由于插值而恶化了的情况下,因为出现异音感的可能性高,所以需要对扩展层解码语音信号的功率进行衰减。此外,在扩展层解码语音信号的影响度高的情况下,由于功率没有集中在核心层解码语音信号,所以在语音区段中,主要包含的是背景噪声区段和辅音区段而不是音调周期分量明显出现的元音区段。因此,此时,最好对反复使用前面的声源信号的自适应码本输出的增益系数即音调增益系数进行衰减。因此,例如,影响度PI[t-1]在规定值以上时,与影响度PI[t-1]低于规定值时相比,增益衰减率计算单元230增加有关音调增益系数Gep[t]的衰减强度。然后,将有关为了实现这样的控制而对音调 增益系数Gep[t]设定的增益衰减率Gatt[t]被输出到增益衰减单元143。 
另一方面,在扩展层解码语音信号的影响度低时,因为功率集中在核心层解码语音信号,即使扩展层解码语音信号的音质由于插值而恶化,其恶化也不明显。此外,在功率集中在核心层解码语音信号时,语音区段包含元音区段。此时,由于可代表用核心层不能完全代表的音调周期分量,所以即使在扩展层中也明显出现音调周期分量。在这种情况下,出现异音感的可能性低。因此,在影响度PI[t-1]低于规定值时,与影响度PI[t-1]在规定值以上时相比,增益衰减率计算单元230降低有关音调增益系数Gep[t]的衰减强度。然后,为了实现这样的控制而对音调增益系数Gep[t]设定的增益衰减率Gatt[t]被输出到增益衰减单元143。 
另外,在扩展层解码语音信号的影响度PI[t-1]低于规定值时,增益衰减率计算单元230也可以将运算变更指示输出到增益衰减单元143以实现下面的式(10)所示的运算,来代替设定有关音调增益系数Gep[t]的增益衰减率Gatt[t]后输出到增益衰减单元143。 
Gep [ t ] = Gep [ t - 1 ] * Gatt [ t ] * &beta; if PI [ t - 1 ] &GreaterEqual; &epsiv; &gamma; K if PI [ t - 1 ] < &epsiv; . . . ( 10 )
其中,ε为阈值,γ为低于1.0的常数,K为扩展层编码数据的连续丢失的帧数。将γ设定为接近1.0的值后,能够抑制音调增益系数Gep[t]的衰减。 
这样,根据本实施方式,根据扩展层解码语音信号的影响度而可变地设定衰减强度。因此,在扩展层解码语音信号的音质由于插值而劣化时,能够衰减扩展层增益系数,以使扩展层解码语音信号的功率对应于核心层解码语音信号的功率相对地降低,并能够防止出现异音感。 
另外,在本实施方式中,使用语音编码处理的时间单位即帧作为扩展层增益系数插值处理的时间单位,但是也可以使用比帧短的子帧作为扩展层增益系数插值处理的时间单位。 
(实施方式3) 
图10是表示本发明实施方式3的可扩展解码装置的结构的方框图。另外,在本实施方式说明的可扩展解码装置具有与在实施方式1已说明的可扩展解码装置100相同的基本结构。因此,对与在实施方式1已说明的构成要素相同的构成要素赋予相同的参照标号,而且省略对其的详细说明。 
图10的可扩展解码装置300具有将可扩展解码装置100的语音分析单元 106以及扩展层解码单元103置换为语音分析单元302以及扩展层解码单元304的结构。 
语音分析单元302具有与在实施方式1已说明的语音分析单元106不同的内部结构。具体而言,如图11所示,语音分析单元302除了具有已在实施方式1说明的当前帧功率计算单元120、过去帧功率存储单元122以及功率变动比计算单元124以外,还具有频带突变容许区段检测单元310。 
频带突变容许区段检测单元310对从核心层解码单元102输入的核心层解码语音信号进行分析,并基于分析结果检测容许区段。容许区段检测结果作为分析信息被输出到扩展层解码单元304。 
这里,容许区段是指即使输出语音信号的频带急剧地变化,听觉上的影响也小的区段,即输出语音信号的频带变化难以被收听者感觉的区段。相反,容许区段以外的区段为,输出语音信号的频带变化容易被收听者感觉的区段。因此,容许区段为容许输出语音信号的频带急剧变化的区段。 
频带突变容许区段检测单元310将(a)无音区段、(b)功率变动区段、(c)音质变化区段、(d)扩展层功率微小区段等作为容许区段来检测。 
(a)无音区段是核心层解码语音信号的功率非常小的区段。在无音区段中,即使是使扩展层解码语音信号的增益急剧地变化,也难以感觉到该变化。无音区段的检测通过检测核心层解码语音信号的功率在规定的阈值以下的区段来实现。在无音区段的检测中,例如使用下面的式(11)。在使用式(11)时,基于其计算结果输出容许区段检测结果d(t)。容许区段检测结果d(t)如下面的式(12)所示。 
Pc ( t ) = &Sigma; i = 0 L _ FRAME - 1 Oc ( i ) * Oc ( i ) . . . ( 11 )
Figure S2006800079411D00142
其中,t表示帧序号,Pc(t)表示帧t中的核心层解码语音信号的功率,L_FRAME表示帧的长度,i表示样本序号,Oc(i)表示核心层解码语音信号,d(t)表示帧t中的频带突变容许区段,ε表示阈值。另外,d(t)=1表示检测出容许区段,d(t)=0表示检测出非容许区段。 
(b)功率变动区段是核心层解码语音信号的功率较大地变动的区段。在功率变动区段中,听觉上难以感觉到的不大的变化(例如输出语音信号音色的变 化或频带感的变化)。或者,即使感觉到了,也不会使收听者有不协调感。因此,即使是使扩展层解码语音信号的增益急剧地变化,也很难感觉到该变化。功率变动区段的检测能够通过检测由功率变动比计算单元124计算出的功率变动比在规定的阈值以上的区段来实现。或者,基于例如使用下面的式(13)、(14)而计算出的短期以及长期的平滑化功率的结果,检测功率变动区段。此时,根据式(15)输出容许区段检测结果d(t)。 
Ps(t)=α*Ps(t)+(1-α)*Pc(t) ...(13) 
Pl(t)=β*Pl(t)+(1-β)*Pc(t) ...(14) 
Figure S2006800079411D00151
其中,Ps(t)表示短期平滑化功率,α表示短期平滑化系数,Pl(t)表示长期化功率,β(0.0≤α<β<1.0)表示长期平滑化系数,以及γ表示调整系数。 
或者,通过语音上升时的检测来实现功率变动区段的检测。 
(c)音质变化区段是核心层解码语音信号(或扩展层解码语音信号)的音质较大地变动的区段。在音质变化区段中,核心层解码语音信号(或扩展层解码语音信号)本身成为在听觉上失去时间连续性的状态。此时,即使扩展层解码语音信号的增益急剧地变化,也难以感觉到该变化。音质变化区段的检测可以通过检测在核心层解码语音信号(或扩展层解码语音信号)中所包含的背景噪声信号的种类的突变来实现。 
或者,音质变化区段的检测可以通过检测核心层编码数据的频谱参数(例如LSP)的变化来实现。例如,为了检测LSP的变化,将前面的LSP的各元素与当前的LSP的各元素之间的距离的合计值作为与规定的阈值相比较的结果,检测该距离的合计在阈值以上。此时,在音质变化区段的检测中,例如使用下面的式(16)。在使用式(16)时,容许区段检测结果d(t)基于其计算结果而被输出。容许区段检测结果d(t)用下面的式(17)来表示。 
dlsp ( t ) = &Sigma; m = 2 M ( lsp [ m ] - lsp [ m - 1 ] ) 2 . . . ( 16 )
其中,lsp表示核心层的LSP系数,M表示核心层的线性预测系数的分 析阶数,m表示LSP的元素序号,dlsp表示相邻元素间的距离,A表示阈值。 
或者,频带突变容许区段检测单元310也可将因核心层帧差错(或扩展层帧差错)而对核心层解码语音信号(或扩展层解码语音信号)进行插值处理后的规定数的帧作为音质变化区段来检测。 
(d)扩展层功率微小区段是扩展层解码语音信号的功率非常小的区段。在扩展层功率微小区段中,即使是使输出语音信号的频带急剧地变化,也很难感觉到该变化。因此,即使是使扩展层解码语音信号的增益急剧地变化,也难以感觉到该变化。在扩展层解码语音信号的功率在规定的阈值以下时,能够检测扩展层功率微小区段。 
或者,扩展层功率微小区段的检测能够通过检测扩展层解码语音信号的功率相对于核心层解码语音信号的功率的比在规定值以下的区段来实现。此时,在扩展层功率微小区段的检测中,例如使用下面的式(18)。在使用式(18)时,容许区段检测结果d(t)基于其计算结果而被输出。容许区段检测结果d(t)用下面的式(19)来表示。 
Pe ( t ) = &Sigma; i = 0 L _ FRAME - 1 Oe ( i ) * Oe ( i ) . . . ( 18 )
Figure S2006800079411D00162
其中,Oe(i)表示扩展层解码语音信号,Pe(t)表示扩展层解码语音信号的功率,B和C表示阈值。 
扩展层解码单元304具有与在实施方式1已说明的扩展层解码单元108不同的内部结构。如图12所示,扩展层解码单元304具有将扩展层解码单元108的构成要素中的扩展层增益解码单元131置换为扩展层增益解码单元320的结构。 
扩展层增益解码单元320具有与在实施方式1已说明的扩展层增益解码单元131不同的内部结构。如图13所示,扩展层增益解码单元320具有将扩展层增益解码单元131的内部结构中的增益选择单元142置换为增益选择单元330的结构。 
仅在扩展层编码数据丢失结束且返回到正常接收扩展层编码数据状态后的扩展层功率恢复期间,增益选择单元330实施与增益选择单元142不同的动 作。 
在扩展层功率恢复期间,增益选择单元330根据频带突变容许区段检测单元310的输出即容许区段检测结果d(t)的数值,切换所输出的扩展层增益系数。 
在容许区段检测结果d(t)的值为1时,即检测出容许区段时,由于频带的突变难以被感觉到,与容许区段检测结果d(t)的值为0时(即检测出非容许区段时)相比,增益选择单元330决定使扩展层解码语音信号的功率迅速恢复的扩展层增益系数。 
对于音调增益系数Gep[t],扩展层功率恢复期间在容许区段内时,增益选择单元330将由在扩展层增益码本解码单元141的解码所获得的音调增益系数DGep[t]决定为当前帧的音调系数Gep[t]。另一方面,扩展层功率恢复期间在容许区段外时,音调增益系数DGep[t]以及在过去增益存储单元144中所存储的过去帧的音调增益系数例如Gep[t-1]的加权相加结果被决定为当前帧的音调增益系数Gep[t]。该决定方法可通过下面的式(20)来表示。 
Gep [ t ] = DGep [ t ] if d [ t ] = 1 ( DGep [ t ] + Gep [ t - 1 ] ) / 2 if d [ t ] = 0 . . . ( 20 )
对于码增益系数Gec[t],扩展层功率恢复期间在容许区段内时,增益选择单元330将通过扩展层增益码本解码单元141的解码所获得的码增益系数DGec[t]以及在过去增益存储单元144中所存储的过去帧的码增益系数例如Gec[t-1]的加权相加结果,决定为当前帧的码增益系数Gec[t]。另一方面,在扩展层功率恢复期间在容许区段外时,将由解码所获得的码增益系数Gec[t]以及过去帧的码增益系数例如Gec[t-1]中的具有更小值的系数,决定为当前帧的码增益系数Gec[t]。该决定方法可通过下面的式(21)来表示。 
Gec [ t ] = ( DGec [ t ] + Gec [ t - 1 ] ) / 2 if d [ t ] = 1 min ( DGec [ t ] , Gec [ t - 1 ] ) if d [ t ] = 0 . . . ( 21 )
接着,说明由具有上述结构的可扩展解码装置300的扩展层增益解码单元320进行的扩展层增益系数控制动作。在此,使用图14A、图14B说明两个动作例。 
在图14A、图14B中,横轴是时间轴。在各图中所描绘的波形表示解码语音信号(核心层解码语音信号或扩展层解码语音信号)的功率的变动,时间轴下方的一个波形表示扩展层丢失信息的值的变动,另一个波形表示容许区段检测结果的值的变动。 
参照图14A所示的例子时可见,从时刻T6至时刻T7,扩展层处于丢失状态。此外,从时刻T7经过相当长时间后的时点T8开始直至时点T9为止的区段为频带突变的容许区段。在本例中,时刻T7以后的扩展层功率恢复期间D1属于非容许区段,而在容许区段外。因此,在扩展层增益解码单元320中,增益选择单元330决定以使扩展层解码语音信号的功率比较缓慢地恢复的扩展层增益系数。 
参照图14B所示的例子时可见,与所述的例子相同,从时刻T6至时刻T7,扩展层处于丢失状态。此外,从时刻T10开始直至时刻T11为止的区段为频带突变的容许区段,与所述的丢失状态的期间的后半部分相重复。也就是说,在本例中,时刻T7以后的扩展层功率恢复期间D2在容许区段内。因此,在扩展层增益解码单元320中,增益选择单元330决定扩展层增益系数以使扩展层解码语音信号的功率迅速恢复。因此,扩展层功率恢复期间D2比扩展层功率恢复期间D1的期间长度短。 
这样,根据本实施方式,扩展层功率恢复期间在频带突变的容许区段内时,与扩展层功率恢复期间在容许区段外时相比,决定使扩展层解码语音信号的功率迅速恢复的扩展层增益系数。由此,在频带突变被容许期间,由于能够迅速恢复扩展层解码语音信号的功率,所以能够不给收听者有频带变动感和异音感而将输出语音信号的频带从窄带迅速恢复到宽带。 
另外,在本实施方式中,举例说明了将具有根据是在容许区段内还是在容许区段外来控制扩展层增益系数的特征的结构组装到在实施方式1已说明的结构的情况,但是也可将具有该特征的结构组装到在实施方式2已说明的结构。 
此外,在本实施方式中,使用语音编码处理的时间单位即帧作为扩展层增益系数控制处理的时间单位,但是也可以使用比帧短的子帧作为扩展层增益系数控制处理的时间单位。 
另外,在上述各实施方式的说明中使用的各功能块典型地通过集成电路的LSI来实现。它们既可以被单独地集成为一个芯片,也可以包含一部分或全部地单芯片化。 
这里为LSI,而根据集成度的不同,有时也称为IC、系统LSI、超级LSI、超大LSI。 
此外,集成电路化的方法不限定于LSI,可以通过专用电路或通用处理器 实现。也可以利用在LSI制造后能够编程的FPGA(Field Programmable GateArray,现场可编程门阵列)、或可以利用可对LSI内部的电路块的连接或设定进行重新构置的可重构置处理器(Reconfigurable Processor)。 
再有,如果随着半导体技术的进步或者其他技术的派生,出现了取代LSI集成电路化的技术,当然也可以利用该技术来实现功能块的集成化。也有适用生物技术等的可能性。 
本说明书基于2005年3月14日申请的日本专利申请第2005-071504号。其内容全部包含于此。 
产业上的可利用性 
本发明的可扩展解码装置以及可扩展解码方法在被进行了分层编码的信号(语音信号、音频信号等)的解码中是有用的。 

Claims (15)

1.一种可扩展解码装置,用于对核心层编码信息和包含扩展层增益系数的扩展层编码信息进行解码,该可扩展解码装置包括:
核心层解码单元,对所述核心层编码信息进行解码,以生成核心层解码语音信号;
当前帧功率计算单元,计算通过所述核心层解码单元得到的核心层解码语音信号的当前帧的功率;
过去帧功率存储单元,存储所需帧数的、由所述当前帧功率计算单元计算出的当前帧功率;
功率变动比计算单元,将由所述当前帧功率计算单元计算出的当前帧功率与由所述过去帧功率存储单元存储的过去帧功率相比较,以检测核心层解码信号的功率的变动;
增益衰减率计算单元,根据所检测出的功率的变动而可变地计算衰减强度,以在检测出核心层解码信号的功率减少时,与检测出核心层解码信号的功率增大时相比,增大衰减强度,在检测出核心层解码信号的功率增大时,与检测出核心层解码信号的功率减少时相比,减小衰减强度;以及
增益衰减单元,在正常接收扩展层编码信息时,不衰减扩展层增益系数而直接输出,在当前帧的扩展层编码信息丢失时,将当前帧之前的过去帧的扩展层增益系数根据所设定的衰减强度进行衰减,并将当前帧的扩展层增益系数进行插值。
2.如权利要求1所述的可扩展解码装置,其中,所述增益衰减率计算单元在检测出核心层解码信号的功率增大时和检测出核心层解码信号的功率减少时获得相互不同的衰减强度。
3.如权利要求1所述的可扩展解码装置,其中,所述功率变动比计算单元将核心层解码信号的短期平滑化功率与核心层解码信号的长期平滑化功率相比较,检测功率的变动。
4.如权利要求1所述的可扩展解码装置,其中,还包括:
当前扩展层帧功率计算单元,计算从所述扩展层编码信息得到的扩展层解码语音信号的当前帧的功率;以及
扩展层影响度计算单元,计算由所述当前扩展层帧功率计算单元计算出的当前扩展层帧功率与由所述当前帧功率计算单元计算出的当前帧功率之比,
所述增益衰减率计算单元根据计算出的功率比而可变地设定衰减强度,在计算出的功率比大于规定值时,与计算出的功率比小于规定值时相比,增大衰减强度,在计算出的功率比小于规定值时,与计算出的功率比大于规定值时相比,减小衰减强度。
5.如权利要求1所述的可扩展解码装置,其中,还包括:
频带突变容许区段检测单元,对通过所述核心层解码单元得到的、核心层解码信号进行分析,根据分析结果检测容许频带变化的容许区段,以及
增益选择单元,在通过所述频带突变容许区段检测单元得到区间检测结果为1的容许区段的情况下,与通过所述区段检测单元得到区间检测结果为0的非容许区段的情况相比,决定使扩展层解码信号的功率迅速恢复的扩展层增益系数。
6.如权利要求5所述的可扩展解码装置,其中,
解码信号为语音信号,
所述频带突变容许区段检测单元将无音区段检测为容许区段。
7.如权利要求5所述的可扩展解码装置,其中,
所述频带突变容许区段检测单元将核心层解码信号的功率在规定电平以下的区段检测为容许区段。
8.如权利要求5所述的可扩展解码装置,其中,
所述频带突变容许区段检测单元将扩展层解码信号的功率在规定电平以下的区段检测为容许区段。
9.如权利要求5所述的可扩展解码装置,其中,
所述频带突变容许区段检测单元将扩展层解码信号的功率与核心层解码信号的功率之比在规定电平以下的区段检测为容许区段。
10.如权利要求5所述的可扩展解码装置,其中,
所述频带突变容许区段检测单元将通过所述变动检测单元而检测出的功率变动在规定电平以上的区段检测为容许区段。
11.如权利要求5所述的可扩展解码装置,其中,
解码信号为语音信号,
所述频带突变容许区段检测单元将语音上升时检测为容许区段。
12.如权利要求5所述的可扩展解码装置,其中,
解码信号为语音信号,
所述频带突变容许区段检测单元将在语音信号中所包含的背景噪声的种类变化的区段检测为容许区段。
13.如权利要求5所述的可扩展解码装置,其中,
解码信号为语音信号,
所述频带突变容许区段检测单元将语音信号的频谱变化在规定电平以上的区段检测为容许区段。
14.如权利要求5所述的可扩展解码装置,其中,
所述频带突变容许区段检测单元将进行了核心层解码信号的插值之后的区段检测为容许区段。
15.一种可扩展解码方法,用于对核心层编码信息和包含扩展层增益系数的扩展层编码信息进行解码,该可扩展解码方法包括:
核心层解码步骤,对所述核心层编码信息进行解码,以生成核心层解码语音信号;
当前帧功率计算步骤,计算在所述核心层解码步骤中得到的核心层解码语音信号的当前帧的功率;
过去帧功率存储步骤,存储所需帧数的、在所述当前帧功率计算步骤中计算出的当前帧功率;
功率变动比计算步骤,将在所述当前帧功率计算步骤中计算出的当前帧功率与在所述过去帧功率存储步骤中存储的过去帧功率相比较,以检测核心层解码信号的功率变动;
增益衰减率计算步骤,根据检测出的功率变动而可变地计算衰减强度,以在检测出核心层解码信号的功率减少时,与检测出核心层解码信号的功率增大时相比,增大衰减强度,在检测出核心层解码信号的功率增大时,与检测出核心层解码信号的功率减少时相比,减小衰减强度;以及
增益衰减步骤,在正常接收扩展层编码信息时,不衰减扩展层增益系数而直接输出,在当前帧的扩展层编码信息丢失时,将当前帧之前的过去帧的扩展层增益系数根据所设定的衰减强度进行衰减,并将当前帧的扩展层增益系数进行插值。
CN2006800079411A 2005-03-14 2006-03-13 可扩展解码装置和可扩展解码方法 Expired - Fee Related CN101138174B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP2005071504 2005-03-14
JP071504/2005 2005-03-14
PCT/JP2006/304902 WO2006098274A1 (ja) 2005-03-14 2006-03-13 スケーラブル復号化装置およびスケーラブル復号化方法

Publications (2)

Publication Number Publication Date
CN101138174A CN101138174A (zh) 2008-03-05
CN101138174B true CN101138174B (zh) 2013-04-24

Family

ID=36991616

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006800079411A Expired - Fee Related CN101138174B (zh) 2005-03-14 2006-03-13 可扩展解码装置和可扩展解码方法

Country Status (4)

Country Link
US (1) US8160868B2 (zh)
JP (1) JP4846712B2 (zh)
CN (1) CN101138174B (zh)
WO (1) WO2006098274A1 (zh)

Families Citing this family (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
FR2897977A1 (fr) * 2006-02-28 2007-08-31 France Telecom Procede de limitation de gain d'excitation adaptative dans un decodeur audio
WO2008023682A1 (fr) 2006-08-22 2008-02-28 Panasonic Corporation Décodeur de sortie pondéré, décodeur itératif et procédé de calcul de valeur de décision pondérée
US7461106B2 (en) 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
CN101206860A (zh) * 2006-12-20 2008-06-25 华为技术有限公司 一种可分层音频编解码方法及装置
EP2116998B1 (en) * 2007-03-02 2018-08-15 III Holdings 12, LLC Post-filter, decoding device, and post-filter processing method
US8570869B2 (en) * 2007-09-21 2013-10-29 Nokia Corporation Scalable error detection and cross-session timing synchronization for packet-switched transmission
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
CN101207665B (zh) * 2007-11-05 2010-12-08 华为技术有限公司 一种衰减因子的获取方法
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
US8660851B2 (en) * 2009-05-26 2014-02-25 Panasonic Corporation Stereo signal decoding device and stereo signal decoding method
WO2010137692A1 (ja) * 2009-05-29 2010-12-02 日本電信電話株式会社 符号化装置、復号装置、符号化方法、復号方法及びそのプログラム
WO2011155144A1 (ja) 2010-06-11 2011-12-15 パナソニック株式会社 復号装置、符号化装置及びこれらの方法
WO2012144128A1 (ja) 2011-04-20 2012-10-26 パナソニック株式会社 音声音響符号化装置、音声音響復号装置、およびこれらの方法
CN108364657B (zh) 2013-07-16 2020-10-30 超清编解码有限公司 处理丢失帧的方法和解码器
CN105225666B (zh) * 2014-06-25 2016-12-28 华为技术有限公司 处理丢失帧的方法和装置
KR102366988B1 (ko) * 2014-07-03 2022-02-25 한국전자통신연구원 레이어드 디비전 멀티플렉싱을 이용한 신호 멀티플렉싱 장치 및 신호 멀티플렉싱 방법
CN110545575B (zh) * 2016-04-23 2022-06-21 上海朗帛通信技术有限公司 一种窄带移动通信的方法和装置
JP6962269B2 (ja) * 2018-05-10 2021-11-05 日本電信電話株式会社 ピッチ強調装置、その方法、およびプログラム

Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473727A (en) * 1992-10-31 1995-12-05 Sony Corporation Voice encoding method and voice decoding method
CN1451155A (zh) * 1999-09-22 2003-10-22 科恩格森特系统股份有限公司 多模式语音编码器

Family Cites Families (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5894473A (en) * 1996-02-29 1999-04-13 Ericsson Inc. Multiple access communications system and method using code and time division
US6252915B1 (en) * 1998-09-09 2001-06-26 Qualcomm Incorporated System and method for gaining control of individual narrowband channels using a wideband power measurement
US7315815B1 (en) * 1999-09-22 2008-01-01 Microsoft Corporation LPC-harmonic vocoder with superframe structure
ATE336780T1 (de) 1999-11-23 2006-09-15 Texas Instruments Inc Verschleierungsverfahren bei verlust von sprachrahmen
US6826527B1 (en) 1999-11-23 2004-11-30 Texas Instruments Incorporated Concealment of frame erasures and method
US6445696B1 (en) * 2000-02-25 2002-09-03 Network Equipment Technologies, Inc. Efficient variable rate coding of voice over asynchronous transfer mode
EP1199709A1 (en) * 2000-10-20 2002-04-24 Telefonaktiebolaget Lm Ericsson Error Concealment in relation to decoding of encoded acoustic signals
US6968309B1 (en) * 2000-10-31 2005-11-22 Nokia Mobile Phones Ltd. Method and system for speech frame error concealment in speech decoding
AU2002218520A1 (en) 2000-11-30 2002-06-11 Matsushita Electric Industrial Co., Ltd. Audio decoder and audio decoding method
JP3806344B2 (ja) 2000-11-30 2006-08-09 松下電器産業株式会社 定常雑音区間検出装置及び定常雑音区間検出方法
ATE296007T1 (de) * 2001-01-31 2005-06-15 Teldix Gmbh Modularer skalierbarer switch und verfahren zum verteilen schneller ethernet-datenrahmen
US7617096B2 (en) * 2001-08-16 2009-11-10 Broadcom Corporation Robust quantization and inverse quantization using illegal space
US7610198B2 (en) * 2001-08-16 2009-10-27 Broadcom Corporation Robust quantization with efficient WMSE search of a sign-shape codebook using illegal space
US7647223B2 (en) * 2001-08-16 2010-01-12 Broadcom Corporation Robust composite quantization with sub-quantizers and inverse sub-quantizers using illegal space
JP2003241799A (ja) * 2002-02-15 2003-08-29 Nippon Telegr & Teleph Corp <Ntt> 音響符号化方法、復号化方法、符号化装置、復号化装置及び符号化プログラム、復号化プログラム
CA2388439A1 (en) 2002-05-31 2003-11-30 Voiceage Corporation A method and device for efficient frame erasure concealment in linear predictive based speech codecs
JP4578145B2 (ja) 2003-04-30 2010-11-10 パナソニック株式会社 音声符号化装置、音声復号化装置及びこれらの方法
US7668712B2 (en) * 2004-03-31 2010-02-23 Microsoft Corporation Audio encoding and decoding with intra frames and adaptive forward error correction
WO2006009074A1 (ja) * 2004-07-20 2006-01-26 Matsushita Electric Industrial Co., Ltd. 音声復号化装置および補償フレーム生成方法
JP4989971B2 (ja) * 2004-09-06 2012-08-01 パナソニック株式会社 スケーラブル復号化装置および信号消失補償方法

Patent Citations (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5473727A (en) * 1992-10-31 1995-12-05 Sony Corporation Voice encoding method and voice decoding method
CN1451155A (zh) * 1999-09-22 2003-10-22 科恩格森特系统股份有限公司 多模式语音编码器

Also Published As

Publication number Publication date
US20090061785A1 (en) 2009-03-05
CN101138174A (zh) 2008-03-05
WO2006098274A1 (ja) 2006-09-21
JPWO2006098274A1 (ja) 2008-08-21
US8160868B2 (en) 2012-04-17
JP4846712B2 (ja) 2011-12-28

Similar Documents

Publication Publication Date Title
CN101138174B (zh) 可扩展解码装置和可扩展解码方法
EP1747554B1 (en) Audio encoding with different coding frame lengths
US8010351B2 (en) Speech coding system to improve packet loss concealment
CN101213590B (zh) 可扩展解码装置及丢失数据插值方法
US8244525B2 (en) Signal encoding a frame in a communication system
KR101246991B1 (ko) 오디오 신호 처리 방법
ES2380962T3 (es) Procedimiento y aparato para codificación de baja tasa de transmisión de bits de habla sorda de alto rendimiento
EP2290815B1 (en) Method and system for reducing effects of noise producing artifacts in a voice codec
KR101525185B1 (ko) 트랜지언트 검출 및 품질 결과를 사용하여 일부분의 오디오 신호를 코딩하기 위한 장치 및 방법
KR101698905B1 (ko) 정렬된 예견 부를 사용하여 오디오 신호를 인코딩하고 디코딩하기 위한 장치 및 방법
US20090006084A1 (en) Low-complexity frame erasure concealment
US20040049380A1 (en) Audio decoder and audio decoding method
US20050091048A1 (en) Method for packet loss and/or frame erasure concealment in a voice communication system
KR101701081B1 (ko) 제 1 오디오 인코딩 알고리즘 및 제 2 오디오 인코딩 알고리즘 중 하나를 선택하기 위한 장치 및 방법
ES2253226T3 (es) Codigo interpolativo multipulso de tramas de voz.
US6564182B1 (en) Look-ahead pitch determination
Jelinek et al. On the architecture of the cdma2000/spl reg/variable-rate multimode wideband (VMR-WB) speech coding standard
McCree et al. E-mail:[mccree| demartin]@ csc. ti. com

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
ASS Succession or assignment of patent right

Owner name: MATSUSHITA ELECTRIC (AMERICA) INTELLECTUAL PROPERT

Free format text: FORMER OWNER: MATSUSHITA ELECTRIC INDUSTRIAL CO, LTD.

Effective date: 20140716

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20140716

Address after: California, USA

Patentee after: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

Address before: Osaka Japan

Patentee before: Matsushita Electric Industrial Co.,Ltd.

TR01 Transfer of patent right

Effective date of registration: 20170525

Address after: Delaware

Patentee after: III Holdings 12 LLC

Address before: California, USA

Patentee before: PANASONIC INTELLECTUAL PROPERTY CORPORATION OF AMERICA

TR01 Transfer of patent right
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20130424

CF01 Termination of patent right due to non-payment of annual fee