CN1136850A - 确定副带声频编码器的副带掩蔽电平的方法和装置及系统 - Google Patents

确定副带声频编码器的副带掩蔽电平的方法和装置及系统 Download PDF

Info

Publication number
CN1136850A
CN1136850A CN95191014A CN95191014A CN1136850A CN 1136850 A CN1136850 A CN 1136850A CN 95191014 A CN95191014 A CN 95191014A CN 95191014 A CN95191014 A CN 95191014A CN 1136850 A CN1136850 A CN 1136850A
Authority
CN
China
Prior art keywords
subband
frequency
signal
audio frame
signal level
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN95191014A
Other languages
English (en)
Inventor
詹姆斯·伦纳德·菲奥卡
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Motorola Solutions Inc
Original Assignee
Motorola Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Motorola Inc filed Critical Motorola Inc
Publication of CN1136850A publication Critical patent/CN1136850A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L25/00Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00
    • G10L25/03Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters
    • G10L25/18Speech or voice analysis techniques not restricted to a single one of groups G10L15/00 - G10L21/00 characterised by the type of extracted parameters the extracted parameters being spectral information of each sub-band

Abstract

通过本发明有效地计算出在副带声频编码器中的一个特定副带的掩蔽电平。第一步是根据一个声频帧计算出每个副带的信号电平(102)。然后,根据多个信号电平,一个偏移函数,和一个加权函数计算出特定副带的掩蔽电平(104)。

Description

确定副带声频编码器的副带 掩蔽电平的方法和装置及系统
本发明一般涉及一个声频压缩系统中的副带(subband)声频编码器,特别是涉及一种对在一个副带声频编码器中对一个副带的掩蔽电平的低复杂性的计算。
已知通信系统包括多个通信装置和通信信道,这为通信装置提供了通信媒质。为了提高通信系统的效率,需要对被传达的声频进行数字压缩。数字压缩减少了表达声频所需的比特数,而又能保持声频的感知质量。比特数的减少使得能够更为有效地利用信道带宽和减少存储需求。为完成声频压缩,每个通信装置可以包括一个编码器和一个解码器。编码器使通信装置在声频通过通信信道发送之前压缩该声频。解码器使通信装置能够从一个通信信道接收压缩的声频,和使其可以听到。可能使用数字声频压缩的通信装置包括:高清晰度电视发射机和接收机、有线电视发射机和接收机、便携式无线电设备和蜂窝电话机等。
副带编码器把将要编码的信号的频谱划分为几个不同的副带。在一个特定副带中的信号的量值可以被用于压缩该信号。
一个现有的副带声频编码器的例子是国际标准组织国际电子技术委员会(ISO/IEC)11172-3国际标准,下文称为MPEG(Moving Picture Experts Group)声频。MPEG声频根据副带的掩蔽噪声比(signal-to-mask ratio,缩写为MNR)将比特分配给每个副带。MNR是由信号噪声比(SNR)减去信号掩蔽比(SMR)得到的。SMR是由信号电平(SL)减去掩蔽电平(ML)得出的。SL、ML、SNR和MNR是通过一个音质单元(psychoacoustic unit)确定的。音质单元一般是一个声频编码器中最复杂的元件,而掩蔽电平计算单元一般是一个音质单元中最复杂的元件。音质单元也是决定声频编码器的感知质量的最为关键的元件,掩蔽电平的计算精度对于音质单元的精度是至关重要的。
据此,需要有一种在MPEG声频之类的声频压缩系统中在保持高的感知质量的同时减低掩蔽电平计算复杂性的方法、装置和系统。
图1是根据本发明的执行一种在副带声频编码器中确定对一个副带的掩蔽电平的方法的流程图。
图2是更为详细显示的根据本发明的利用一个滤波器组对每个副带确定一个信号电平的步骤的流程图。
图3是更为详细显示的根据本发明的利用一个高解析度变频器对每个副带确定一个信号电平的步骤的流程图。
图4是更为详细显示的根据本发明的根据多个信号电平,一个偏移函数和一个加权函数计算掩蔽电平的步骤的流程图。
图5是根据本发明的几种例子的掩蔽曲线图。
图6是一个带有根据本发明提供的一个滤波器组的装置的方框图。
图7是带有一个根据本发明提供的高解析度变频器的装置的方框图。
图8是带有一个根据本发明提供的装置的一个系统的实施例的方框图。
图9是带有一个根据本发明提供的装置的一个系统的替代实施例的方框图。
本发明提供了一种利用较少存储器和较为简单的在一个副带声频编码系统中为一个频率副带确定掩蔽电平的方法、装置和系统。第一步是根据一个声频帧确定每个副带的信号电平。然后根据多个信号电平,一个偏移函数和一个加权函数计算一个副带的掩蔽电平。使用本发明可以有效地计算出副带声频编码器中副带的掩蔽电平。
参考图1-6对本发明进行更为全面的描述。图1以标号100示出根据本发明实施的在一个副带声频编码器中确定一个副带的掩蔽电平的方法的流程图。本方法一般是在一个音质单元中执行的。首先,接收声频帧(例如,脉码调制(PCM)声频),并根据声频帧确定每个副带的一个信号电平(102)。然后,根据多个信号电平、一个偏移函数和一个加权函数,计算出一个特定副带的掩蔽电平(104)。
图2以标号200更为详细显示根据本发明的利用一个滤波器组对每个副带确定一个信号电平的步骤的流程图。使用滤波器组过滤声频帧,以产生每个副带的一个或多个副带抽样(202)。通过把一个给定的副带的每个副带抽样的平方相加,然后取所得到的和的对数(以10为底),计算出信号电平(204)。得到的信号电平是在一个给定声频帧中的每个副带的相关能(分贝)的十分可靠的度量。副带抽样是一个滤波器组的输出。滤波器组输出的每个副带的抽样数是声频编码器的帧的大小的函数。这种信号电平的计算方法是很简单的,因为它没有包括一个额外的变频器。下面的方程总结了对每个副带的信号电平的计算: SL ( sb ) = 10 * log 10 { Σ s = 0 nsamp - 1 S ( sb - s ) 2 } 其中sb是一个副带编号,s是一个副带抽样编号,S(sb,s)是副带sb的副带抽样s,nsamp是每个副带的副带抽样数。
图3以标号300更为详细显示根据本发明的利用一个变频器对每个副带确定一个信号电平的步骤的流程图。可以用离散傅里叶变换(DFT)来完成频率变换。利用下面的方程式,一个DFT将产生每个副带的一个或多个频域输出(302): X ( k ) = 10 * log 10 { | &Sigma; n = 0 N - 1 x ( n ) e - J 2 &pi;nk N | 2 } ; 0 &le; k < N 2 其中x(n)是一个声频帧的时域输入抽样,X(k)是变换的频域输出,N是变换的大小。频率抽样数N可以比副带数sb大。例如,如果N=512,sb=32,每个副带sb中必将有8个X(k)。然后每个副带的信号电平可以作为X(k)的一个最小值,一个最大值,或一个平均值算出(304),X(k)以下列各式的形式归于副带:
1)  SL(sb)=min[X(k)]    ;k∈sb2)  SL(sb)=max[X(k)]    ;k∈sb 3 ) - - - SL ( sb ) = 10 &times; log 10 &Sigma; k 10 X ( k ) 10 ; k &Element; sb
图4以标号400更为详细的显示根据本发明的根据多个信号电平、一个偏移函数和一个加权函数计算掩蔽电平的步骤的流程图。首先从一个查阅表中确定每个与一个特定副带有关的,满足一个距离要求的副带的加权函数(步骤402)。加权函数和距离要求将在以后参考标号500的图5加以讨论。然后对每个副带通过查阅表确定出信号电平的反对数(步骤404)。每个副带的加权函数与信号电平的反对数相乘,得出多个积(步骤406)。接着累加这些积,得出最后的和(步骤408),并确定最后的和的对数(步骤410)。通过查阅表确定该特定副带的偏移函数(步骤412)。偏移函数是副带的静噪阈值和吠音值的函数。最终将最后的和的对数与偏移函数相加,得出掩蔽电平(步骤414)。
掩蔽电平的计算可以总结为下式: ML ( sb ) = 10 * log 10 { &Sigma; k = k _ init k _ init + unm _ k wf ( sb , k ) * 1 0 SL ( k ) 10 } + of ( sb ) 其中wf(sb,k)是与特定副带sb相关的副带k的加权函数,of(sb)是特定副带sb的偏移函数,SL(k)是副带k的信号电平,k是代表满足距离要求的副带的范围附标,k_init是第一个满足距离要求的副带,num_k是满足距离要求的副带的数。偏移函数用下面的方程式确定:
of(sb)=0.5*LTq(sb)-0.225*z(sb)+40    ;sb>0
of(sb)=0.5*LTq(sb)-0.225*z(sb)       ;sb=0其中LTq(sb)是副带sb的静噪阈值,z(sb)是副带sb的吠音(bark)值。副带0(人类耳朵最为敏感的副带)的偏移函数不加常数40,以进一步强调副带0对人类耳朵的重要性。
图5以标号500示出根据本发明的几种例子的掩蔽曲线图。确定加权函数wf(sb,k)需要掩蔽曲线。掩蔽曲线评估在一个频率上的信号能对在另一频率上的信号能对人类耳朵感知度的掩蔽程度。由于吠音标度代表人类耳朵感知到的线性频率(即,人类耳朵对低频区的微小变化比高频区更为敏感),因此频率标度从绝对频率转变为吠音频率。一个副带的吠音频率与特定副带的吠音频率的距离越大,则其对特定频率的掩蔽越小。标为“dz”的独立轴(502)是一个副带的吠音频率与特定副带的吠音频率的距离(以吠音频率表示),以下式给出:
dz=z(sb)-z(k)其中z(k)是对应于一个掩蔽副带的吠音标度频率,z(sb)是对应于特定副带的吠音标度频率。掩蔽副带可能被限于那些满足距离要求的副带。如果没有满足距离要求,该副带将不能有效地掩蔽特定的副带。较低频率的副带比较高频率的副带更有效地掩蔽特定副带。因此,一个正的dz掩蔽效果更为显著。一个从副带到特定副带的距离要求的例子是,在-3和8之间(以吠音频率表示)。标为“归一化加权系数”的从属轴(504)是被归一化到加权函数最大量值的加权函数的值(即,掩蔽曲线)。
加权函数是掩蔽曲线乘以一个增益系数:wf(dz)=ag×mc(dz)其中ag是增益系数。数值0.001是一个增益系数的值的例子,其相当于-30 dB。掩蔽曲线的例子如下:
下面的式子给出的一个指数函数(506): mc ( dz ) = e a n &CenterDot; dz a n = - 1 3 ln ( 0.001 ) ; - 3 &le; dz &le; 0 mc ( dz ) = e - a p &CenterDot; dz a p = - 1 8 ln ( 0.001 ) ; 0 < dz < 8
下式给出的一个立方根函数(508): mc ( dz ) = ( 1 - a n &times; dz 3 ) a n = - 1 3 3 ; - 3 &le; dz &le; 0 mc ( dz ) = ( 1 - a p &times; dz 3 ) a p = 1 8 3 ; 0 < dz < 8 ,
下式给出的一个平方根函数(510): mc ( dz ) = ( 1 - a n &times; | dz | ) a n = 1 3 ; - 3 &le; dz &le; 0 mc ( dz ) = ( 1 - a p &times; dz ) a p = 1 8 ; 0 < dz < 8
下式给出的一个线性函数(512):mc(dz)=(1-an×dz) a n = - 1 3 ; - 3 &le; dz &le; 0 mc(dz)=(1-ap×dz) a p = 1 8 ; 0 < dz < 8 , 下式给出的一个平方函数(514):mc(dz)=(1-an×dz2) a n = 1 9 ; - 3 &le; dz &le; 0 mc(dz)=(1-ap×dz2) a p = 1 64 ; 0 < dz < 8 其中ap是在距离8达到完全或接近完全衰减的标度因子,an是在距离-3达到完全或接近完全衰减的标度因子。在加权函数的五个例子中,最好的感知质量是由指数函数(506)产生的。
图6以标号600示出根据本发明提供的一个带有滤波器组的装置的方框图。该装置有一个信号电平测定器(601)和一个掩蔽电平测定器(606)。该信号电平测定器进一步包括一个滤波器组(602)和一个副带抽样信号电平测定器(604)。
滤波器组(602)过滤声频帧(例如,脉码调制声频)(608)以对每个副带产生一个或多个副带抽样(610)。副带抽样电平测定器(604)根据每个副带的一个或多个副带抽样(610)确定每个副带的信号电平(612)。掩蔽电平测定器(606)根据多个信号电平、一个偏移函数和一个加权函数计算出对一个特定副带的掩蔽电平(614)。对每个副带的偏移函数和加权函数可以被存储在一个任意的存储单元(616)中。
图7以标号700示出根据本发明提供的一个带有一个变频器的装置的方框图。与标号600的图6中一样,该装置带有一个信号电平测定器(610)和一个掩蔽电平测定器(606)。对于这个实施例,信号电平测定器进一步包括一个变频器(704)和一个频域电平测定器(706)。
变频器(704)对声频帧(脉码调制声频)(608)进行变换(例如,使用离散傅里叶变换),以对每个副带产生一个或多个频域输出(708)。频域信号电平测定器(706)根据对每个副带的一个或多个副带抽样(610)确定信号电平(612)。掩蔽电平测定器(606)根据多个信号电平,一个偏移函数和一个加权函数计算出一个特定副带的掩蔽电平(614)。每个副带的偏移函数和加权函数可以被存储在一个任意的存储单元(616)中。
图8以标号800示出带有一个根据本发明实施的一个装置的一个系统的实施例的方框图。该系统包括一个滤波器组(802)、一个音质单元(804)、一个比特分配元件(808)、一个量化器(810),和一个比特流格式器(812)。音质单元(804)进一步包括一个信号电平测定器(601)、一个掩蔽电平测定器(606)、和一个信号掩蔽比计算器(806)。滤波器组(802)和音质单元(804)分析一个声频帧(例如,脉码调制(PCM)声频)(608)。滤波器组(802)输出对于数个频率副带的一个声频的帧的频域表达(814)。音质单元(804)根据人类耳朵的感知模式分析声频帧。信号电平测定器(601)根据声频帧(608)确定每个副带的信号电平(612)。掩蔽电平测定器(606)根据多个信号电平,一个偏移函数,和一个加权函数计算出一个特定副带的掩蔽电平(614)。信号掩蔽比计算器(608)根据信号电平(612)和掩蔽电平(614)确定信号掩蔽比(816)。接着比特分配元件(808)根据来自音质单元(804)的信号掩蔽比(816)确定出应当分配到每个频率副带的比特数。把比特分配元件(808)确定的比特分配(818)输出到量化器(810)。量化器(810)压缩滤波器组(802)的输出使其符合比特分配(818)。比特流格式器(812)从量化器(810)接收压缩的声频(820),和加上任何首标或附加的信息,并将其格式化为一个比特流(822)。
滤波器组(802)是根据MPEG声频可由一个数字信号处理器例如MOTOROLA DSP56002实施的,把输入时域声频抽样变换为一个频率域表示物。滤波器组(802)用少量的(例如2-32)原始声频频谱的线性频率分区来代表声频信号。滤波器组(802)输出与输入相同数量的抽样,因此被称为对信号临界抽样。滤波器组(802)进行临界抽样,并对每N个输入时域抽样输出N个副带抽样。
音质单元(804)是根据MPEG可由一个诸如MOTOROLADSP56002之类的数字信号处理器实施的,分析在每个频率副带中的信号电平和掩蔽电平。它对每个副带输出一个信号掩蔽比(SMR)的值。SMR的值代表人的耳朵对于在给定分析周期的副带的相对敏感性。SMR越高,人的耳朵对那个副带中的噪声越敏感,结果是应当把更多的比特分配给它。通过把很少的比特分配给具有人的耳朵对其较小敏感的低SMR的副带,完成了压缩。与现有的使用复杂的高解析度傅里叶变换来计算掩蔽电平的技术相反,本发明使用了简化的,更有效的掩蔽电平计算方法。
比特分配元件(808)其可由一个诸如MOTOROLADSP56002之类的数字信号处理器实施的,利用来自音质单元(804)的SMR信息、恰当的压缩比,和其它比特分配参数为每个副带产生一个完整的比特分配表。比特分配元件(808)利用来自音质单元(804)的SMR信息,反复地分配比特,以产生一个将全部可用比特赋予频率副带的比特分配表。
量化器(810)是根据MPEG声频、可由一个诸如MOTOROLA DSP56002之类的数字信号处理器实施的,利用比特分配信息(818)把副带抽样标度和量化为特定的比特数。在量化之前,可以进行各种类型的标度,以把量化损失的信息减小到最小。最终的量化一般是用通过一个线性量化方程处理标度的副带抽样,然后从结果中截去m减n个最不重要的比特这样的方法完成的,这里m是初始比特数,n是分配给那个副带的比特数。
比特流格式器(812)是根据MPEG声频、可由一个诸如MOTOROLA DSP56002那样的数字信号处理器实施的,接收来自量化器(810)的量化副带抽样,并把它们与首标信息、比特分配信息(818)、标度因子信息和其它任何编码器需要的侧信息一起打包成比特流(822)。比特流以一个等于声频帧输入比特速率除以压缩比的速率输出。
图9以标号900示出带有一个根据本发明实施的装置的系统的一个替代实施例的方框图。该替代系统包括滤波器组(602)、一个简化的音质单元(902)、比特分配元件(808)、量化器(810)和比特流格式器(812)。简化的音质单元进一步包括副带抽样信号电平测定器(604)、掩蔽电平测定器(606)和信号掩蔽比计算器(806)。滤波器组(602)分析声频的帧(例如,脉码调制(PCM)声频)(608)。与标号800的图8中的系统相反,滤波器组(602)把对几个频率副带的声频帧(610)的频域表达输出到简化音质单元(902)和量化器(810)。简化音质单元(902)根据人耳感知模式分析声频帧。副带抽样信号电平测定器(604)根据对每个副带的一个或多个副带抽样(610)确定每个副带的信号电平(612)。掩蔽电平测定器(606)根据多个信号电平,一个偏移函数,和一个加权函数计算出对一个特定副带的掩蔽电平(614)。信号掩蔽比计算器(806)根据信号电平(612)和掩蔽电平(614)确定出一个信号掩蔽比(816)。其余的系统操作与标号800的图8中的系统一样。比特分配元件(808)根据来自简化的音质单元(902)的信号掩蔽比(816)确定出应当分配到每个频率副带的比特数。由比特分配元件(808)确定的比特分配(818)被输出到量化器(810)。量化器(810)压缩滤波器组(610)的输出,使其符合比特分配(818)。比特流格式器(812)接收来自量化器(810)的压缩声频(820),和加上任何首标或附加信息,并将它格式化为一个比特流(822)。
本发明提供了一个对在一个通信系统中接收到的信号编码的方法,装置和系统。利用这种方法,装置和系统,对存储器和计算复杂性的要求都比现有技术大大的降低了。在凭借一个象MOTOROLA DSP56002这样的数字信号处理器的实时软件执行中,这意味着在单独一个处理速度大约为40Mhz的低价DSP中实现编码器的功能是可能的。此外,仅需要少于32 Kwords的外存储器。已知一些现有技术的解决方法中需要三个这样的DSP和大的多的存储器。一个替代数字信号处理器(DSP)的解决方法是利用一个应用专门集成电路(ASIC)。本发明的一个基于ASIC的实现,心然比现有技术大大地减小了门计数和时钟速度。
尽管是参考实施例对本发明进行了说明,但本发明并不限于这些特定的实施例。本领域的技术人员理解,可以进行各种变化和修改而不脱离在后附的权利要求书中提出的本发明的精神和范围。

Claims (10)

1.一种在副带声频编码器中确定特定副带的掩蔽电平的方法,其中副带声频编码器把一个声频帧划分为多个副带,其特征在于,所述方法包括以下步骤:
1A)接收该声频帧,和用一个信号电平测定器确定出每个副带的一个信号电平以产生多个信号电平;和
1B)利用一个掩蔽电平测定器根据多个信号电平,一个偏移函数,和一个加权函数计算出该特定副带的掩蔽电平。
2.如权利要求1所述的方法,其特征在于,至少包括2A-2B之一:
2A)该声频帧是一个脉码调制声频信号;和
2B)步骤1B)还包括步骤2B1-2B7:
2B1)通过一个查阅表确定每个满足一个预定的相对于特定副带的距离要求的副带的加权函数;
2B2)通过一个查阅表确定出每个副带的信号电平的一个反对数;
2B3)把加权函数乘以每个副带的信号电平的反对数得出多个积;
2B4)累加多个积得出最后的和;
2B5)确定最后的和的对数;
2B6)通过一个查阅表确定特定副带的偏移函数;和
2B7)把最后的和的对数与偏移函数相加得出掩蔽电平。
3.如权利要求1所述的方法,其特征在于,步骤1A)还包括以下步骤:
3A)使用一个滤波器组对声频帧进行频率变换以产生每个副带的至少一个第一副带抽样;和
3B)根据每个副带的至少第一副带抽样确定每个副带的信号电平,和选择使用以下形式的方程: SL ( sb ) = 1 0 * lo g 10 { &Sigma; s = 0 nsamp - 1 S ( sb , s ) 2 } 其中sb是一个副带的编号,s是一个副带抽样的编号,S(sb,s)是副带sb的副带抽样s,nsamp是每个副带的副带抽样数。
4.如权利要求1所述的方法,其特征在于,步骤1A)还包括以下步骤:
4A)利用一个高解析度变频器对声频帧进行频率变换以产生每个副带的至少一个第一频率域输出;
4B)把每个副带的信号电平定义为下列之一:
每个副带的至少第一频率域输出的
4B1)最小值;
4B2)最大值;和
4B3)平均值,并且选择在高解析度变频器中使用离散傅里叶变换。
5.如权利要求1所述的方法,其特征在于,每个副带的偏移函数是一个副带的静噪阈值和一个副带的吠音值的函数,并选择在其中利用下面形式的方程确定偏移函数:
of(sb)=0.5*LTq(sb)-0.225*z(sb)+C其中C是一个常数,LTq(sb)是副带sb的静噪阈值,z(sb)是副带sb的吠音值。
6.如权利要求1所述的方法,其特征在于,加权函数是一个增益系数乘以一个掩蔽曲线,并选择其中掩蔽曲线是下列形状之一的非线性的:
6A)上凸几何形的;和
6B)下凹几何形的;并且进一步选择其中掩蔽曲线是下列之一:
6C)一个指数函数;
6D)一个立方根函数;
6E)一个平方根函数;和
6F)一个平方函数。
7.一种在副带声频编码器中确定特定副带的掩蔽电平的装置,其中副带声频编码器把一个声频帧划分为多个副带,其特征在于,所述装置包括:
7A)一个根据声频帧确定多个副带中每个副带的信号电平以产生多个信号电平的信号电平测定器;和
7B)一个可操作地连接于信号电平测定器的,用来根据多个信号电平,一个偏移函数,和一个加权函数计算出特定副带的掩蔽电平的掩蔽电平测定器。
8.如权利要求7所述的装置,其特征在于,至少包括8A-8D之一:
8A)声频帧是一个脉码调制信号;
8B)信号电平测定器还包括:
8B1)一个用于对声频帧进行频率变换以产生每个副带的至少一个第一副带抽样的滤波器组;和
8B2)一个可操作地连接于滤波器组的,用来根据每个副带的至少第一副带抽样确定多个副带中每个副带的信号电平的副带抽样信号电平测定器;
8C)该信号电平测定器进一步包括:
8C1)一个用于对声频帧进行频率变换以产生每个副带的至少一个第一频率域输出的高解析度变频器;
8C2)一个可操作地连接于变频器的频率域信号电平测定器,用于把每个副带的信号电平定义为下列之一:
多个副带中的每个副带的至少第一频率域输出的
8C2a)最小值;
8C2b)最大值;和
8C2c)平均值,并且选择在高解析度变频器中使用离散傅里叶变换;和
8D)该装置还包括一个用于存储多个副带中的每个副带的偏移函数和加权函数的存储器单元。
9.一种系统,具有一个用于在副带声频编码器中确定副带的掩蔽电平的装置,其中副带声频编码器把一个声频帧划分为多个副带,其特征在于,所述系统包括:
9A)一个用于接收和变换声频帧以产生变换了频率的声频的滤波器组;
9B)一个用于接收声频帧以产生一个信号掩蔽比的音质单元,其中音质单元进一步包括:
9B1)一个用于根据声频帧确定每个副带的信号电平以产生多个信号电平的信号电平测定器;
9B2)一个可操作地连接于信号电平测定器的,用于根据多个信号电平、一个偏移函数和一个加权函数计算副带的掩蔽电平的掩蔽电平测定器;和
9B3)一个用于根据掩蔽电平计算出一个信号掩蔽比的信号掩蔽比计算器;
9C)一个可操作地连接于音质单元的,用于利用信号掩蔽比以产生比特分配信息的比特分配元件;
9D)一个可操作地连接于滤波器组和比特分配元件的,用于根据变换了频率的声频和比特分配信息产生一个压缩声频帧的量化器;
9E)一个可操作地连接于量化器的,用于利用压缩的声频帧以产生一个比特流输出的比特流格式器。
10.一种系统,具有一个用于在副带声频编码器中确定副带的掩蔽电平的装置,其中副带声频编码器把一个声频帧划分为多个副带,其特征在于,所述系统包括:
10A)一个用于接收和变换声频帧以产生变换了频率的声频的滤波器组;
10B)一个可操作地连接于滤波器组的简化音质单元,其中该简化音质单元进一步包括:
10B1)一个可操作地连接于滤波器组的,用于根据变换了频率的声频确定每个副带的信号电平以产生多个信号电平的副带抽样信号电平测定器;
10B2)一个可操作地连接于信号电平测定器的,用于根据多个信号电平、一个偏移函数和一个加权函数计算副带的掩蔽电平的掩蔽电平测定器;和
10B3)一个根据掩蔽电平计算出一个信号掩蔽比的信号——掩蔽比计算器;
10C)一个可操作地连接于音质单元的,用于利用信号掩蔽比以产生比特分配信息的比特分配元件;
10D)一个可操作地连接于滤波器组和比特分配元件的,用于根据变换了的频率的声频和比特分配信息产生一个压缩的声频帧的量化器;
10E)一个可操作地连接于量化器的,用于利用压缩的声频帧以产生一个比特流输出的比特流格式器。
CN95191014A 1994-10-07 1995-07-24 确定副带声频编码器的副带掩蔽电平的方法和装置及系统 Pending CN1136850A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US08/320,625 US5625743A (en) 1994-10-07 1994-10-07 Determining a masking level for a subband in a subband audio encoder
US08/320,625 1994-10-07

Publications (1)

Publication Number Publication Date
CN1136850A true CN1136850A (zh) 1996-11-27

Family

ID=23247236

Family Applications (1)

Application Number Title Priority Date Filing Date
CN95191014A Pending CN1136850A (zh) 1994-10-07 1995-07-24 确定副带声频编码器的副带掩蔽电平的方法和装置及系统

Country Status (6)

Country Link
US (1) US5625743A (zh)
EP (1) EP0748499A4 (zh)
CN (1) CN1136850A (zh)
AU (1) AU676444B2 (zh)
CA (1) CA2176485A1 (zh)
WO (1) WO1996011467A1 (zh)

Families Citing this family (36)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR970011727B1 (en) * 1994-11-09 1997-07-14 Daewoo Electronics Co Ltd Apparatus for encoding of the audio signal
JP3307138B2 (ja) * 1995-02-27 2002-07-24 ソニー株式会社 信号符号化方法及び装置、並びに信号復号化方法及び装置
JP2776300B2 (ja) * 1995-05-31 1998-07-16 日本電気株式会社 音声信号処理回路
JP3082625B2 (ja) * 1995-07-15 2000-08-28 日本電気株式会社 音声信号処理回路
US5960390A (en) * 1995-10-05 1999-09-28 Sony Corporation Coding method for using multi channel audio signals
US5825320A (en) * 1996-03-19 1998-10-20 Sony Corporation Gain control method for audio encoding device
US5822370A (en) * 1996-04-16 1998-10-13 Aura Systems, Inc. Compression/decompression for preservation of high fidelity speech quality at low bandwidth
JP3283200B2 (ja) * 1996-12-19 2002-05-20 ケイディーディーアイ株式会社 符号化音声データの符号化レート変換方法および装置
US6889185B1 (en) * 1997-08-28 2005-05-03 Texas Instruments Incorporated Quantization of linear prediction coefficients using perceptual weighting
US6091773A (en) * 1997-11-12 2000-07-18 Sydorenko; Mark R. Data compression method and apparatus
US6092040A (en) * 1997-11-21 2000-07-18 Voran; Stephen Audio signal time offset estimation algorithm and measuring normalizing block algorithms for the perceptually-consistent comparison of speech signals
TW358925B (en) * 1997-12-31 1999-05-21 Ind Tech Res Inst Improvement of oscillation encoding of a low bit rate sine conversion language encoder
US6161088A (en) * 1998-06-26 2000-12-12 Texas Instruments Incorporated Method and system for encoding a digital audio signal
US6304865B1 (en) 1998-10-27 2001-10-16 Dell U.S.A., L.P. Audio diagnostic system and method using frequency spectrum and neural network
JP2000165251A (ja) * 1998-11-27 2000-06-16 Matsushita Electric Ind Co Ltd オーディオ信号符号化装置及びそれを実現したマイクロホン
US8636648B2 (en) 1999-03-01 2014-01-28 West View Research, Llc Endoscopic smart probe
US7914442B1 (en) 1999-03-01 2011-03-29 Gazdzinski Robert F Endoscopic smart probe and method
US8068897B1 (en) 1999-03-01 2011-11-29 Gazdzinski Robert F Endoscopic smart probe and method
US10973397B2 (en) 1999-03-01 2021-04-13 West View Research, Llc Computerized information collection and processing apparatus
US6166663A (en) * 1999-07-16 2000-12-26 National Science Council Architecture for inverse quantization and multichannel processing in MPEG-II audio decoding
EP1113432B1 (en) * 1999-12-24 2011-03-30 International Business Machines Corporation Method and system for detecting identical digital data
JP2002006895A (ja) * 2000-06-20 2002-01-11 Fujitsu Ltd ビット割当装置および方法
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
US7376159B1 (en) * 2002-01-03 2008-05-20 The Directv Group, Inc. Exploitation of null packets in packetized digital television systems
US20030233228A1 (en) * 2002-06-03 2003-12-18 Dahl John Michael Audio coding system and method
US7286473B1 (en) 2002-07-10 2007-10-23 The Directv Group, Inc. Null packet replacement with bi-level scheduling
US7650277B2 (en) * 2003-01-23 2010-01-19 Ittiam Systems (P) Ltd. System, method, and apparatus for fast quantization in perceptual audio coders
EP1469457A1 (en) * 2003-03-28 2004-10-20 Sony International (Europe) GmbH Method and system for pre-processing speech
US7647221B2 (en) * 2003-04-30 2010-01-12 The Directv Group, Inc. Audio level control for compressed audio
US7912226B1 (en) * 2003-09-12 2011-03-22 The Directv Group, Inc. Automatic measurement of audio presence and level by direct processing of an MPEG data stream
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
FR2912249A1 (fr) * 2007-02-02 2008-08-08 France Telecom Codage/decodage perfectionnes de signaux audionumeriques.
US9729120B1 (en) 2011-07-13 2017-08-08 The Directv Group, Inc. System and method to monitor audio loudness and provide audio automatic gain control
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel

Family Cites Families (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO1989011759A1 (en) * 1988-05-26 1989-11-30 Telefunken Fernseh Und Rundfunk Gmbh Process for transmitting an audio signal
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5357594A (en) * 1989-01-27 1994-10-18 Dolby Laboratories Licensing Corporation Encoding and decoding using specially designed pairs of analysis and synthesis windows
US5222189A (en) * 1989-01-27 1993-06-22 Dolby Laboratories Licensing Corporation Low time-delay transform coder, decoder, and encoder/decoder for high-quality audio
US5185800A (en) * 1989-10-13 1993-02-09 Centre National D'etudes Des Telecommunications Bit allocation device for transformed digital audio broadcasting signals with adaptive quantization based on psychoauditive criterion
US5040217A (en) * 1989-10-18 1991-08-13 At&T Bell Laboratories Perceptual coding of audio signals
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model

Also Published As

Publication number Publication date
US5625743A (en) 1997-04-29
CA2176485A1 (en) 1996-04-18
AU3142995A (en) 1996-05-02
EP0748499A4 (en) 1999-03-03
AU676444B2 (en) 1997-03-06
WO1996011467A1 (en) 1996-04-18
EP0748499A1 (en) 1996-12-18

Similar Documents

Publication Publication Date Title
CN1136850A (zh) 确定副带声频编码器的副带掩蔽电平的方法和装置及系统
JP4212591B2 (ja) オーディオ符号化装置
CA2249792C (en) Audio signal compression method, audio signal compression apparatus, speech signal compression method, speech signal compression apparatus, speech recognition method, and speech recognition apparatus
US8615391B2 (en) Method and apparatus to extract important spectral component from audio signal and low bit-rate audio signal coding and/or decoding method and apparatus using the same
CN101965612B (zh) 用于处理音频信号的方法和装置
CN100361405C (zh) 利用可升级的音频编码器和解码器处理输入信号的方法
EP0966108A2 (en) Dynamic bit allocation and apparatus and method for audio coding
US20080243518A1 (en) System And Method For Compressing And Reconstructing Audio Files
JP3297240B2 (ja) 適応的符号化システム
JPH0651795A (ja) 信号量子化装置及びその方法
US6915255B2 (en) Apparatus, method, and computer program product for encoding audio signal
CN102436819B (zh) 无线音频压缩、解压缩方法及音频编码器和音频解码器
US8149927B2 (en) Method of and apparatus for encoding/decoding digital signal using linear quantization by sections
JP2003523662A (ja) データ圧縮方法及びデータ圧縮装置
US6339757B1 (en) Bit allocation method for digital audio signals
US20020152085A1 (en) Encoding apparatus and decoding apparatus
CN100349209C (zh) 数字音频信号的感知标准化方法及标准化器
US20040083094A1 (en) Wavelet-based compression and decompression of audio sample sets
US6161088A (en) Method and system for encoding a digital audio signal
Lincoln An experimental high fidelity perceptual audio coder
EP0612159A2 (en) An enhancement method for a coarse quantizer in the ATRAC
JPH08179794A (ja) サブバンド符号化方法及び装置
JP3297238B2 (ja) 適応的符号化システム及びビット割当方法
JP2993324B2 (ja) 音声高能率符号化装置
JP3146121B2 (ja) 符号化復号化装置

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication