CN1495705A - 多通道声码器 - Google Patents

多通道声码器 Download PDF

Info

Publication number
CN1495705A
CN1495705A CNA031569277A CN03156927A CN1495705A CN 1495705 A CN1495705 A CN 1495705A CN A031569277 A CNA031569277 A CN A031569277A CN 03156927 A CN03156927 A CN 03156927A CN 1495705 A CN1495705 A CN 1495705A
Authority
CN
China
Prior art keywords
subband
signal
subframe
coding
frequency
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA031569277A
Other languages
English (en)
Other versions
CN1303583C (zh
Inventor
˹�ٷҡ�M��ʷ��˹
斯蒂芬·M·史密斯
��H��ʷ��˹
迈克尔·H·史密斯
ʷ
威廉·保罗·史密斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
DTS Inc
Original Assignee
Digital Theater Systems Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Digital Theater Systems Inc filed Critical Digital Theater Systems Inc
Publication of CN1495705A publication Critical patent/CN1495705A/zh
Application granted granted Critical
Publication of CN1303583C publication Critical patent/CN1303583C/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S3/00Systems employing more than two channels, e.g. quadraphonic
    • H04S3/008Systems employing more than two channels, e.g. quadraphonic in which the audio signals are in digital form, i.e. employing more than two discrete digital channels

Abstract

一种子带声编码器(12)采用了完全/非完全重构滤波器(34)、预测/非预测子带编码(72)、瞬变分析器(106)、和心理声学/最小均方差(mmse)相对时间的位分配(30)、频率以及多声道对数据流进行编码/解码以产生高保真度的重构声音。声编码器(64)对多通道声信号进行划分以便把帧尺寸即字节数量限制在所需的范围内,并对编码数据进行格式化处理以便当接收到各子帧时能进行播放从而减少伪象。此外,声编码器处理声频带宽的基带部分0-24kHz以便用相同的编码/解码算法对48kHz或更高的频率进行采样从而使声编码器的结构在未来具有兼容性。

Description

多通道声码器
技术领域
本发明涉及高质量多通道声信号的编码和解码,更确切地说,涉及一种子带编码器,其在整个时间内利用完全/不完全重构滤波器、预测/非预测子带编码、瞬态分析、和心理声学/最小均方差(mmse)的位分配、频率和多声道产生限定解码计算载荷的数据流。
背景技术
可以将公知的高质量声音和音乐编码器分成两大类模式。第一类是,用于高频分辨子带的媒体/变换编码器,该编码器能根据心理声学的掩蔽计算结果在分析窗内自适应地量化子带或系数样本。第二类是,低频分辨子带编码器,这种编码器通过用ADPCM对子带样本进行处理来补偿其低下的频率分辨率。
第一类编码器通过使位分配适应于信号的谱能从而利用了普通音乐信号中的大量短程频谱变化。借助这些编码器的高分辨率可以把频率转换信号直接应用到心理声学模型上,这主要基于听觉的临界频带理论。托德(Todd)等人的Dolby的AC-3声学编码器“AC-3:声音传播和存储的柔感编码”声学工程协会大会,1994年2月一般性地计算了各个PCM信号上的1024-ffts并在每个通道中建立了针对1024个频率系数的心理声学模型以便确定每个系数的位速率。Dolby系统使用了瞬态分析,这样能把窗口尺寸减小到256个样本从而达到隔离这些瞬态的目的。AC-3编码器采用了专用的反向自适应算法以便对位分配进行解码。这样便减少了沿编码声数据一侧发射的位分配信息量。结果,在正向自适应系统的范围内增加了适合声学要求的频带宽度从而改善了音质。
在第二类编码器中,在不明显涉及任何心理声学掩蔽理论的情况下,差值子带信号的量化或者是固定的或者可用于最大限度地减小穿越所有或部分子带的量化噪声能量。由于很难估计位分配处理之前的预测特性,所以通常不能把心理声学的失真直接加到预测/差值子带信号上。由于量化噪声在预测量处理时的相互作用而使问题进一步复杂化。
由于感性临界声信号通常是周期性的,所以这些编码器可在较长的时间周期内工作。这种周期性是通过预测差分量化而得到的。把信号分成少量子带的结果降低了噪声调制的听觉效果并且可利用声信号的长程频谱变化。如果子带的数量增加,那么每个子带中的预测增益将降低而且在某些点上的预测增益将趋于零。
数字式影院系统,L.P.(DTS)采用了一种声码器,其中将每个PCM声道滤成四个子带而且用反向ADPCM编码器对每个子带进行编码,所述反向ADPCM编码器使预测系数适应于子带数据。使位分配固定且使每个通道也同样固定,赋予低频子带的位多于高频子带。位分配提供了固定的压缩率,例如4∶1。迈克·史密斯(MikeSmyth)和斯蒂芬·史密斯(Stephen Smyth)在“APT-X100:广播中使用的低滞后、低位速率、子带ADPCM声码器”第十次国际AES会议汇编,1991年,第41-56页中描述了DTS编码器。
两种声码器还具有其它共同的局限性。首先,公知的声码器用固定的帧尺寸进行编码/解码,即,样本的数量或用帧表示的时间周期是固定的。结果,当编码的传输率相对于样本率增加时,帧内的数据量也增加。因此,必须把解码器中缓冲器的尺寸设计得能适应最糟的情况以避免数据溢出。这样将会增加作为解码器主要成本因素的RAM之数量。其次,公知的声码器不易扩大到使采样频率大于48kHz。由此使得现有解码器与新解码器所需的格式不兼容。对未来的产品不能兼容导致了严重的局限性。此外,对PCM进行编码所用的公知格式要求在播放之前启动由解码器读入的全部帧。这就需要把缓冲器的尺寸限制在接近100ms数据块从而使滞后或等待时间不会干扰听者。
此外,虽然这些编码器的编码能力达24kHz,但却常常丢失更高频的子带。这样会降低高频保真度或重构信号的背景。公知编码器通常使用两种误差检测系统中的一种。最常用的是读所罗门编码(Read Solomon coding),其中编码器把误差检测位加到数据流中的边(side)信息上。这有利于检测和校正边信息中的任何误差。然而,无法测出声数据中的误差。另一种方法是检验无效码状态的帧和声标题。例如,个别的3位参数可能只具有3种有效状态。如果只鉴别出其它五种状态中的一种那么肯定出现了误差。这只是显示了检测能力而并不检测声数据中的误差。
发明内容
从上述问题出发,本发明提供了一种具有柔性的多通道声码器,其在高位速率下以比CD更好的质量灵活调整压缩能级的宽度范围和通过降低播放等待时间、简化误差检测改善了低位速率的感性质量、改善了前回波的失真以及对较高采样率的进一步扩展性。
这是用子带编码器实现的,子带编码器把每个声道划为声帧序列,把帧滤成基带和高频区,把每个基带信号分解成多个子带。子带编码器在位速率较低时一般选择非完全滤波器以便分解基带信号,而在位速率足够高时选择完全滤波器。高频编码层对与基带信号无关的高频信号进行编码。基带编码层包括分别对高频和低频子带进行编码的VQ和ADPCM编码器。每个子带帧包括至少一个子帧,每个子帧进一步细分为多个子子帧。对每个子帧进行分析以便估计ADPCM编码器的预测增益和检测瞬变状态以调节前后瞬变状态SFs,在所述ADPCM编码器中,当预测增益较低时其预测能力将丧失。
全位管理(GBM)系统利用多个声道、多个子带和当前帧中的子帧之间的差把各位分配到每个子帧。GBM系统最初通过计算被预测增益改变的SMR而将各位分配到每个子帧以满足心理声学模型。然后,GBM系统按照MMSE分配的瞬间转换、降低所有噪声或MMSE的渐变变换等方法分配所有剩余位。
多路转换器产生包括同步字、帧标题、声标题和至少一个子帧的输出帧并以传输速率把输出帧多路转换成数据流。帧标题包括窗口尺寸和当前输出帧的尺寸。声标题表示声帧的压缩装置和编码格式。每个声频子帧包括在与任何其它子帧无关的情况下对声频子帧进行解码的边信息、高频VQ编码、多个用于压缩各通道低频子带声数据并将其与其它通道进行多路转换的基带声频子子帧、在每个通道的高频范围内将声频数据压缩并将其与其它通道进行多路转换从而在多种解码采样速率下对多通道声信号进行解码和解压缩同步确定子帧端部的高频声信息块。
选择窗口尺寸作为传输速率与编码采样速率之比的函数从而把输出帧的尺寸限制在要求的范围内。当压缩量较低时,窗口尺寸减小从而使帧尺寸不会超过上限最大值。结果,解码器可以采用具有固定和较少RAM数量的输入缓冲器。当压缩量相对高时,窗口尺寸增加。结果,GBM系统需将各位分布到大的时间窗内由此改善编码特性。
通过以下结合附图对优选实施例所作的详细说明将更有助于熟悉本领域的技术人员理解本发明的这些和其它特征和优点,其中:
附图说明
图1是按照本发明所述5通道声码器的方框图;
图2是多通道编码器的方框图;
图3是基带编码器和解码器的方框图;
图4a和图4b分别是高采样速率编码器和解码器的方框图;
图5是单通道编码器的方框图;
图6是相对于可变传输速率的每帧字节与帧尺寸之间关系的曲线图;
图7是NPR和PR重构滤波器的幅值响应曲线图;
图8是重构滤波器的子带混叠曲线图;
图9是NPR和PR滤波器的失真曲线图;
图10是单个子带碥码器的示意图;
图11A和11B分别表示子帧的瞬态检测和比例因数计算;
图12表示对量化TMODES的熵(entropy)编码过程;
图13表示比例因数量化过程;
图14表示信号掩蔽响应所产生的SMRs随信号频率产生的旋转;
图15是人的听觉响应的曲线图;
图16是子带的SMRs曲线图;
图17是心理声学和mmse位分配的误差信号曲线图;
图18A和图18B分别是子带能层的曲线图和反向曲线图,其表示mmse“注水”位分配过程;
图19是数据流中的单帧方框图;
图20是解码器的示意图;
图21是构成编码器硬件的方框图;和
图22是构成解码器硬件的方框图。
附表说明
表1是最大帧尺寸与采样速率和传输速率之间关系的表格;
表2是允许的最大帧尺寸(字节)与采样速率和传输速率之间关系的表格;
表3表示ABIT指数值、量化层的数量和最终子带SNR之间的关系。
具体实施方式
多通道声码系统
如图1所示,本发明把两个公知编码系统的特征与单个多通道声码器10的附加特征相结合。把编码算法设计成能进行演播室质量水平即“好于CD”质量水平的演播和使其能在改变压缩量、采样速率、字长、通道数和感性质量方面获得广泛应用。
编码器12把通常在48kHz下以16-24位字长采样的多通道PCM声数据14编译成公知传输率的数据流16,合适的传输率范围为32-4096kbps。与公知的声码器不同,在不会使已有编码器出现不兼容的情况下,本结构能达到更高的采样速率(48-192kHz),所述已有编码器是为基带采样速率或任何中间采样速率而设计的。此外,当优选将每个帧分成1-4个子帧时将PCM数据14框住并编成一个帧。声频窗口的尺寸即PCM样本数量与采样速率和传输速率的相对值有关,因此把输出帧的尺寸即由解码器18读出的每帧字节的数量限制在5.3-8个字节之间。
结果,为缓冲进入的数据流而需要在解码器中设置的RAM的数量可保持较低水平,这将降低解码器的成本。在低速率下可以使用较大的窗口尺寸来构成PCM数据,这样便改善了编码效能。在高位速率下,必须使用较小的窗口尺寸以便满足限定数据的需要。这必然会使编码效能降低,但这对高速率是无意义的。而且,PCM数据构成的方式使得解码器18在将全部输出帧读入缓冲器之前就能激发演播。这样可减少声码器的滞后或等待时间。
编码器12使用了高分辨率滤波带,其根据位速率优选在不完全(NPR)和完全(PR)重构滤波器之间转换以便把每个声道14分成多个子带信号。用预测和矢量量化(VQ)编码器分别对低频和高频子带进行编码。可以将起始VQ子带固定或动态确定为交流信号特性的函数。在低位速率下可以在采用综合频率编码的同时对高频子带中的多个通道进行编码。
预测编码器根据子带预测增益优选在APCM和ADPCM模式之间转换。瞬态分析器把每个子带的子帧分成前后回波信号(子子帧)并计算与前后回波子子帧相应的各比例因数从而降低前回波失真。编码器根据它们各自的需要(心理声学或mse)自适应地分配穿过所有PCM通道和当前帧子带的有效位速率以便达到量佳编码效率。通过把预测编码和心理声学模型彼此结合可提高低位速率编码效率从而降低获得主观透明度的位速率。把计算机或键盘等可编程控制器19与编码器12相连以使声模式信息滞后,这些信息包括理想位速率、通道数量、PR或NPR重构、采样速率和传输速率等参数。
将编码信号和边带信息压缩并多路转换成数据流16由此将编码计算负荷限制在所需的范围内。将数据流16编译到传输媒体20例如CD、数字式视盘(DVD)或直播卫星上并通过该媒体进行演播。解码器18对各子带信号进行解码并完成相反的滤波操作以产生多通道声信号22,该信号主观上相当于原始多通道声信号14。可用声系统24例如家庭影院或多媒体计算机为用户播放声信号。
多通道编码器
如图2所示,编码器12包括多个独立的通道编码器26,合适的是五个(左前、中、右前、左后和右后),其产生各组编码子带信号28,合适的是每个通道32个子带信号。编码器12采用全位管理(GBM)系统30,其动态地把各位从通道中的共用位池(commonbit-pool)分配到通道内的子带之间和给定子带中的各帧内。编码器12还采用了综合频率编码技术,该技术利用的是高频子带中的通道间关系。此外,编码器12可以在不易感觉到的高频子带上使用VQ以便在非常低的位速率下形成基本的高频保真度或背景。用这种方式,编码器利用了不同的信号要求,例如,多个通道的子带rms值和心理声学掩蔽等级以及在每个通道的频率范围内和给定的帧时间内信号能量的非均匀分布。
位分配概述
GBM系统30首先确定将对哪个通道的子带进行综合频率编码和进行数据平均,然后确定将用VQ对哪个子带进行编码并从得到的位速率中减去那些位速率。可以在当阈值频率之上的所有子带都是VQ时预先决定用VQ编码的子带或根据每帧中各子带的心理声学掩蔽效应作出上述决定。因此,GBM系统30利用心理声学掩蔽将各位(ABIT)分配到剩余的子带上从而达到优化解码声信号的主观质量之目的。如果得到了附加位,编码器可以转换到纯mmse图,即“注水(waterfilling)”,并根据子带相对rms的值对所有的位进行再分配从而使误差信号的rms值降至最小。这可在极高位速率的情况下应用。优选的方法是保持心理声学位分配和根据mmse图只分配附加位。这样可保持因心理声学掩蔽而产生的噪声信号的形状,但将使噪音最低值均匀地向下偏移。
此外,可以对优选的方法进行改进使其根据rms和心理声学能级之间的差来分配附加位。结果,当位速率增大时心理声学分配的转换与mmse分配相当,所以在两种技术之间形成了平滑转换。上述技术特别适用于固定的位速率系统。此外,编码器12可以设定失真等级、主观条件或mse,并允许改变所有位速率以保持失真等级。多路转换器32按照特定的数据格式把子带信号和边信息多路转换成数据流16。具体的数据格式将在下面的图20中讨论。
基带编码
相对于8-48kHz范围的采样速率而言,如图3中所示的通道编码器26采用了均匀的512-抽头32-带的分析滤波器组34,其以48kHz的采样速率工作并把每个通道0-24kHz的声频谱分成32个子带,每个子带的带宽为750Hz。编码级36对每个子带信号进行编码并通过多路转换器38将它们多路转换成压缩数据流16。解码器18接收压缩的数据流,利用拆分器40分出每个子带的编码数据,并对每个子带信号42进行解码和用512-抽头32-带的均匀内插滤波器组44重构每个通道的PCM数字式声信号(Psamp=48kHz)。
在本结构中,所有编码策略,例如48KHz、96KHz或192kHz的采样速率都使用了在最低(基带)声频例如0-24kHz基础上的32带编码/解码方法。因此,目前根据48kHz采样速率设计和制成的解码器能与将来设计成利用高频分量的编码器兼容。目前的解码器能读取基带信号(0-24kHz)和忽略高频编码数据。
高采样速率编码
相对于48-96kHz范围的采样速率而言,通道编码器26优选把声频谱分成两部分并采用了下半部为均匀32-带的分析滤波器组而上半部为8-带的分析滤波器组。如图4a和图4b所示,开始时用256-抽头2-带抽选预滤波器组46拆分0-48kHz的声频谱形成每带24kHz的声带宽度。将低频带(0-24kHz)分离并以上述图3的方式编入32个均匀带。然而把高频带(24-48kHz)分离并编入8个均匀带。如果8-带抽选/内插滤波器组48的滞后与32-带滤波器组的滞后不相等则必须在24-48kHz信号通路中的某处采用滞后补偿级50,以便确保解码时两个时间波形在进入2-带重构滤波器组之前对齐。在96kHz采样编码系统中,使24-48kHz声频带滞后384个样本,然后用128-抽头的内插滤波器组将其分成8个均匀带。用0-24kHz带的编码数据对每个3kHz的子带进行编码52和压缩54以形成压缩数据流16。
当到达解码器18时,将压缩数据流16解压缩56并把相对于32-带解码器(0-24kHz区)和8-带解码器(24-48kHz)的编码分出并分别送到它们各自的解码级42和58中。用128-抽头和512-抽头的均匀内插滤波器组60和44分别重构8和32解码子带。用256-抽头2-带均匀内插滤波器组62顺序重组解码子带以便产生采样速率为96kHz的单一PCM数字式声信号。在需要解码器以压缩数据流一半的采样速率工作的情况下,通过放弃高频带编码数据(24-48kHz)和只将0-24kHz声域内的32-子带解码便可以方便地进行上述操作。
通道编码器
在上述所有的编码层中,32-带编码/解码过程是针对声带宽度为0-24kHz间的基带部分进行的。如图5所示,取帧器64划定PCM声道将其分成连续的数据帧66。PCM声频窗确定了连续输入的样本数量,相对该数量将在编码过程中产生数据流形式的输出帧。根据压缩量,即传输速率与采样速率之比来设定窗口尺寸,从而构成每帧内的编码数据量。通过32-带512-抽头的FIR抽选滤波器组34把每个连续的数据帧66分成32个均匀频带68。缓冲每个子带的样本输出并将其送到32-带编码级36。
分析级70(将在图10-19中详细描述)产生最佳预测系数、差分量化位分配和缓冲子带样本的最佳量化比例因数。分析级70还可以决定将对哪个子带进行矢量量化和在这些决定不确定时可以决定对谁进行综合频率编码。把该数据或边信息向前送到选定的ADPCM级72、VQ级73或综合频率编码(JFC)级74并送到数据多路转换器32(压缩器)。然后通过ADPCM或VQ步骤对子带样本进行编码并将量化编码输入到多路转换器。JFC级74实际上并不对子带样本进行编码而是产生指示连接哪个通道的子带和在何处将它们放入数据流中的编码。将来自每个子带的量化编码和边信息压缩成数据流16并将其送入解码器。
到达解码器18时,将数据流多路分配40或解压缩使之回到各自的子带。首先把比例因数和位分配与每个子带的预测系数一起装入逆量化器75中。然后直接利用ADPCM过程76或反向VQ过程77或指定子带的反向JFC过程78重构不同的编码。最后用32-带内插滤波器组44把子带合并成单一的PCM声信号22。
PCM信号构成的帧
如图6所示,当传输速率相对于给定采样速率发生变化时,图5中所示的取帧器64将改变窗口79的尺寸从而使构成每个输出帧的字节数量处于例如5.3K个字节和8K个字节之间。表1和表2分别是允许设计者选择最佳窗口尺寸和解码缓冲器尺寸(帧尺寸)以便给出采样速率和传输速率的设计表。在低传输速率下,帧尺寸可以相对较大。这可以使编码器能利用声频信号在整个时间内的不平滑变化分布和改善声码器的特性。在高速率下,需减小帧尺寸以便使字节的总量不会溢出解码缓冲器。结果,设计者可以提供具有8K字节RAM的解码器以满足所有传输速率。这将降低解码器的成本。通常,声频窗口的尺寸由下式得出:
Figure A0315692700141
其中帧尺寸是解码缓冲器的尺寸,Fsamp是采样速率,而Trate是传输速率。声频窗口的尺寸依声道的数量而定。然而,随着通道数的增加,压缩量也必须增加以保持所需的传输速率。
                         表1
                       Fsamp(kHz)
Trate        8-12   16-24   32-48   64-96   128-192
≤512kbps    1024    2048     4096     ★         ★
≤1024kbps    ★     1024     2048     ★         ★
≤2048kbps    ★     ★       1024     2048       ★
≤4096kbps    ★     ★       ★       1024       2048
                         表2
                      F samp(kHz)
T rate       8-12  16-24   32-48   64-96     128-192
<512kbps     8-5.3k 8-5.3k   8-5.3k   ★         ★
<1024kbps    ★     8-5.3k   8-5.3k   ★         ★
<2048kbps    ★     ★       8-5.3k   8-5.3k     ★
<4096kbps    ★     ★       ★       8-5.3k     8-5.3k
子带滤波
从两个多相滤波器组中选择32-带521-抽头的均匀抽选滤波器组34把数据帧66分成图5所示的32个均匀子带68。两个滤波器组具有以不同相对重构精度交换使用子带编码增益的重构特性。将一类滤波器称为完全重构(PR)滤波器。当将PR抽选(编码)滤波器和它的内插(解码)滤波器背对背放置时,重构信号是“完全”的,其中将完全定义为在24位时分辨率在0.5 Isb内。另一类滤波器被称为不完全重构(NPR)滤波器,因为其重构信号具有与滤波过程中的不完全混叠抵消特性有关的非零噪声底值。
图7中分别示出了单个子带的滤波器NPR和PR之传输函数82和84。由于NPR滤波器并不强制提供完全重构,所以它们具有比PR滤波器更大的近似带阻抑制(NSBR)比,即,通带与第一侧波瓣之比(110d B比85dB)。如图8所示,滤波器的侧瓣使实际上处于第三子带中的信号86混叠到相邻的子带上。子带增益可检测相邻子带中的信号抑制情况,并由此表明滤波器对声信号的抗相关能力。由于NPR滤波器比PR滤波器具有更大的NSBR比,所以它们还将具有更大的子带增益。结果,NPR滤波器提供了更好的编码效果。
如图9所示,随着PR和NPR滤波器所有位速率的增加,压缩数据流中的所有失真都将减小。然而,在低速率下,两种滤波器之间子带增益特性的差异大于与NPR滤波器有关的噪声底值。因此,NPR滤波器的相关失真曲线90位于PR滤波器的相关失真曲线92之下。所以,在低速率下声码器选择NPR滤波器组。从某些点94开始,编码器的量化误差降至NPR滤波器的噪声底值之下,这时向ADPCM编码器添加附加位并不会带来更多好处。在这一点上,将声码器转到PR滤波器组。
ADPCM编码
ADPCM编码器72根据H预测重构样本产生预测样本p(n)。然后从输入的x(n)中减去该预测样本,从而给出差分样本d(n)。通过用RMS(或PEAK)比例因数除以这些差分样本便可以对其进行换算使得差分样本的RMS幅值相与量化器特性曲线Q的RMS幅值相匹配。当用为当前样本分配的位数ABIT进行测定时,把换算后的差分样本ud(n)加到具有L层步长SZ的量化器特性曲线上。量化器相对于每个经换算的差分样本ud(n)产生分层码(levelcode)QL(n)。最后将这些分层码传送到解码器ADPCM级。为了更新预测器历史,用特性曲线与Q相一致的逆量化器1/Q对量化器的分层码QL(n)进行就地解码以产生量化的换算差分样本ud(n)。通过把样本ud(n)与RMS(或PEAK)比例因数相乘可得到d(n)。通过把起始预测样本p(n)与量化差分样本d(n)相加便可重构初始输入样本x(n)的量化类型x(n)。然后用该样本更新预测器历史。
矢量量化
用矢量量化器(VQ)对预测系数和高频子带样本进行编码。预测器VQ具有4个样本的矢量值和每样本三位的位速率。因此最终的代码本由4096个4值代码矢量构成。对匹配矢量的搜索构成两层树,树中的每个节点具有64个分枝。顶层存储64个只在编码器中需要并能帮助完成搜索过程的节点代码矢量。底层触发4096个在编码器和解码器中都需要的最终代码矢量。就每次搜索而言,需要进行128次4值MSE计算。利用LBG方法并借助于超过5百万个预测系数训练(training)矢量对顶层的代码本和节点矢量进行训练。相对于在对大量声学材料进行编码时显示出正向预测增益的所有子带累积训练矢量。为了测试训练组中的矢量,需得到近似30dB的平均SNRs。
高频VQ具有32个样本的矢量值(子帧的长度)其位速率为每个样本0.3125位。因此最终的代码本由1024个32值代码矢量构成。匹配矢量的搜索构成两层树,树中的每个节点具有32个分枝。顶层存储32个只在编码器中需要的节点代码矢量。底层包含1024个在编码器和解码器中都需要的最终代码矢量。就每次搜索而言,需要进行64次32值MSE计算。利用LBG方法并借助于超过7百万个高频子带样本训练矢量对顶层的代码本和节点矢量进行训练。相对于对大量采样速率为48kHz的声学材料来说,根据子带16-32的输出来累积构成矢量的样本。在48kHz的采样速率下,训练样本代表12-24kHz范围的声频。为了测量训练组中矢量,希望的是约3dB的平均SNR。虽然3dB是很小的SNR,但是其足以提供高频保真度或高频下的背景。这在感观上要比简单降低高频子带的公知技术好得多。
综合频率编码
在应用极低的位速率时,通过只对来自两个或多个声道的高频子带信号之和进行编码,而不是对它们进行独立编码可以改善重构的保真度。由于高频子带通常具有相似的能量分布,而且由于人的听觉系统主要对高频分量的“强度”而不是对它们的细微构成敏感,所以可以进行综合编码。因此,由于在任何位速率下都可以得到更多的位数以对感观上很重要的低频进行编码所以重构的平均信号能提供很好的综合保真度。
将综合频率编码指数(JOINX)直接传送到解码器中以指出哪个通道和子带已经联合以及将编码信号定位在数据流中的何处。解码器重构指定通道中的信号并将其复制到其它每个通道中。然后根据其特定的RMS比例因数对每个通道进行转换。由于综合频率编码根据其相似的能量分布而平均了时间信号,所以会降低重构保真度。因此它的应用通常限于低位速率场合和主要是针对10-20kHz的信号。在用于高位速率的媒体中,通常不可能实现综合频率编码。
子带编码器
在图10中详细地示出了利用ADPCM/APCM方法特别是通过图5中所示分析级70和ADPCM编码器72以及图2中所示全位管理系统30的相互作用对单个子带进行编码的编码过程。图11-19详细描述了图13中所述的各组成过程。滤波器组34把PCM声信号14分成32个写入各子带采样缓冲器96中的子带信号x(n)。假设声频窗的尺寸为4096个样本,每个子带样本缓冲器96存储128个样本的完整帧,把完整帧分成432个样本子帧。1024个样本的窗口尺寸产生单一的32个样本子帧。把样本x(n)送到分析级70以便确定每个子帧的预测系数、预测模式(PMODE)、瞬态模式(TMODE)和比例因数(SF)。另外还把样本x(n)送到GBM系统30,其确定每个声道中每个子带的每个子帧的位分配(ABIT)。此后,使样本x(n)转入ADPCM编码器72得到某一时刻的子帧。
对最佳预测系数的估计
用对子带样本x(n)程序块进行优化处理的标准自动相关方法98,即根据Weiner-Hopf或Yule-Walker公式分别产生适合每个子帧的H,合适的是第四序列预测系数。
对最佳预测系数的量化
优选用上述的4-元素树-搜索12-位矢量代码本(每个系数3位)对每组四个预测系数进行量化。12-位矢量代码本包括4096个系数矢量,为了达到可能的理想分布而用标准群算法对这些系数矢量进行优化处理。矢量量化(VQ)搜索100选择在系数矢量自身和最佳系数之间显示出最低加权均方差的系数矢量。然后用这些“量化矢量”代替每个子帧的最佳系数。起反向作用的VQ LUT101向ADPCM编码器72提供量化的预测系数。
对预测差值信号d(n)的估计
对ADPCM来说一个很大的难题是在实际的递归程序72之前不能容易地预测差分样本序列d(n)。对正向自适应子带ADPCM的基本要求是在进行ADPCM编码之前知道差分信号的能量,以便为将在重构样本时产生已知量化误差或噪声级的量化器计算出合适的位分配。还需要了解不同的信号能量以便在编码之前确定最佳差分比例因数。
遗憾的是,差分信号能量不仅取决于输入信号的特性而且还取决于预测器的性能。除了已知的限制例如预测器种类和预测系数最优性之外,预测器性能还受在重构样本时引入的量化误差程度或噪声的影响。由于量化噪声可通过最终的位分配ABIT和差分比例因数RMS(或PEAK)值本身来确定,所以估计差分信号的能量必须被迭代地抵达102。
步骤1.假设量化误差为零
通过使缓冲的子带样本x(n)经历不进行差分信号量化的ADPCM程序而对第一差分信号进行估计。这是在ADPCM编码循环中通过不进行量化而进行RMS转换来实现的。通过用这种方式估计差分信号d(n),可以从计算中消除比例因数和位分配值的影响。然而,由于使用了矢量量化的预测系数,所以在程序中需考虑量化误差对预测系数的影响。用反向VQ LUT104可以提供量化预测系数。为了进一步提高评估预测器的精度,应在计算之前把从现在的ADPCM预测器输出的在前一程序块结束时累积的历史样本复制到预测器中。由此可确保预测器在前一个输入缓冲器的动作结束时从现在的ADPCM预测器开始启动。
该估计过程ed(n)和实际程序d(n)之间的主要差别是忽略了量化噪声对重构样本x(n)和对降低预测精度的影响。为了进行多层次量化,通常要使噪声较小(假设通过合适的转换),因此实际的差分信号能量将与在估计时计算出的结果密切匹配。然而,当量化层的数量较少时,即当进行通常的低位速率声码时,实际的预测信号和由其得出的差分信号能量将与估计信号明显不同。这样便产生了编码噪声底值,其与早先在自适应位分配程序中预测的那些值不同。
尽管如此,预测特性的变化在应用时或对位速率的影响并不明显。因此,在不迭代的情况下可以用估计结果直接计算位分配和比例因数。如果存在这种可能性,即为子带分配的是层数很少的量化器,则可以进行附加改进通过对差分信号能量作出仔细地全面估计来补偿特性的损失。还可以根据量化层数的变化将全面估计分成不同层次以提高精度。
步骤2.用估计的位分配和比例因数进行再计算
一旦用第一估计差分信号得出了位分配(ABIT)和比例因数(SF),就可以通过用在ADPCM循环72中估计出的ABIT和RMS(或PEAK)值使下一个ADPCM估计程序运行来测试它们的最佳性。当进行第一次估计时,在开始计算之前从实际的ADPCM预测器上复制估计的预测历史从而确保从相同的点上启动两个预测器。在缓冲的输入样本全部经过第二估计循环之后,把得到的每个子带中的噪声底值与在自适应位分配程序中假设的噪声底值进行比较。通过修正位分配和/或比例因数可以补偿任何明显的差异。
每当用最当前的差分信号估计计算下一组位分配和比例因数时,可以重复步骤2以便适当地改善穿越子带分布的噪声底值。通常,如果比例因数的变化大于近似值2-3dB,则需重新计算。此外,如果位分配违反了由心理声学掩蔽程序或换言之mmse程序产生的信号-掩蔽比将会很危险。一般说来,一次重复就足够了。
子带预测模型(PMODE)的计算
为了提高编码效率,在当前子帧中的预测增益降到通过设定PMODE特征位而得到的阈值以下时,控制器106可以独立关掉预测程序。当在对输入样本组进行估计的阶段测得的预测增益(输入信号的能量与估计的差分信号能量之比)超出正阈值时,PMODE特征位将置1。相反,如果测得的预测增益小于正阈值,ADPCM预测系数将在与所述子带相应的编码器和解码器中置0,而且各PMODE也置0。把预测增益阈值设定成使其等于传输预测系数矢量的总失真率。这是通过努力确保当PMODE=1时,使ADPCM程序的编码增益总是大于或等于正向自适应PCM(APCM)编码程序的编码增益来实现的。此外,通过把PMODE设定为零和预置预测系数,就可以简便地将ADPCM程序恢复到APCM。
如果ADPCM编码增益的变化对使用来说不是很重要,则可以在任何或所有子带中使PMODEs置于高电平。相反,如果例如某些子带不会马上编码,所用的位速率高得不需要用预测增益保持声音的主观质量,信号的瞬态信息很多,或者在对声音进行剪辑时ADPCM编码声音的叠接特性曲线不能令人满意,则将PMODES置于低电平。
在编码器和解码器的ADPCM程序中以等于线性预测器更新速率的速率传送适合每个子带的各预测模式。如果个别子带具有任何与其编码声数据块有关的预测系数矢量地址,则PMODE参数的用途是向解码器传送指示。当在任何子带中PMODE=1时,数据流中将总是包含预测系数矢量地址。当在任何子带中PMODE=0时,数据流中决不会包含预测系数矢量地址,而且在编码器和解码器的ADPCM级预测系数将置0。
PMODEs的计算始于根据第一估计级,即假设没有量化误差时,用得到的相应缓冲估计差分信号能量分析缓冲子带输入信号能量。对输入样本x(n)和估计的差分样本ed(n)分别进行适合每个子带的缓冲处理。缓冲器的尺寸等于包含在每个预测更新期内的样本数,例如子帧的尺寸。然后按下列公式计算预测增益:
Pgain(dB)=20.0*Log10(RMSx(n)/RMSed(n))
其中RMSx(n)=缓冲输入样本x(n)的均方根值,RMSed(n)=缓冲估计差分样本ed(n)的均方根值。
就正的预测增益而言,差分信号是平均小于输入信号的信号,所以在相同的位速率下,用APCM中的ADPCM程序便可得到减小的重构噪声底值。就负增益而言,ADPCM编码器使得差分信号平均大于输入信号,这使得在相同的位速率下ADPCM比APCM具有更高的噪声底值。通常,能接通PMODE的预测增益阈值是正的,而且其将是一个考虑了因传输预测系数矢量地址而消耗的额外通道容量的值。
子带瞬态变化模式(TMODE)的计算
控制器106计算适合每个子带中每个子帧的瞬态变化模式(TMODE)。TMODEs表示当PMODE=1时估计差分信号ed(n)的缓冲器中或当PMODE=0时输入子带信号x(n)的缓冲器中的比例因数和样本数量。可以用与预测矢量地址相同的速率对TMODEs进行更新和将其传送到解码器。瞬态变化模式的用处是降低信号瞬态变化时听觉上的编码“前回波”伪象。
将瞬态变化定义成在低幅值信号和高幅值信号之间的快速转换。由于在子带差分样本块的范围内进行比例因数的平均,所以如果信号幅值的快速变化发生在程序块内,即瞬间发生,那么算出的比例因数将比瞬态变化发生前低幅采样时的最佳值大得多。因此在瞬态变化前的采样中出现的量化误差可能会很大。该噪声可以前回波失真的形式被查出。
在实际中,用瞬态变化模式来改变平均块长度的子带比例因数以抑制瞬态变化对在瞬态变化前进行的差分采样转换的影响。这样做的动机是因为在人的听觉系统中存在固有预掩蔽现象,为此建议在出现瞬态变化时,如果它的保持周期很短的话则应在瞬态变化发生前对噪声进行掩蔽。
根据PMODE的值,把子带样本缓冲器x(n)的子帧等内容或估计的差分缓冲器ed(n)的内容复制到瞬态变化分析缓冲器中。在此,根据分析缓冲器的采样尺寸把缓冲器的内容均匀地分成2、3或4个子子帧。例如,如果分析缓冲器包括32个子带样本(21.3ms@1500Hz),则把缓冲器隔成每8个样本中4个子子帧,在子带采样速率为1500Hz的情况下,时间分辨率为5.3ms。此外,如果分析窗由16个子带样本构成,那么只需将缓冲器分成两个具有相同时间分辨率的子子帧。
对每个子子帧内的信号进行分析并确定每个而不是第一个瞬变状态。如果发现任何子子帧出现瞬变,则将相对于分析缓冲器即当前子帧产生两个独立的比例因数。根据瞬变子子帧前面的子子帧中存在的样本计算第一比例因数。根据同时存在于在前子子帧和瞬变子子帧中的样本计算第二比例因数。
由于通过分析窗自身的启动可自动抑制量化噪声所以不计算第一子子帧的瞬变状态。如果出现瞬变的子子帧多于一个,则只考虑首先出现的那个子子帧。如果根据没有检测到瞬变子缓冲器,则只用分析缓冲器中的所有样本计算一个比例因数。用这种方式,可以不采用包括瞬变样本的比例因数值来转换在时间上多于一个子子帧返回周期的早期采样。由此,把预瞬变量化噪声限制在子子帧周期。
瞬变声明
如果前一子缓冲器中的瞬变能量比超过瞬变阈值(TT),而且前一子子帧中的能量低于预瞬变阈值(PTT)则表明在子子帧中有瞬变。TT和PTT的值取决于位速率和所需的预回波的抑制程度。在查出的预回波失真与其它编码伪象(如果有的话)的能级匹配之前,这些值通常是变化的。增加TT和/或减小PTT的值都将减小存在瞬变的子子帧的相似性,并由此降低与比例因数传输有关的位速率。相反,减小TT和/或增加PTT的值将使存在瞬变的子子帧的相似性增加,并由此增加与比例因数传输相关的位速率。
由于TT和PTT是相对于每个子带分别设定的,所以在编码器中瞬态检测的灵敏度可以相对所有子带独立设定。例如,如果发现在高频子带中的预回波在感性上小于低频子带中的预回波,那么可以设定阈值来减小高频子带中出现的瞬变相似性。由于将TMODEs嵌入压缩的数据流中,所以解码器不必知道在编码器中使用的瞬变检测算法既可对TMODE信息进行合适地解码。
四种子缓冲器的结构
如图11a所示,如果子带分析缓冲器109中的第一子子帧108出现瞬变,或如果没有检测到瞬变子子帧,则TMODE=0。如果第二子子帧而不是第一子子帧出现瞬变,则TMODE=1。如果第三子子帧而不是第一或第二子子帧出现瞬变,则TMODE=2。如果只有第四子子帧出现瞬变则TMODE=3。
比例因数的计算
如图11b所示,当TMODE=0时,在所有子子帧上计算比例因数110。当TMODE=1时,在第一子子帧上计算第一比例因数和在所有在先的子子帧上计算第二比例因数。当TMODE=2时,在第一和第二子子帧上计算第一比例因数和在所有在先子子帧上计算第二比例因数。当TMODE=3时,在第一、第二和第三子子帧上计算第一比例因数而在第四子子帧上计算第二比例因数。
用TMODE进行ADPCM编码和解码
当TMODE=0时,在所有分析缓冲器即子帧工作期间用一个比例因数转换子带差分样本,并将该比例因数传送到解码器以便进行反向转换。当TMODE>0时,用两个比例因数转换子带差分样本并将两个比例因数传送到解码器。对于任何TMODE来说,用每个比例因数对在第一位置上产生的差分样本进行转换。
子带比例因数(RMS或PEAK)的计算
根据相应子带的PMODE值,用估计的差分样本ed(n)或输入的子带样本x(n)来计算合适的比例因数(s)。在该计算中用TMODEs确定比例因数的数量并在缓冲器中识别相应的子子帧。
RMS比例因数计算
对第j个子带而言,按下列公式计算rms比例因数:
当TMODE=0时,单个rms的值是:
RM S j = ( Σ n = 1 L ed ( n ) 2 / L ) 0.5
其中L是子帧中的样本数量。
当TMODE>0时,两个rms值为:
RMS 1 j = ( Σ n = 1 k ed ( n ) 2 / L ) 0.5
RMS 2 j = ( Σ n = 1 k + 1 ed ( n ) 2 / L ) 0.5
其中k=(TMODE*L/NSB),NSB是均匀子子帧的数量。
如果PMODE=0,则用输入样本xj(n)替换样本edj(n)。
PEAK比例因数的计算
就第j个子带而言,按下列公式计算峰值比例因数:
当TMODE=0时,一个峰值是:
PEAKj=MAX(ABS(edj(n))),n=1,L
当TMODE>0时,两个峰值是
PEAK1j=MAX(ABS(edj(n))),n=1,(TMODE*L/NSB)
PEAK2j=MAX(ABS(edj(n))),n=(1+TMODE*L/NSB),L
如果PMODE=0则用输入样本xj(n)替换样本edj(n)。
PMODE、TMODE和比例因数的量化
PMODEs的量化
预测模式特征只有两个值,通或断,将其直接送到解码器中作为1-位编码。
TMODEs的量化
瞬变模式特征最多具有4个值:0、1、2和3,使用2-位无符号整数代码字或在努力把TMODEs的平均字长减到2位以下并选择性地通过4-层熵表把上述值直接传送到解码器中。通常在采用低位率时为了节约位数而使用选择性的熵编码。
图12中详细示出的熵编码程序112如下:把j子带的瞬变模式编码TMODE(j)变换成多个(p)中度增加的4-层可变长度代码本,其中针对不同输入的统计特性对每个代码本进行优化。把TMODE的值转换成4-层表114并计算116与每个表(NBp)有关的所有位的应用。利用THUFF变址(index)选择118在整个转换过程中构成最低位应用的表格。从该表格中抽取转换代码VTMODE(j),并将其与THUFF变址字一道压缩和送到解码器。保持同组4-层反向表的解码器利用THUFF变址使到来的可变长度编码VTMODE(j)进入合适的表格进行解码使之回到TMODE变址。
子带比例因数的量化
为了将比例因数传送到解码器必须将它们量化成已知的编码格式。在该系统中,利用均匀64-层对数特性、均匀128-层对数特性或可变速编码的均匀64-层对数特性对比例因数进行量化120。在两种情况下,64-层量化器显示的步长为2.25dB,而128-层的步长为1.25dB。64-层量化用于低的媒体位速率,附加的可变速率编码用于使用低位速率的场合,而128-层通常用于高位速率。
图13中示出了量化过程120。把从缓冲器121中读出的比例因数、RMS或PEAK转换成对数域122,然后根据编码模式控制器128的判断将其送到64-层或128-层均匀量化器124、126。然后把对数量化的比例因数写入缓冲器130中。128-层和64-层量化器的范围不同以便分别用近似为160dB和144dB的动态范围覆盖比例因数。把128-层的上限设定为能覆盖24-位输入PCM数字式声信号的动态范围。把64-层的上限设定为能覆盖20-位输入PCM数字式声信号的动态范围。
把对数比例因数转换到量化器并用最接近的量化层代码RMSQL(或PEAKQL)代替比例因数。在使用64-层量化器的情况下,这些编码为6-位长,其范围为0-63。在使用128-层量化器的情况下,编码长度为7-位,其范围为0-127。
通过把层代码转回到各逆量化特性并给出RMSq(或PEAKq)值便可简便地实现逆量化131。就ADPCM(或当PMODE=0时为APCM)差分样本的转换而言,既在编码器又在解码器中使用量化比例因数,由此可确保转换和反向转换过程相一致。
如果需要降低64-层量化器编码的位速率,则要进行附加熵或可变长度的编码。64-层编码是从第二子带(j=2)开始到最高现用子带穿越j个子带的第一阶不同编码132。该程序带可以用于对PEAK比例因数进行编码。有符号的不同编码DRMSQL(j)(或DPEAKQL(j))的最大范围为+/-63而且将这些编码存储在缓冲器134中。为了在原始的6-位编码上降低它们的位速率,把不同的编码转换成多个(p)127-层中度增加的可变长度代码本。相对于不同的输入统计特性对每个代码本进行优化。
除了使用p127-层可变长度编码表之外,对有符号的不同编码进行熵编码的程序与图12中所示瞬变模式中使用的熵编码程序相同。利用SHUFF变址选择在转换过程中提供最低位应用的表格。从该表格中抽出转换的编码VDRMSQL(j),将其与SHUFF变址字一道压缩和传送到解码器。保持了同组(p)127-位反向表的解码器,利用SHUFF变址把到来的可变长度编码送入合适的表中,以便对其进行解码使之回到不同的量化器编码层。用下列程序使不同的编码层再现成绝对值:
RMSQL(1)=DRMSQL(1)
RMSQL(j)=DRMSQL(j)+RMSQL(j-1)j=2,…K
而用下列程序使PEAK的不同编码层再现成绝对值:
PEAKQL(1)=DPEAKQL(1)
PEAKQL(j)=DPEAKQL(j)+PEAKQL(j-1)j=2,…K
其中在两种情况下K=现用子带的数量。
全位分配
如图10所示的全位管理系统30管理位分配(ABIT),并确定适合多通道声码器的有源子带(SUBS)和综合频率策略(JOINX)以及VQ策略,以便以较低的位速率提供主观透明编码。由此可在保持或提高声音保真度的同时增加已被编码并存储在固定媒体上的声道数量和/或演播时间。通常,GBM系统30首先根据用编码器的预测增益修正的心理声学分析结果将各位分配到每个子带。然后根据mmse图分配各剩余位以便降低所有噪声底值。为了提高编码效率,GBM系统同时在所有声道、所有子带上并穿越全部帧进行位分配。此外,可以利用综合频率的编码策略。用这种方式,系统可以利用在声道、交叉频率和整个时间之间非均匀分布的信号能量。
心理声学分析
用心理声学测量法确定声信号中与感性不相关的信息。把与感性不相关的信息定义为不能够被人的听觉听到和能够在时间域、频率域或在其它一些背景下测量到的那部分声信号。J.D.约翰斯顿(J.D.Johnston):“采用感性噪声标准的声信号转换编码”见《地方通信选编》中的IEEE刊物,第JSAC-6期,第2号,第314~323页,1988年2月,其中描述了心理声学编码的一般原理。
两个主要因素将影响心理声学测量。一个是适合于人的听力且与频率有关的绝对阈值。另一个是掩蔽效应,即人所能听到的盖位与其同时演奏或在其之后演奏的第二种声音的一种声音。换句话说,第一种声音能阻止我们听到第二种声音,也就是说将其掩蔽掉。
在子带编码器中,心理声学计算的最终结果是一组表示在某瞬间相对于每个子带无声量级的数码。该计算方法是公知的而且在此将其与MPEG1压缩标准ISO/IEC DIS 11172“信息技术-高达1.5Mbits/s数字式存储媒体的运动图象和相关声音的编码”1992相结合。这些数码随声信号产生动态变化。编码器借助位分配程序调节子带中的量化噪声底值以便使这些子带中的量化噪声小于可听范围。
精确的心理声学计算通常需要在时间与频率的转换中具备高频率分辨率。这意味着需要较大的分析窗以便进行时间频率转换。标准的分析窗尺寸是与压缩声数据的帧相应的1024个样本。长度1024fft的频率分辨率大致与人耳的瞬时分辨率匹配。
心理声学模型的输出是32个子带中每一个子带的信号-掩蔽(SMR)比。SMR表示个别子带所承受的量化噪声量,其还表示使子带中的样本量化所需的位数。具体地说,大的SMR(>>1)表示需要的位数很多,而小SMR(>0)则表示需要的位数很少。如果SMR<0,则声信号处于噪声掩蔽阈值之下,这时不需要量化位数。
如图14所示,通常通过1)根据PCM声样本计算fft,优选长度为1024,得出一系列频率系数142,2)根据与频率有关的音质和噪声心理掩蔽针144对每个子带进行频率系数卷积处理,3)对得到的每个子带系数进行平均得出SMR的量级,和4)根据图15中所示人的听觉响应146对SMRs进行选择性的归一化处理。
当频率接近4KHz时人耳的灵敏度最高而随着频率的升高或降低灵敏度将下降。因此,要想感受相同的量级,20kHz的信号显然比4kHz的信号显得过强。所以,通常,近似4kHz频率的SMRs比远离该区域的频率重要得多。然而,曲线的精确形状与传送给听者的信号的平均功率有关。随着电压的增加,听觉响应146受到压制。因此,在其它电压下将对特定电压的优化系统进行次优化。结果是,或者选择标准功率级以便对SMR进行归一化处理或者是不进行归一化处理。图16中示出了得到的32个子带的SMRs148。
位分配程序
不管JFC是否能实现,GBM系统30首先选择用VQ和ADPCM算法对子带进行编码时应采用的合适编码策略。因此,GBM系统将选择心理声学或者是MMSE位分配方法。例如,在高位速率下,系统可能无法使用心理声学模式而使用有效的mmse分配系统。这样可以在当重构声信号中没有任何感性变化的情况下降低计算的复杂性。相反,在低速率下,系统能够激活上述综合频率编码系统从而提高在低频下的重构保真度。GBM系统能够根据逐帧基础上信号的瞬变信息在正常的心理声学分配和mmse分配之间转换。当瞬变信息量较大时,在计算SMRs时使用的稳态假设就不再是真实的,因此mmse图可以提供较好的特性。
就心理声学分配而言,GBM系统首先分配有效位以满足达到心理声学效果的条件,然后对剩余位进行分配以便降低所有的噪声底值。第一步是确定上述当前帧的每个子带之SMRs。下一步是调节各子带中预期增益(Pgain)的SMRs从而形成掩蔽-噪声定量比(MNRs)。原则上ADPCM编码器将提供一部分所需的SMR。所以用极少的位数便可得到听不到的心理声学噪声级。
假设PMODE=1,则第j个子带的MNR由下式给出:
MNR(j)=SMR(j)-Pgain(j)*PEF(ABIT)
其中PEF(ABIT)是量化器的预测有效因数。为了计算MNR(j),设计者必须估计位分配(ABIT)情况,这可以通过只在SMR(j)的基础上进行位分配或通过假设PEF(ABIT)=1而完成。在高位速率的媒体上,有效预测增益近似等于计算的预测增益。然而,在低位速率下,有效预测增益将降低。用例如5-层量化器得到的有效预测增益近似为估计预测增益的0.7倍,而65-层量化器则使有效预测增益近似等于估计的预测增益,PEF=1.0。在此范围内,当位速率为零时,实际上无法进行预测编码而且有效预测增益为零。
在下一步骤中,GBM系统30生成满足每个子带之MNR的位分配系统。这是利用1位等于6dB信号失真的近似值而实现的。为了确保编码失真小于心理声学听觉阈值,而使位速率是用6dB除以MNR得到的最大整数。其由下式给出:
通过用这种方式进行位分配,重构信号中的噪声级156将如图17所示随信号本身157而变化。因此,在信号很强的频率下,噪声级将比较高,但仍将保持在听力范围之外。在信号比较弱的频率下,噪声底值将很小且不会被听到。与这种心理声学模式相关的平均误差总是大于mmse噪声级158,但是其音响特性较好,特别是在低位速率下更是如此。
在所有声道每个子带上分配的位数总和大于或小于目标位速率的情况下,GBM程序将迭代减小或增加各子带的位分配。此外,可计算每个声道的目标位速率。这虽然是亚最佳的但极易于用硬件实现。例如,有效位可以在声道中均匀地分布或是与每个通道的平均SMR或RMS均衡分布。
在包含VQ码位和边信息的局部位分配总和超过目标位速率的情况下,全位管理程序将逐渐降低局部子带的位分配。有多种技术可用于降低平均位速率。首先,可以通过最大整数运算对入位的位速率进行舍位。然后从具有最小MNRs的子带中取出一位。此外,可以截断高频子带或进行综合频率编码。所有位速率降低策略均遵循用合适的方式逐渐降低编码分辨率的基本原则,所述方式首先引入感觉上最少唐突(offensive)感的策略和最后使用最唐突的策略。
在目标位速率大于包含VQ编码位和边信息之局部位分配总和的情况下,全位管理程序将逐渐地和迭代地增加局部子带位分配,以便降低重构信号的全部噪声底值。这样可以对已经预先分配了零位的子带进行编码。如果能够采用PMODE的话,可能需要用这种方式得到在‘接通’的子带中的总位数以便反映出在传输任何预测系数时的成本。
GBM程序能够选择三个不同系统中的一个以便分配剩余位。一种选择是用对 所有位进行再分配以便使噪声底值近似平坦的mmse方法。这等于不能使用最初的心理声学模型。为了得到mmse噪声底值,在用完所有位之前应使图18a中示出的子带RMS值的图160的上边如图18b所示向下转并“注水(waterfilled)”。将这种公知技术称为注水是因为随着分配位数量的增加失真度均匀降低。在图中所示的例子中,把第一位分配给子带1,把第二和第三位分配给子带1和2,把第四至第七位分配给子带1、2、4和7,等等。此外,还在每个子带上分配一位以保证对每个子带进行编码,此后将剩余位注水。
其次,优选的选择是按照上述mmse方法和RMS图来分配 位。这种方法的效果是能在保持与心理声学掩蔽有关的形状的同时均匀降低图17中所示的噪声底值157。在心理声学和mse失真之间提供了一种很好的折衷方案。
第三种方法是在适用于子带的RMS和MNR值之间的差值图的情况下用mmse方法分配剩余位。这种方法的效果是可以在位速率增加时将噪声底值的形状平滑地从最佳心理声学形状157变为最佳(平缓的)mmse形状158。在这些系统的任何一种系统中,如果相对于源PCM来说任何子带中的编码误差低于0.5LSB,就不会将更多的位分配到该子带中。可以用选择性固定的子带位分配的最大值来限定分配到特定子带的最大位数。
在上面讨论的编码系统中,我们已经假设每个采样的平均位速率是固定的而且形成了重构声信号最大保真度的位分配。此外,失真度、mse或感觉是固定的而且允许位速率变到满足失真度的条件。在mmse方法中,在满足失真度条件之前将RMS图简单地注水。将根据子带的RMS层改变所需的位速率。在心理声学方法中,进行位分配以满足各MNRs。结果,将根据各SMRs和预测增益改变位速率。这种分配目前不是最有用的,因为现代的解码器均以固定的速率工作。然而,实际上在不久的将来可以用交替传递系统例如ATM或随机存取存储媒体进行可变速率编码。
位分配变址(ABIT)的量化
在全位管理过程中,通过自适应位分配程序可以相对于每个子带和每个声道产生位分配变址(bit allocation indexes)(ABIT)。在编码器中变址的目的在于指示图10中所示量化差值信号以便在解码的声音中得到主观最佳重构噪声底值所需层(levels)162的数量。在解码器中解码的目的是指示逆量化所需的层数。相对于每个分析缓冲器产生变址而且变址值的范围为0-27。变址值、量化层的数目和近似的最终差分子带SNQR之间的关系示于表3中。
                       表3
ABIT变址  量化层的数目   编码长度(位)   SN Q R(dB)
0             0                  0           -
1             3              可变的          8
2             5              可变的          12
3           7(或8)           可变的(或3)     16
4             9              可变的          19
5             13             可变的          21
6           17(或16)         可变的(或4)     24
7             25             可变的          27
8           33(或32)         可变的(或5)     30
9           65(或64)         可变的(或6)     36
10          129(或128)       可变的(或7)     42
11            256                 8          48
12            512                 9          54
13            1024                10         60
14            2048                11         66
15            4096                12         72
16            8192                13         78
17            16384               14         84
18            32768               15         90
19            65536               16         96
20            131072              17         102
21            262144              18         108
22            524268              19         114
23            1048576             20         120
24            2097152             21         126
25            4194304             22         132
26            8388608             23         138
27            16777216            24         144
可以用4-位不带符号的整数编码字、5-位不带符号的整数编码字或12-层熵表将位分配变址(ABIT)直接传输到解码器。通常,可以在低位速率场合下使用熵编码以进行位的保存。ABIT编码的方法是通过在编码器中进行模式控制而设定的并将编码送到解码器。熵编码166把ABIT变址标到特定的代码本上,所述代码本是用图12所示的程序并借助于12-层ABIT表通过BHUFF变址和代码本中的特定码VABIT进行识别的。
全位速率控制
由于可以用熵的可变长度代码本选择性地对边信息和差分子带样本进行编码,所以当以固定的速率传输压缩的比特流时必须用某些机构来调节编码器最终的位速率。由于一旦开始计算通常就不再需要改变边信息,所以在满足速率抑制条件之前最好通过迭代改变ADPCM编码器中的差分子带样本量化程序来实现位速率的调节。
在上述系统中,图10中的全速率控制(GRC)系统178调节位速率,其通过改变分层码值的统计学分布而形成把量化层码转换成熵表的程序。熵表显示了层码值越大码长越长的相似趋势。在这种情况下,平均位速率随低值编码层的增加而降低,反之亦然。在ADPCM(或APCM)量化程序中,比例因数的大小确定了分层编码值的分布或使用。例如,随着比例因数大小的增加差分采样将在较低层上量化,因此编码值将逐渐变小。这样,将转而产生较小的商编码字长和较低的位速率。
这种方法的优点是通过增加比例因数的大小把子带采样中的重构噪声也提高到相同的水平。然而实际上,对比例因数的调节通常不大于1dB-3dB。如果需要进行较大的调整,则最好是返回到位分配和减少所有的位分配而不要冒因使用升高的比例因数可能在子带中出现可听到量化噪声的危险。
在重复ADPCM编码循环的情况下,为了调节熵编码的ADPCM位分配,将每个子带的预测历史样本存储在临时缓冲器中。此外,利用从子带LPC分析推出的预测系数AH以及比例因数RMS(或PEAK)、量化位分配ABIT、瞬变模式TMODE、和从估计的差分信号中推出的预测模式PMODE通过完整的ADPCM程序对所有子带采样缓冲器进行编码。将最终的量化层编码缓冲并转换到熵的可变长度代码本上,这显示出再次使用位分配变址确定代码本大小的最低位应用。
随后,GRC系统利用在所有变址上的相同位分配变址分析每个子带使用的位数。例如,当ABIT=1时,全位管理中位分配计算假设的平均速率是每个子带样本为1.4(即,假设在最佳层码幅值分布的情况下熵编码本的平均速率)。如果在ABIT=1时所有子带使用的全部位数大于1.4/(子带采样的总数),那么所有这些子带的比例因数都将增加从而使位速率受影响而下降。在存取所有ABIT变址速率之前,最好是不作出调节子带比例因数的决定。由此,用低于位分配程序中假设的位速率进行变址可以补偿用高于位分配程序的位速率进行的变址。这种估计可扩展到所有合适的声道中。
为降低所有位速率而建议的程序是以超过阈值的最低ABIT变址位速率开始并增加具有这种位分配的每个子带中的比例因数。实际位的应用减少了当这些子带最初处于分配的正常速率之上时的位数。如果变化后使用的位数仍然超出允许的最大值,那么下一个使用位数超出正常值的最高ABIT变址的子带比例因数将会增加。这个程序连续进行直到使用的位数变到最大值以下为止。
一旦达到这一目的,就将旧的历史数据装入预测器中并且重复已经改变了其比例因数的那些子带的ADPCM编码程序72。此后,将层编码再次转换成最佳熵代码本并重新计算使用的位数。如果使用的所有位中仍有超过正常速率的,那么要进一步增大比例因数并且重复进行上述循环。
改变比例因数的方式有两种。第一种是向解码器传输每个ABIT变址的调整系数。例如2-位的字能够发出调整范围约为0、1、2和3dB的信号。由于采用ABIT变址的所有子带都使用相同的调整系数,所以只有变址1-10可以使用熵碥码,对于所有子带来说需要传输的调整系数的最大数目是10。此外,通过选择高量化层可以改变每个子带中的比例因数。然而,由于比例因数量化器的步长分别为1.25和2.5dB,所以比例因数的调节限于这些步内。然而,当使用这些技术时,如果能够进行熵编码的话,则需要重新计算比例因数的差分编码和最终使用的位数。
一般说来,例如当位速率低于所需的位速率时,可以使用同样的程序来增加位速率。在这种情况下,将减小比例因数以强制进行差分采样从而大量地使用更外侧的量化层,并因此而使用熵表中更长的代码字。
如果在合适的迭代数内或在传输比例因数调节系数的情况下不能减少位分配变址使用的位数,则调节的步数就已经达到极限,随后可进行二次修正。首先,可以增加正常速率范围内的子带比例因数,由此降低整体位速率。此外,可以中止所有ADPCM编码程序并重新计算穿越子带的自适应位分配,这时使用极少的位数。
数据流格式化
图10所示的多路转换器32压缩每个通道的数据然后把每个通道的压缩数据多路转换成输出帧以形成数据流16。设计压缩和多路转换数据的方法,即图19所示的帧格式使得声码器可以在较宽范围内使用并能扩展到更高的采样频率,限制每帧内的数据量可以在每个子子帧独立地开始播放从而减少等待时间和降低解码误差。
如图所示,单个帧186(4096 PCM采样/ch)确定了有足够信息驻留以对声频块进行适当解码的比特流边界,该单个帧由4个子帧188(1024 PCM采样/ch)构成,而每个子帧又由4个子子帧190(256 PCM采样/ch)构成。在每个声频帧开始时置入帧同步字192。帧标题信息194主要形成与帧186的结构和编码器的结构有关的信息,所述编码器产生比特流和各种选择操作特征,例如嵌入的动态范围控制和时间码。如果需要下行混合、如果进行了动态距离补偿和如果在数据流中包含辅助数据字节的话,选择的标题信息196将通知解码器。声码标题198表示在编码器中使用以便对编码的‘边信息’即位分配、比例因数、PMODES、TMODES、代码本等进行组合的压缩装置和编码格式。剩余的帧由SUBFS串行声频子帧188构成。
每个子帧均以声码边信息开始,该信息使得与用于把声频压缩到解码器的多个键盘编码系统相关的信息滞后。这些信息包括瞬变检测、预测编码、自适应位分配、高频矢量量化、强度编码和自适应转换。可以用上述编码标题信息从数据流中对这些数据中的很多数据进行解压缩。高频VQ编码阵列202包括用VQSUB变址表示的每个高频子带中的10-位变址。也可以选择低频效应阵列204,其表示可用于驱动例如次低音扬声器的极低频数据。
用霍夫曼/固定逆量化器对声频阵列206进行解码并将其分成多个子子帧(SSC),每次解码达到每个声道256 PCM个样本。只有当采样频率大于48kHz时才会出现过采样208。为了保持兼容,在采样速率高于48kHz时不能工作的解码器应当跳过该声数据阵列。用DSYNC210来改变声帧中子帧的结束位置。如果该位置无法改变,则表明子帧中的声解码不可靠。结果,要么对帧进行噪声抑制要么重复前一帧。
子带解码器
图20是子带采样编码器18的方框图。解码器与编码器相比相当简单而且并不包括对重构声频例如位分配的质量来说很重要的计算。在用解压器40对压缩的声数据流16进行同步解压之后,进行检测和如果需要的话校正因传输而引入的误差,并且把数据多路分配到各声道中。把子带差分信号量化成PCM信号和对每个声道进行反向滤波以便把信号转回到时间域。
接收声帧和标题解压
在编码器中将编码数据流压缩(或帧)而且在每帧中包括可与真实声码本身分离且用于使解码器同步、进行误差检测和校正、声码状态标记和对边信息进行编码的附加数据流。解压器40检测SYNC字并抽取帧尺寸FSIZE。编码的比特流构成串行的声帧,每个帧都以32-位(0x7ffe8001)同步字(SYNC)开始。从下列同步字的字节中抽取声帧的实际尺寸FSIZE。这样便允许编程员设定‘帧结束’定时器以便减少软件的辅助操作。接着抽取NBlks使解码器计算声频窗口尺寸(32(Nblks+1))。由此通知解码器抽取了什么样的边信息和产生了多少重构样本。只要接收到帧标题字节(sync,ftype,surp,nblks,fsize,amode,sfreq,rate,mixt,dynf,dynct,time,auxcnt,Iff,hflag),就可以用Reed Solomon检验字节HCRC检验第一个12字节的真实性。这些程序将校正14字节之外的1个错误字节或标出2个错误字节。在完成了误差检验之后,用标题信息更新解码器标记。
可以抽取下列选择信息标题(filts,vernum,chist,pcmr,unspec)内的HCRC并用其来更新解码器标记。由于该信息将不会逐帧改变,所以可以用多数表决系统来补偿位误差。可以使用选择ReedSolomon检验字节OCRC改变选择数据。
只需要在每帧中传输声码帧标题(shbfs,subs,chs,vqsub,joinx,thuff,shuff,bhuff,sel5,sel7,sel9,sel13,sel17,sel25,sel33,sel65,sel129,ahcrc)。可以使用声Reed Solomon检验字节AHCRC改变这些标题。相对于由CHS确定的每个声道重复大多数标题。
解压缩子帧编码边信息
将声码帧分成多个子帧(SUBFS)。所述子帧包括所需要的所有边信息(pmode,pvq,tmode,scales,abits,hfreq)以便在与任何其它子帧无关的情况下对每个声子帧进行编码。通过首先对其边信息进行解码对每个连续的子帧进行解码。
相对于每一个有源子带和穿过所有声道传输1-位预测模式(PMODE)标记。PMODE标记对当前子帧有效。 PMODE=0意味着预测系数不包含在该子带的声帧中。在这种情况下,在该子帧期间使这个频带中的预测系数置零。PMODE=1意味着边信息包含该子带的预测系数。在这种情况下,在子帧期间抽取预测系数并将其安装在它的预测器中。
相对于pmode阵列中的每个PMODE=1而言,相应的预测系数VQ寻址变址(address index)位于阵列PVQ中。变址固定于不带符号的12-位整数字上并且通过把12-位整数转换成矢量表266可以从查寻表中抽取4个预测系数。
位分配变址(ABIT)表示在逆量化器中的层数,逆量化器把子带声码转回到绝对值。解压缩格式不同于每个声道中的ABITs,其与BHUFF变址和特定的VABIT码256相关。
用瞬变模式边信息(TMODE)238表示在每个子带中相对于子帧的瞬变位置。将每个子帧分成1-4个子子帧。就子带样本而言,每个子子帧由8个样本构成。最大子帧尺寸是32个子带样本。如果瞬变发生在每一个子子帧内,则tmode=0。当tmode=1时表示瞬变出现在第二子子帧内,以此类推。为了控制例如前回波等瞬变失真,在TMODE大于零的情况下向子帧子带传输两个比例因数。从声标题中抽取THUFF变址以确定对TMODEs进行解码所需的方法。当THUFF=3时,将TMODEs解压缩成不带符号的2-位整数。
传输比例因数变址以便在每个子帧内对子带声码进行适当转换。如果TMODE等于零,则传输一个比例因数。如果对于所有子带来说TMODE都大于零,那么同时传输两个比例因数。通过从声标题中抽取SHUFF变址240可确定对每个独立声道进行SCALES解码所需的方法。VDRMSQL变址确定RMS比例因数的值。
在特定模式下,选用五个129层带符号的霍夫曼逆量化器对SCALES变址进行解压缩。然而,要对最终的逆量化变址进行不同的编码并将其转换成下列绝对值:
ABS_SCALE(n+1)=SCALES(n)-SCALES(n+1),其中n是在声道中从第一子带开始的第n个差分比例因数。
在低位速率声码模式下,声码器利用矢量量化直接对高频子带声样本进行有效编码。在这些子带中使用非差分编码和必须使所有与正常ADPCM程序有关的阵列保持复位。用VQSUB表示利用VQ编码的第一子带并用这种方式对SUBS以内的所有子带进行编码。
借助固定的10-位不带符号整数对高频变址(HFREQ)进行解压缩248。通过应用合适的变址从Q4二进制小数(fractionalbinary)LUT中抽取每个子带子帧所需的32个样本。在启动高频VQ模式的每个通道中重复这一过程。
有效通道的十中抽一采样因数总是X128。当PSC=0时由SSC*2或当PSC不等于零时由(SSC+1)*2给出LFE中存在的8-位有效采样数。在LFE阵列的端部包含有附加的7-位比例因数(不带符号的整数)而且用7-位LUT将其转换成rms。
解压缩子子帧声码阵列
通过ABIT变址和在ABIT<11的情况下通过SEL变址来驱动子带声码的抽取过程。使用可变长度的霍夫曼码或固定的线性编码将声码格式化。通常ABIT变址为10或小于10意味着采用霍夫曼可变长度编码,其由编码VQL(n)258选定,而当ABIT大于10时总是预示采用固定码。所有量化器都具有中性的均匀特性。对于固定码(Y2)量化器而言,降低了最大的反向层。将声码压缩成子子帧,每个子子帧代表8个子带样本中的最大值,在当前子帧中使这些子子帧重复4次。
如果采样速率标记(SFREQ)表示的速率高于48kH,那么将在声帧中存在过声(over_audio)数据阵列。在该阵列中首先出现的两个字节将表示过声的字节尺寸。此外,应将解码器硬件的采样速率设定成使其在与高频采样速率有关的SFREQ/2或SFREQ/4下工作。
解压缩同步检验
在每个子帧结束时对数据解压缩检验字DSYNC=0xffff进行检测以便验证解压缩的完好性。在低声位速率下,如果标题、边信息或声阵列出现位误差的毛病,则在边信息和声码中使用的各种码字就可能引起解压缩偏移。如果解压缩的指示字没有指向DSYNC的始端,则认为前一个子帧的声音是不可靠的。只要对所有的边信息和声数据都进行了解压缩,解码器将把多通道声信号同时重构成一个子帧。图20表示在单个通道中相对于一个子带的基带解码器部分。
重构RMS比例因数
解码器重构造合AD PCM、VQ和JFC算法的RMS比例因数(SCALES)。特别是,把VTMODE和THUFF变址反向转换成与当前子帧的瞬变模式(TMOD)相一致。此后,SHUFF变址、VDRMSQL码和TMODE反向转换成重构差分RMS编码。将差分RMS编码进行反向差分编码242以便选择RMS码,将码逆量化244以形成RMS比例因数。
逆量化的高频矢量
解码器对高频矢量进行逆量化以重构子带声信号。特别是,当用起始VQ子带(VQSUBS)识别时,把抽取的标有8-位小数(Q4)二进制数的高频样本(HFREQ)变换成反向VQ Iut248。将选定的表格值逆量化250,并通过RMS比例因数进行转换252。
逆量化声码
在进入ADPCM循环之前,对声码进行逆量化并对其进行转换以形成重构的子带差值样本。逆量化是首先通过对VABIT和BHUFF变址进行反向转换以给出可确定步长和量化层数量的ABIT变址和进一步通过反向转换能产生量化器层编码QL(n)的SEL变址和VQL(n)声码来实现的。随后,把码字QL(n)转换到由ABIT和SEL变址指定的逆量化器查寻表260。虽然ABIT对这些编码进行了排序,但是每个独立的声道都将具有独立的SEL指定器。查寻过程产生带符号的量化层数,通过与量化器的步长相乘可以将其转换成单位rms。通过将单位rms值乘以指定的RMS比例因数(SCALES)262可以将该单位值转换成完全差值样本。
1.QL[n]=1/Q[码[n]],其中1/Q是逆量化器查寻表
2.Y[n]=Q L[n]*步长[abits]
3.Rd[n]=Y[n]*比例因数,其中Rd=重构的差值样本逆ADPCM
按照下列方式对每个子带差值样本执行ADPCM解码程序:
1.从逆VQ Iut268输入预测系数。
2.通过用保持在预测器历史阵列268中的前4个重构子带样本对当前的预测系数进行卷积处理得到预测的样本。
p[n]=sum(Coeff[i]*R[n-i]),在n=当前采样周期的情况下,i=1,4
3.将预测样本与重构的差值样本相加产生重构的子带样本270。
R[n]=Rd[n]+P[n]
4.更新预测器的历史,即把当前的重构子带样本复制到历史表的顶部。
R[n-i]=R[n-i+1],i=4,1
在PMODE=0的情况下,预测系数将为零,预测样本也为零,而且重构的子带样本等于差值子带样本。虽然在这种情况下不需要进行预测计算,但是在PMODE应在下一个子帧中激活的情况下,则需要将预测历史更新。此外,如果HFLAG在当前声帧中激活,则应在对帧中首先出现的子子帧进行解码之前清除预测历史。通常将从此点开始更新历史。
在高频VQ子带或未选择(即上述SUBS限制)子带的情况下,预测历史将保持清除直到子带预测器激活为止。
ADPCM、VQ和JFC解码的选择控制
第一“开关”控制ADPCM或VQ输出的选择。VQSUBS变址与VQ编码的起始子带相对应。因此,如果当前子带低于VQSUBS,开关将选择ADPCM输出。否则选择VQ输出。第二“开关”278控制直流通道输出或JFC编码输出。JOINX变址确定连接哪一个通道和重构信号是在哪一个通道中产生的。重构的JFC信号形成其它通道中JFC输入的强度源。因此,如果当前子带是JFC的一部分并且没有指定通道,则开关将选择JFC输出。一般情况下开关选择通道输出。
下行矩阵
用AMODE表示数据流的声码模式。然后把解码的声道改成动态范围控制数据使之与解码器硬件280上的实际输出通道装置相匹配。
动态范围控制数据
在编码阶段282可以选择性地将动态范围系数DCOEFF嵌入声帧中。这个特征的目的是便于在解码器的输出中实现声频动态范围的压缩。当在高音通道中不存在损坏扬声器的危险时在背景噪声级较高以致无法鉴别低能级信号的收听环境中动态范围的压缩是特别重要的。由于更多地采用展现动态范围高达110dB的20-位PCM声记录而使该问题进一步复杂化。
根据帧的窗口尺寸(NBLKS),对任何编码模式(DYNF)来说每个声道可传输一、二或四个系数。如果传输单个系数,则可用于全帧。如果传输两个系数,则第一个系数相对于帧的第一半而第二个系数相对于帧的第二半。传输四个系数时,四个系数分布在每个帧的四分之一上。通过在传输值之间进行局部内插可以达到较高的时间分辨率。
每个系数是8-位带符号的小数Q2二进制数,而且代表表(53)中示出的算法增益值,该表给出的范围是在0.25dB步中的增益值为+/-31.75dB。按通道数对系数进行排序。用解码声样本乘以线性系数可以影响动态范围。
通过对解码器的系数值进行适当调节或通过忽略系数而将其完全截断可以改变压缩的程度。
32-带内插滤波器组
32-带内插滤波器组44将每个声道的32个子带转换成单个PCM时间域信号。当FILTS=0时使用非完全重构系数(512-抽头FIR滤波器)。当FILTS=1时使用完全重构系数。通常预先计算余弦调制系数并将其存储在ROM中。可以将内插程序扩展到重构更大的数据块以减少额外循环。然而,在终止帧的情况下,可以被称之为最小分辨率的是32个PCM样本。内插算法如下:建立余弦调制系数,读入32个新子带样本以便排出XIN,乘以余弦调制系数和建立临时阵列SUM和DIFF,存储历史,乘以滤波器系数,建立32个PCM输出样本,更新工作阵列,和输出32个新PCM样本。
根据工作中的位速率和编码系统,比特流既可以指定非完全又可以指定完全重构内插滤波器组系数(FILTS)。由于可用40-位可变精度计算编码器抽选滤波器组,所以编码器能够获得最大理论重构精度的能力取决于源PCM字长和用于计算卷积的DSP磁芯的精度以及转换操作的方式。
低频有效PCM内插
与低频有效通道有关的声数据与主声道无关。用8-位APCM程序对通道进行编码,所述程序是在X128十中抽一(120Hz带宽)的20-位PCM输入基础上工作的。十中抽一的有效声频是在主声道中与当前子帧声频一致的时间。在此,由于推迟穿越32-带的内插滤波器组是256个样本(512个抽头),所以必须注意确保内插的低频有效通道也与输出前的其它声道相一致。如果有效内插FIR也是512个抽头,则不需要进行补偿。
LFT算法使用了如下512个抽头的128X内插FIR:把7-位比例因数转换成rms,乘以7-位量化器的步长,由标准值产生子样本值,利用例如为每个子样本设置的低通滤波器进行128倍内插。
硬件执行器件
图21和22描述了以32、44.1和48kHz采样速率工作的6通道式编码器和解码器之硬件执行器件的基本功能结构。参照图22,用八个模拟装置ADSP21020 40-位浮点数字信号处理器(DSP)芯片296构成6通道数字子声码器298。用6个DSPs对每个通道进行编码同时分别用第七个和第八个来实现“全位分配和管理”以及“数据流格式化和误差编码”功能。以33MHz记录每个ADSP21020并利用外部的48位X32k程序ram(PRAM)300,40位X32k数据ram(SRAM)302来运行算法。在编码器工作的情况下,还用8位X512k EPROM304来存储固定内容例如可变长度的熵代码本。数据流格式化DSP利用Reed Solomon CRC芯片306进行误差检测和在解码器中进行保护。用双端口静态RAM308可以实现编码器DSPs和全位分配及管理之间的通信。
编码过程的流程如下。从三个AES/EBU数字式声接收器的每个输出中抽取2-通道数字声频PCM数据流310。把每一对中的第一通道分别引向CH1、3和5编码器DPSs同时把每一对中的第二通道分别引向CH2、4和6。通过把串行PCM字转换成并行(s/p)而将PCM样本读入DSPs。如上所述,每个编码器存放一帧PCM样本并对帧数据进行编码。把与每个通道中的估计差值信号(ed(n))和子带样本(x(n))有关的信息通过双端口RAM传输到全位分配和管理DSP中。然后用同样的方式读回每个编码器的分配策略。编码过程完成之后,通过全位分配和管理DSP把6个通道的编码数据和边信息传输到数据流格式化器DSP中。在该阶段选择性地产生CRC检验字节并将其加到编码数据中以便在解码器中提供误差保护。最后,将所有数据包16相互组合并输出。
在图22中示出了6通道硬件解码器的实现过程。用单个模拟装置ADSP21020 40-位浮点数字信号处理器(DSP)芯片324构成6通道数字式声解码器。以33MHz记录ADSP21020并用外部48位X32k程序ram(PRAM)326,40位X32k数据ram(SRAM)328运行解码算法。此外还用附加的8位X512k EPROM330来存储可变长度熵和预测系数矢量代码本等固定常数。
解码处理的流程如下。通过串/并行转换器(s/p)332把压缩数据流16输入到DSP。按前面所述对数据进行解压缩和解码。把子带样本重构成每个通道的单个PCM数据流22并通过三个并行/串行转换器(p/s)335输出到三个AES/EBU数字声频传输器芯片334中。
以上显示和描述了本发明的几个说明性实施例,但是对于那些熟悉本领域的技术人员来说可以做出大量不同的和变换的实施例。例如,随着处理速度的增加和存储器成本的降低,采样频率、传输速率和缓冲器尺寸不会增加。在不脱离本发明的构思和范围的情况下可以预想和实现这些不同的和变换的实施例。

Claims (5)

1.多通道声码器,包括:
取帧器(64),其向以某一采样速率采样的多通道声信号的每个通道提供声频窗口以产生各个声帧序列;
多个滤波器(34),其在基带频率范围内把通道的声帧分成多个独立的频率子带,所说的频率子带中的每一个子带包括子带帧序列,在每个子带帧中具有至少一个声数据子帧;
多个子带编码器(26),其以一次一个子帧的形式对各频率子带中的声数据进行编码使之成为编码的子带信号;
多路转换器(32),其把编码的子带信号压缩和多路转换成适合每个序列数据帧的输出帧由此形成具有某一传输速率的数据流;和
控制器(19),其根据采样速率和传输速率设定声窗的尺寸以便将所说输出帧的尺寸限定在所需的范围内。
2.根据权利要求1所述的多通道声码器,其中控制器按照两个小于
Figure A0315692700021
值的最大乘积设定声窗尺寸,其中帧尺寸是输出帧的最大尺寸,Fsamp是采样速率,和Trate是传输速率。
3.根据权利要求1所述的多通道声码器,其中在目标位速率下对多通道声信号进行编码并且子带编码器包括预测编码器,所述多通道声码器进一步包括:
全位管理器(GBM)(30),其计算心理声学信号与掩蔽比(SMR)和每个子帧的估计预测增益(Pgain),通过把SMRs减小到与其相关之预测增益的各比值来计算掩蔽与噪声比(MNRs),分配各位使之满足每个MNR,计算所有子带上的分配位速率,和调节各次分配使得实际位速率近似等于目标位速率。
4.根据权利要求1或3所述的多通道声码器,其中子带编码器把每个子帧分成多个子子帧,每个子带编码器包括产生和量化每个子帧之误差信号的预测编码器(72),所述多通道声码器进一步包括:
分析器(98,100,102,104,106),其在每个子帧编码之前产生估计误差信号,检测在估计误差信号的每个子子帧中的瞬变,产生瞬变编码,该瞬变编码表示在任何子子帧而不是在已有瞬变出现的第一子子帧内是否存在瞬变,而且当检测瞬变时,在瞬变前产生适合那些子子帧的前瞬变比例因数,在瞬变后产生适合那些子子帧的后瞬变比例因数,否则产生适合于子帧的均匀比例因数,
所说的预测编码器利用所说前瞬变、后瞬变和均匀比例因数对编码前的误差信号进行转换以减小与前瞬变比例因数相应的子子帧内的编码误差。
5.根据权利要求1所述的多通道声码器,其中所说的基带频率范围构成最大频率,所说多通道声码器进一步包括:
预滤波器(46),其在基带频率范围和上述最大频率的频率下把每个所说的声帧分别分成基带信号和高采样速率信号;和
高采样速率编码器(48,50,52),其对声道的高采样速率信号进行编码使之成为独立编码的高采样速率信号;
所说的多路转换器把通道中编码的高采样速率信号压缩成独立的输出帧从而可对多通道声信号的基带和高采样速率部分进行独立解码。
CNB031569277A 1995-12-01 1996-11-21 多通道音频编码器 Expired - Lifetime CN1303583C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US789695P 1995-12-01 1995-12-01
US60/007,896 1995-12-01
US08/642,254 1996-05-02
US08/642,254 US5956674A (en) 1995-12-01 1996-05-02 Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CN96199832A Division CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器

Related Child Applications (2)

Application Number Title Priority Date Filing Date
CN2006100817855A Division CN1848241B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN200610081786XA Division CN1848242B (zh) 1995-12-01 1996-11-21 多通道音频编码器

Publications (2)

Publication Number Publication Date
CN1495705A true CN1495705A (zh) 2004-05-12
CN1303583C CN1303583C (zh) 2007-03-07

Family

ID=26677495

Family Applications (5)

Application Number Title Priority Date Filing Date
CN2006100817855A Expired - Lifetime CN1848241B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CNB031569277A Expired - Lifetime CN1303583C (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN2010101265919A Expired - Lifetime CN101872618B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN96199832A Expired - Lifetime CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器
CN200610081786XA Expired - Lifetime CN1848242B (zh) 1995-12-01 1996-11-21 多通道音频编码器

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CN2006100817855A Expired - Lifetime CN1848241B (zh) 1995-12-01 1996-11-21 多通道音频编码器

Family Applications After (3)

Application Number Title Priority Date Filing Date
CN2010101265919A Expired - Lifetime CN101872618B (zh) 1995-12-01 1996-11-21 多通道音频编码器
CN96199832A Expired - Lifetime CN1132151C (zh) 1995-12-01 1996-11-21 多通道声解码器
CN200610081786XA Expired - Lifetime CN1848242B (zh) 1995-12-01 1996-11-21 多通道音频编码器

Country Status (18)

Country Link
US (4) US5956674A (zh)
EP (1) EP0864146B1 (zh)
JP (1) JP4174072B2 (zh)
KR (1) KR100277819B1 (zh)
CN (5) CN1848241B (zh)
AT (1) ATE279770T1 (zh)
AU (1) AU705194B2 (zh)
BR (1) BR9611852A (zh)
CA (2) CA2238026C (zh)
DE (1) DE69633633T2 (zh)
DK (1) DK0864146T3 (zh)
EA (1) EA001087B1 (zh)
ES (1) ES2232842T3 (zh)
HK (4) HK1015510A1 (zh)
MX (1) MX9804320A (zh)
PL (3) PL182240B1 (zh)
PT (1) PT864146E (zh)
WO (1) WO1997021211A1 (zh)

Cited By (19)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101809653A (zh) * 2007-12-06 2010-08-18 Lg电子株式会社 用于处理音频信号的方法和装置
CN101185119B (zh) * 2005-05-26 2011-07-27 Lg电子株式会社 解码音频信号的方法和装置
CN101243496B (zh) * 2005-07-11 2011-12-07 Lg电子株式会社 处理音频信号的装置和方法
US8160258B2 (en) 2006-02-07 2012-04-17 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
US8208641B2 (en) 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
CN1822508B (zh) * 2005-01-19 2012-07-18 三星电子株式会社 对数字信号进行编码和解码的方法和设备
CN101133680B (zh) * 2005-03-04 2012-08-08 弗劳恩霍夫应用研究促进协会 用于产生已编码立体声信号的设备及方法
CN103250207A (zh) * 2010-11-05 2013-08-14 汤姆逊许可公司 高阶高保真度立体声响复制音频数据的数据结构
US8543386B2 (en) 2005-05-26 2013-09-24 Lg Electronics Inc. Method and apparatus for decoding an audio signal
CN102177426B (zh) * 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
CN102833538B (zh) * 2004-06-27 2015-04-22 苹果公司 多通路视频编码
US9043215B2 (en) 2008-10-08 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-resolution switched audio encoding/decoding scheme
CN105144752A (zh) * 2013-04-29 2015-12-09 汤姆逊许可公司 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
US9595267B2 (en) 2005-05-26 2017-03-14 Lg Electronics Inc. Method and apparatus for decoding an audio signal
CN107430862A (zh) * 2015-02-27 2017-12-01 奥罗技术公司 数字数据集合的编码和解码
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法
CN111341303A (zh) * 2018-12-19 2020-06-26 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN113485190A (zh) * 2021-07-13 2021-10-08 西安电子科技大学 一种多通道数据采集系统及采集方法

Families Citing this family (526)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR19990082402A (ko) * 1996-02-08 1999-11-25 모리시타 요이찌 광대역 오디오신호 부호장치, 광대역 오디오신호 복호장치, 광대역 오디오신호 부호 복호장치 및 광대역 오디오신호 기록매체
US8306811B2 (en) * 1996-08-30 2012-11-06 Digimarc Corporation Embedding data in audio and detecting embedded data in audio
JP3622365B2 (ja) * 1996-09-26 2005-02-23 ヤマハ株式会社 音声符号化伝送方式
JPH10271082A (ja) * 1997-03-21 1998-10-09 Mitsubishi Electric Corp 音声データ復号装置
US7110662B1 (en) 1997-03-25 2006-09-19 Samsung Electronics Co., Ltd. Apparatus and method for recording data on a DVD-audio disk
US6449227B1 (en) 1997-03-25 2002-09-10 Samsung Electronics Co., Ltd. DVD-audio disk, and apparatus and method for playing the same
US6741796B1 (en) * 1997-03-25 2004-05-25 Samsung Electronics, Co., Ltd. DVD-Audio disk, and apparatus and method for playing the same
EP0907255A1 (en) * 1997-03-28 1999-04-07 Sony Corporation Data coding method and device, data decoding method and device, and recording medium
US6298025B1 (en) 1997-05-05 2001-10-02 Warner Music Group Inc. Recording and playback of multi-channel digital audio having different resolutions for different channels
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6636474B1 (en) * 1997-07-16 2003-10-21 Victor Company Of Japan, Ltd. Recording medium and audio-signal processing apparatus
US5903872A (en) * 1997-10-17 1999-05-11 Dolby Laboratories Licensing Corporation Frame-based audio coding with additional filterbank to attenuate spectral splatter at frame boundaries
US6574602B1 (en) * 1997-12-19 2003-06-03 Stmicroelectronics Asia Pacific Pte Limited Dual channel phase flag determination for coupling bands in a transform coder for high quality audio
DE69711102T2 (de) * 1997-12-27 2002-11-07 St Microelectronics Asia Verfahren und gerät zur schätzung von koppelparametern in einem transformationskodierer für hochwertige tonsignale
US6089714A (en) * 1998-02-18 2000-07-18 Mcgill University Automatic segmentation of nystagmus or other complex curves
JP3802219B2 (ja) * 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
JPH11234136A (ja) * 1998-02-19 1999-08-27 Sanyo Electric Co Ltd デジタルデータの符号化方法及び符号化装置
US6253185B1 (en) * 1998-02-25 2001-06-26 Lucent Technologies Inc. Multiple description transform coding of audio using optimal transforms of arbitrary dimension
KR100304092B1 (ko) 1998-03-11 2001-09-26 마츠시타 덴끼 산교 가부시키가이샤 오디오 신호 부호화 장치, 오디오 신호 복호화 장치 및 오디오 신호 부호화/복호화 장치
US6400727B1 (en) * 1998-03-27 2002-06-04 Cirrus Logic, Inc. Methods and system to transmit data acquired at a variable rate over a fixed rate channel
US6396956B1 (en) * 1998-03-31 2002-05-28 Sharp Laboratories Of America, Inc. Method and apparatus for selecting image data to skip when encoding digital video
JPH11331248A (ja) * 1998-05-08 1999-11-30 Sony Corp 送信装置および送信方法、受信装置および受信方法、並びに提供媒体
US6141645A (en) * 1998-05-29 2000-10-31 Acer Laboratories Inc. Method and device for down mixing compressed audio bit stream having multiple audio channels
US6141639A (en) * 1998-06-05 2000-10-31 Conexant Systems, Inc. Method and apparatus for coding of signals containing speech and background noise
DE69924922T2 (de) * 1998-06-15 2006-12-21 Matsushita Electric Industrial Co., Ltd., Kadoma Audiokodierungsmethode und Audiokodierungsvorrichtung
US6061655A (en) * 1998-06-26 2000-05-09 Lsi Logic Corporation Method and apparatus for dual output interface control of audio decoder
US6301265B1 (en) * 1998-08-14 2001-10-09 Motorola, Inc. Adaptive rate system and method for network communications
US7457415B2 (en) 1998-08-20 2008-11-25 Akikaze Technologies, Llc Secure information distribution system utilizing information segment scrambling
JP4308345B2 (ja) * 1998-08-21 2009-08-05 パナソニック株式会社 マルチモード音声符号化装置及び復号化装置
US6704705B1 (en) * 1998-09-04 2004-03-09 Nortel Networks Limited Perceptual audio coding
GB9820655D0 (en) * 1998-09-22 1998-11-18 British Telecomm Packet transmission
US7272556B1 (en) * 1998-09-23 2007-09-18 Lucent Technologies Inc. Scalable and embedded codec for speech and audio signals
JP4193243B2 (ja) * 1998-10-07 2008-12-10 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号化方法及び装置並びに記録媒体
US6463410B1 (en) * 1998-10-13 2002-10-08 Victor Company Of Japan, Ltd. Audio signal processing apparatus
US6345100B1 (en) 1998-10-14 2002-02-05 Liquid Audio, Inc. Robust watermark method and apparatus for digital signals
US6320965B1 (en) 1998-10-14 2001-11-20 Liquid Audio, Inc. Secure watermark method and apparatus for digital signals
US6330673B1 (en) 1998-10-14 2001-12-11 Liquid Audio, Inc. Determination of a best offset to detect an embedded pattern
US6219634B1 (en) * 1998-10-14 2001-04-17 Liquid Audio, Inc. Efficient watermark method and apparatus for digital signals
US6754241B1 (en) * 1999-01-06 2004-06-22 Sarnoff Corporation Computer system for statistical multiplexing of bitstreams
US6931372B1 (en) * 1999-01-27 2005-08-16 Agere Systems Inc. Joint multiple program coding for digital audio broadcasting and other applications
US6357029B1 (en) * 1999-01-27 2002-03-12 Agere Systems Guardian Corp. Joint multiple program error concealment for digital audio broadcasting and other applications
US6378101B1 (en) * 1999-01-27 2002-04-23 Agere Systems Guardian Corp. Multiple program decoding for digital audio broadcasting and other applications
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
TW477119B (en) * 1999-01-28 2002-02-21 Winbond Electronics Corp Byte allocation method and device for speech synthesis
FR2791167B1 (fr) * 1999-03-17 2003-01-10 Matra Nortel Communications Procedes de codage, de decodage et de transcodage audio
JP3739959B2 (ja) * 1999-03-23 2006-01-25 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
DE19914742A1 (de) * 1999-03-31 2000-10-12 Siemens Ag Verfahren zum Übertragen von Daten
JP2001006291A (ja) * 1999-06-21 2001-01-12 Fuji Film Microdevices Co Ltd オーディオ信号の符号化方式判定装置、及びオーディオ信号の符号化方式判定方法
US7283965B1 (en) * 1999-06-30 2007-10-16 The Directv Group, Inc. Delivery and transmission of dolby digital AC-3 over television broadcast
US6553210B1 (en) * 1999-08-03 2003-04-22 Alliedsignal Inc. Single antenna for receipt of signals from multiple communications systems
US6581032B1 (en) * 1999-09-22 2003-06-17 Conexant Systems, Inc. Bitstream protocol for transmission of encoded voice signals
US7181297B1 (en) 1999-09-28 2007-02-20 Sound Id System and method for delivering customized audio data
US6496798B1 (en) * 1999-09-30 2002-12-17 Motorola, Inc. Method and apparatus for encoding and decoding frames of voice model parameters into a low bit rate digital voice message
US6741947B1 (en) * 1999-11-30 2004-05-25 Agilent Technologies, Inc. Monitoring system and method implementing a total node power test
US6732061B1 (en) * 1999-11-30 2004-05-04 Agilent Technologies, Inc. Monitoring system and method implementing a channel plan
US7792681B2 (en) * 1999-12-17 2010-09-07 Interval Licensing Llc Time-scale modification of data-compressed audio information
US6842735B1 (en) * 1999-12-17 2005-01-11 Interval Research Corporation Time-scale modification of data-compressed audio information
EP1208725B1 (en) * 1999-12-24 2009-06-03 Koninklijke Philips Electronics N.V. Multichannel audio signal processing device
WO2001050459A1 (en) * 1999-12-31 2001-07-12 Octiv, Inc. Techniques for improving audio clarity and intelligibility at reduced bit rates over a digital network
US6499010B1 (en) * 2000-01-04 2002-12-24 Agere Systems Inc. Perceptual audio coder bit allocation scheme providing improved perceptual quality consistency
TW499672B (en) * 2000-02-18 2002-08-21 Intervideo Inc Fast convergence method for bit allocation stage of MPEG audio layer 3 encoders
KR20010113047A (ko) * 2000-02-29 2001-12-24 이데이 노부유끼 데이터 처리장치 및 방법과 기록매체 및 프로그램
EP1287617B1 (de) * 2000-04-14 2003-12-03 Siemens Aktiengesellschaft Verfahren zum kanaldecodieren eines datenstroms mit nutzdaten und redundanzdaten, vorrichtung zum kanaldecodieren, computerlesbares speichermedium und computerprogramm-element
US6782366B1 (en) * 2000-05-15 2004-08-24 Lsi Logic Corporation Method for independent dynamic range control
US7136810B2 (en) * 2000-05-22 2006-11-14 Texas Instruments Incorporated Wideband speech coding system and method
US6725110B2 (en) * 2000-05-26 2004-04-20 Yamaha Corporation Digital audio decoder
EP1290690A1 (en) * 2000-05-30 2003-03-12 Koninklijke Philips Electronics N.V. Coded information on cd audio
US7110953B1 (en) * 2000-06-02 2006-09-19 Agere Systems Inc. Perceptual coding of audio signals using separated irrelevancy reduction and redundancy reduction
US6778953B1 (en) * 2000-06-02 2004-08-17 Agere Systems Inc. Method and apparatus for representing masked thresholds in a perceptual audio coder
US6678647B1 (en) * 2000-06-02 2004-01-13 Agere Systems Inc. Perceptual coding of audio signals using cascaded filterbanks for performing irrelevancy reduction and redundancy reduction with different spectral/temporal resolution
US6754618B1 (en) * 2000-06-07 2004-06-22 Cirrus Logic, Inc. Fast implementation of MPEG audio coding
US6601032B1 (en) * 2000-06-14 2003-07-29 Intervideo, Inc. Fast code length search method for MPEG audio encoding
US6542863B1 (en) 2000-06-14 2003-04-01 Intervideo, Inc. Fast codebook search method for MPEG audio encoding
US6748363B1 (en) * 2000-06-28 2004-06-08 Texas Instruments Incorporated TI window compression/expansion method
US6678648B1 (en) 2000-06-14 2004-01-13 Intervideo, Inc. Fast loop iteration and bitstream formatting method for MPEG audio encoding
US6745162B1 (en) * 2000-06-22 2004-06-01 Sony Corporation System and method for bit allocation in an audio encoder
JP2002014697A (ja) * 2000-06-30 2002-01-18 Hitachi Ltd ディジタルオーディオ装置
FI109393B (fi) 2000-07-14 2002-07-15 Nokia Corp Menetelmä mediavirran enkoodaamiseksi skaalautuvasti, skaalautuva enkooderi ja päätelaite
US6931371B2 (en) * 2000-08-25 2005-08-16 Matsushita Electric Industrial Co., Ltd. Digital interface device
SE519981C2 (sv) * 2000-09-15 2003-05-06 Ericsson Telefon Ab L M Kodning och avkodning av signaler från flera kanaler
US20020075965A1 (en) * 2000-12-20 2002-06-20 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
RU2284671C2 (ru) * 2000-10-11 2006-09-27 Конинклейке Филипс Электроникс Н.В. Масштабируемое кодирование объектов мультимедиа
US20030023429A1 (en) * 2000-12-20 2003-01-30 Octiv, Inc. Digital signal processing techniques for improving audio clarity and intelligibility
US7526348B1 (en) * 2000-12-27 2009-04-28 John C. Gaddy Computer based automatic audio mixer
CN1205540C (zh) * 2000-12-29 2005-06-08 深圳赛意法微电子有限公司 含有解码器的电路、时分寻址的方法和一个微控制器
EP1223696A3 (en) * 2001-01-12 2003-12-17 Matsushita Electric Industrial Co., Ltd. System for transmitting digital audio data according to the MOST method
GB0103242D0 (en) * 2001-02-09 2001-03-28 Radioscape Ltd Method of analysing a compressed signal for the presence or absence of information content
GB0108080D0 (en) * 2001-03-30 2001-05-23 Univ Bath Audio compression
JP3972000B2 (ja) * 2001-04-09 2007-09-05 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 特定のステップサイズ適応を備えるadpcm音声コーディングシステム
EP1395982B1 (en) * 2001-04-09 2006-04-19 Koninklijke Philips Electronics N.V. Adpcm speech coding system with phase-smearing and phase-desmearing filters
US7610205B2 (en) * 2002-02-12 2009-10-27 Dolby Laboratories Licensing Corporation High quality time-scaling and pitch-scaling of audio signals
US7711123B2 (en) 2001-04-13 2010-05-04 Dolby Laboratories Licensing Corporation Segmenting audio signals into auditory events
CN1240048C (zh) * 2001-04-18 2006-02-01 皇家菲利浦电子有限公司 音频编码
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7047201B2 (en) * 2001-05-04 2006-05-16 Ssi Corporation Real-time control of playback rates in presentations
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US7451006B2 (en) 2001-05-07 2008-11-11 Harman International Industries, Incorporated Sound processing system using distortion limiting techniques
US7447321B2 (en) 2001-05-07 2008-11-04 Harman International Industries, Incorporated Sound processing system for configuration of audio signals in a vehicle
US6804565B2 (en) 2001-05-07 2004-10-12 Harman International Industries, Incorporated Data-driven software architecture for digital sound processing and equalization
JP4591939B2 (ja) * 2001-05-15 2010-12-01 Kddi株式会社 適応的符号化伝送装置および受信装置
WO2002102049A2 (en) * 2001-06-11 2002-12-19 Broadcom Corporation System and method for multi-channel video and audio encoding on a single chip
US6661880B1 (en) 2001-06-12 2003-12-09 3Com Corporation System and method for embedding digital information in a dial tone signal
EP1271470A1 (en) * 2001-06-25 2003-01-02 Alcatel Method and device for determining the voice quality degradation of a signal
US7460629B2 (en) * 2001-06-29 2008-12-02 Agere Systems Inc. Method and apparatus for frame-based buffer control in a communication system
SE0202159D0 (sv) 2001-07-10 2002-07-09 Coding Technologies Sweden Ab Efficientand scalable parametric stereo coding for low bitrate applications
JP3463752B2 (ja) * 2001-07-25 2003-11-05 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法および音響復号化方法
JP3469567B2 (ja) * 2001-09-03 2003-11-25 三菱電機株式会社 音響符号化装置、音響復号化装置、音響符号化方法及び音響復号化方法
US7062429B2 (en) * 2001-09-07 2006-06-13 Agere Systems Inc. Distortion-based method and apparatus for buffer control in a communication system
US7333929B1 (en) 2001-09-13 2008-02-19 Chmounk Dmitri V Modular scalable compressed audio data stream
US6944474B2 (en) * 2001-09-20 2005-09-13 Sound Id Sound enhancement for mobile phones and other products producing personalized audio for users
US6732071B2 (en) * 2001-09-27 2004-05-04 Intel Corporation Method, apparatus, and system for efficient rate control in audio encoding
JP4245288B2 (ja) * 2001-11-13 2009-03-25 パナソニック株式会社 音声符号化装置および音声復号化装置
KR100587517B1 (ko) * 2001-11-14 2006-06-08 마쯔시다덴기산교 가부시키가이샤 오디오 부호화 및 복호화
JP4504681B2 (ja) * 2001-11-16 2010-07-14 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ 補助データを情報信号に埋め込む方法及びデバイス
PT1423847E (pt) 2001-11-29 2005-05-31 Coding Tech Ab Reconstrucao de componentes de frequencia elevada
US6934677B2 (en) * 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US7240001B2 (en) * 2001-12-14 2007-07-03 Microsoft Corporation Quality improvement techniques in an audio encoder
US7467287B1 (en) 2001-12-31 2008-12-16 Apple Inc. Method and apparatus for vector table look-up
US7034849B1 (en) 2001-12-31 2006-04-25 Apple Computer, Inc. Method and apparatus for image blending
US7055018B1 (en) 2001-12-31 2006-05-30 Apple Computer, Inc. Apparatus for parallel vector table look-up
US7015921B1 (en) 2001-12-31 2006-03-21 Apple Computer, Inc. Method and apparatus for memory access
US7558947B1 (en) 2001-12-31 2009-07-07 Apple Inc. Method and apparatus for computing vector absolute differences
US6693643B1 (en) 2001-12-31 2004-02-17 Apple Computer, Inc. Method and apparatus for color space conversion
US6931511B1 (en) 2001-12-31 2005-08-16 Apple Computer, Inc. Parallel vector table look-up with replicated index element vector
US7305540B1 (en) 2001-12-31 2007-12-04 Apple Inc. Method and apparatus for data processing
US7681013B1 (en) 2001-12-31 2010-03-16 Apple Inc. Method for variable length decoding using multiple configurable look-up tables
US6822654B1 (en) 2001-12-31 2004-11-23 Apple Computer, Inc. Memory controller chipset
US6697076B1 (en) 2001-12-31 2004-02-24 Apple Computer, Inc. Method and apparatus for address re-mapping
US7114058B1 (en) 2001-12-31 2006-09-26 Apple Computer, Inc. Method and apparatus for forming and dispatching instruction groups based on priority comparisons
US6573846B1 (en) 2001-12-31 2003-06-03 Apple Computer, Inc. Method and apparatus for variable length decoding and encoding of video streams
US6877020B1 (en) 2001-12-31 2005-04-05 Apple Computer, Inc. Method and apparatus for matrix transposition
US7848531B1 (en) * 2002-01-09 2010-12-07 Creative Technology Ltd. Method and apparatus for audio loudness and dynamics matching
US6618128B2 (en) * 2002-01-23 2003-09-09 Csi Technology, Inc. Optical speed sensing system
ATE315823T1 (de) * 2002-02-18 2006-02-15 Koninkl Philips Electronics Nv Parametrische audiocodierung
US20030161469A1 (en) * 2002-02-25 2003-08-28 Szeming Cheng Method and apparatus for embedding data in compressed audio data stream
US20100042406A1 (en) * 2002-03-04 2010-02-18 James David Johnston Audio signal processing using improved perceptual model
US7313520B2 (en) * 2002-03-20 2007-12-25 The Directv Group, Inc. Adaptive variable bit rate audio compression encoding
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US20040125707A1 (en) * 2002-04-05 2004-07-01 Rodolfo Vargas Retrieving content of various types with a conversion device attachable to audio outputs of an audio CD player
US7225135B2 (en) * 2002-04-05 2007-05-29 Lectrosonics, Inc. Signal-predictive audio transmission system
US7428440B2 (en) * 2002-04-23 2008-09-23 Realnetworks, Inc. Method and apparatus for preserving matrix surround information in encoded audio/video
AU2002307896A1 (en) 2002-04-25 2003-11-10 Nokia Corporation Method and device for reducing high frequency error components of a multi-channel modulator
JP4016709B2 (ja) * 2002-04-26 2007-12-05 日本電気株式会社 オーディオデータの符号変換伝送方法と符号変換受信方法及び装置とシステムならびにプログラム
US7492908B2 (en) * 2002-05-03 2009-02-17 Harman International Industries, Incorporated Sound localization system based on analysis of the sound field
US7096180B2 (en) * 2002-05-15 2006-08-22 Intel Corporation Method and apparatuses for improving quality of digitally encoded speech in the presence of interference
US7050965B2 (en) * 2002-06-03 2006-05-23 Intel Corporation Perceptual normalization of digital audio signals
US7747447B2 (en) * 2002-06-21 2010-06-29 Thomson Licensing Broadcast router having a serial digital audio data stream decoder
US7325048B1 (en) * 2002-07-03 2008-01-29 3Com Corporation Method for automatically creating a modem interface for use with a wireless device
KR100462615B1 (ko) * 2002-07-11 2004-12-20 삼성전자주식회사 적은 계산량으로 고주파수 성분을 복원하는 오디오 디코딩방법 및 장치
US8228849B2 (en) * 2002-07-15 2012-07-24 Broadcom Corporation Communication gateway supporting WLAN communications in multiple communication protocols and in multiple frequency bands
CN1669358A (zh) 2002-07-16 2005-09-14 皇家飞利浦电子股份有限公司 音频编码
CN1783726B (zh) * 2002-08-21 2010-05-12 广州广晟数码技术有限公司 用于从音频数据码流中解码重建多声道音频信号的解码器
CN100481736C (zh) * 2002-08-21 2009-04-22 广州广晟数码技术有限公司 用于对多声道数字音频信号进行压缩编码的编码方法
EP1394772A1 (en) * 2002-08-28 2004-03-03 Deutsche Thomson-Brandt Gmbh Signaling of window switchings in a MPEG layer 3 audio data stream
US7502743B2 (en) 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
JP4676140B2 (ja) * 2002-09-04 2011-04-27 マイクロソフト コーポレーション オーディオの量子化および逆量子化
US7299190B2 (en) * 2002-09-04 2007-11-20 Microsoft Corporation Quantization and inverse quantization for audio
ATE381090T1 (de) * 2002-09-04 2007-12-15 Microsoft Corp Entropische kodierung mittels anpassung des kodierungsmodus zwischen niveau- und lauflängenniveau-modus
TW573293B (en) * 2002-09-13 2004-01-21 Univ Nat Central Nonlinear operation method suitable for audio encoding/decoding and an applied hardware thereof
SE0202770D0 (sv) * 2002-09-18 2002-09-18 Coding Technologies Sweden Ab Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks
FR2846179B1 (fr) 2002-10-21 2005-02-04 Medialive Embrouillage adaptatif et progressif de flux audio
US6707397B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatus for variable length codeword concatenation
US6707398B1 (en) 2002-10-24 2004-03-16 Apple Computer, Inc. Methods and apparatuses for packing bitstreams
US6781528B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Vector handling capable processor and run length encoding
US6781529B1 (en) 2002-10-24 2004-08-24 Apple Computer, Inc. Methods and apparatuses for variable length encoding
US7650625B2 (en) * 2002-12-16 2010-01-19 Lsi Corporation System and method for controlling audio and video content via an advanced settop box
US7555017B2 (en) * 2002-12-17 2009-06-30 Tls Corporation Low latency digital audio over packet switched networks
US7272566B2 (en) * 2003-01-02 2007-09-18 Dolby Laboratories Licensing Corporation Reducing scale factor transmission cost for MPEG-2 advanced audio coding (AAC) using a lattice based post processing technique
KR100547113B1 (ko) * 2003-02-15 2006-01-26 삼성전자주식회사 오디오 데이터 인코딩 장치 및 방법
TW594674B (en) * 2003-03-14 2004-06-21 Mediatek Inc Encoder and a encoding method capable of detecting audio signal transient
CN100339886C (zh) * 2003-04-10 2007-09-26 联发科技股份有限公司 可以检测声音信号的暂态位置的编码器及编码方法
FR2853786B1 (fr) * 2003-04-11 2005-08-05 Medialive Procede et equipement de distribution de produits videos numeriques avec une restriction de certains au moins des droits de representation et de reproduction
ATE359687T1 (de) * 2003-04-17 2007-05-15 Koninkl Philips Electronics Nv Audiosignalgenerierung
RU2005135650A (ru) * 2003-04-17 2006-03-20 Конинклейке Филипс Электроникс Н.В. (Nl) Синтез аудиосигнала
US8073684B2 (en) * 2003-04-25 2011-12-06 Texas Instruments Incorporated Apparatus and method for automatic classification/identification of similar compressed audio files
EP1618686A1 (en) * 2003-04-30 2006-01-25 Nokia Corporation Support of a multichannel audio extension
SE0301273D0 (sv) * 2003-04-30 2003-04-30 Coding Technologies Sweden Ab Advanced processing based on a complex-exponential-modulated filterbank and adaptive time signalling methods
US7739105B2 (en) * 2003-06-13 2010-06-15 Vixs Systems, Inc. System and method for processing audio frames
JP4382090B2 (ja) * 2003-06-16 2009-12-09 パナソニック株式会社 符号化装置、符号化方法およびコードブック
KR100556365B1 (ko) * 2003-07-07 2006-03-03 엘지전자 주식회사 음성 인식장치 및 방법
US7454431B2 (en) * 2003-07-17 2008-11-18 At&T Corp. Method and apparatus for window matching in delta compressors
US7289680B1 (en) * 2003-07-23 2007-10-30 Cisco Technology, Inc. Methods and apparatus for minimizing requantization error
TWI220336B (en) * 2003-07-28 2004-08-11 Design Technology Inc G Compression rate promotion method of adaptive differential PCM technique
WO2005020210A2 (en) * 2003-08-26 2005-03-03 Sarnoff Corporation Method and apparatus for adaptive variable bit rate audio encoding
US7724827B2 (en) * 2003-09-07 2010-05-25 Microsoft Corporation Multi-layer run level encoding and decoding
WO2005027096A1 (en) * 2003-09-15 2005-03-24 Zakrytoe Aktsionernoe Obschestvo Intel Method and apparatus for encoding audio
SG120118A1 (en) * 2003-09-15 2006-03-28 St Microelectronics Asia A device and process for encoding audio data
US20050083808A1 (en) * 2003-09-18 2005-04-21 Anderson Hans C. Audio player with CD mechanism
US7325023B2 (en) * 2003-09-29 2008-01-29 Sony Corporation Method of making a window type decision based on MDCT data in audio encoding
US7283968B2 (en) 2003-09-29 2007-10-16 Sony Corporation Method for grouping short windows in audio encoding
US7349842B2 (en) * 2003-09-29 2008-03-25 Sony Corporation Rate-distortion control scheme in audio encoding
US7426462B2 (en) * 2003-09-29 2008-09-16 Sony Corporation Fast codebook selection method in audio encoding
DE602004030594D1 (de) * 2003-10-07 2011-01-27 Panasonic Corp Verfahren zur entscheidung der zeitgrenze zur codierung der spektro-hülle und frequenzauflösung
TWI226035B (en) * 2003-10-16 2005-01-01 Elan Microelectronics Corp Method and system improving step adaptation of ADPCM voice coding
ATE354160T1 (de) * 2003-10-30 2007-03-15 Koninkl Philips Electronics Nv Audiosignalcodierung oder -decodierung
KR20050050322A (ko) * 2003-11-25 2005-05-31 삼성전자주식회사 직교주파수다중화방식의 이동통신시스템에서 적응변조 방법
KR100571824B1 (ko) * 2003-11-26 2006-04-17 삼성전자주식회사 부가정보 삽입된 mpeg-4 오디오 bsac부호화/복호화 방법 및 장치
FR2867649A1 (fr) * 2003-12-10 2005-09-16 France Telecom Procede de codage multiple optimise
CN1894742A (zh) * 2003-12-15 2007-01-10 松下电器产业株式会社 音频压缩解压装置
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
SE527670C2 (sv) * 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7725324B2 (en) * 2003-12-19 2010-05-25 Telefonaktiebolaget Lm Ericsson (Publ) Constrained filter encoding of polyphonic signals
US7460990B2 (en) 2004-01-23 2008-12-02 Microsoft Corporation Efficient coding of digital media spectral data using wide-sense perceptual similarity
JP2005217486A (ja) * 2004-01-27 2005-08-11 Matsushita Electric Ind Co Ltd ストリーム復号装置
DE102004009949B4 (de) * 2004-03-01 2006-03-09 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Vorrichtung und Verfahren zum Ermitteln eines Schätzwertes
EP2065885B1 (en) 2004-03-01 2010-07-28 Dolby Laboratories Licensing Corporation Multichannel audio decoding
US20090299756A1 (en) * 2004-03-01 2009-12-03 Dolby Laboratories Licensing Corporation Ratio of speech to non-speech audio such as for elderly or hearing-impaired listeners
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
US7392195B2 (en) * 2004-03-25 2008-06-24 Dts, Inc. Lossless multi-channel audio codec
TWI231656B (en) * 2004-04-08 2005-04-21 Univ Nat Chiao Tung Fast bit allocation algorithm for audio coding
US8032360B2 (en) * 2004-05-13 2011-10-04 Broadcom Corporation System and method for high-quality variable speed playback of audio-visual media
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
DE602004012165T2 (de) * 2004-05-28 2009-06-18 The Tc Group A/S Impulsbreitenmodulatorsystem
ATE453156T1 (de) * 2004-06-10 2010-01-15 Panasonic Corp System und verfahren für laufzeit-rekonfiguration
WO2005124722A2 (en) * 2004-06-12 2005-12-29 Spl Development, Inc. Aural rehabilitation system and method
KR100634506B1 (ko) * 2004-06-25 2006-10-16 삼성전자주식회사 저비트율 부호화/복호화 방법 및 장치
US20050285935A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Personal conferencing node
US20050286443A1 (en) * 2004-06-29 2005-12-29 Octiv, Inc. Conferencing system
US8843378B2 (en) * 2004-06-30 2014-09-23 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-channel synthesizer and method for generating a multi-channel output signal
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US20060015329A1 (en) * 2004-07-19 2006-01-19 Chu Wai C Apparatus and method for audio coding
US7391434B2 (en) * 2004-07-27 2008-06-24 The Directv Group, Inc. Video bit stream test
US7706415B2 (en) * 2004-07-29 2010-04-27 Microsoft Corporation Packet multiplexing multi-channel audio
US7508947B2 (en) * 2004-08-03 2009-03-24 Dolby Laboratories Licensing Corporation Method for combining audio signals using auditory scene analysis
KR100608062B1 (ko) * 2004-08-04 2006-08-02 삼성전자주식회사 오디오 데이터의 고주파수 복원 방법 및 그 장치
US7930184B2 (en) * 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
CN101010724B (zh) * 2004-08-27 2011-05-25 松下电器产业株式会社 音频编码器
JP2008511852A (ja) * 2004-08-31 2008-04-17 コーニンクレッカ フィリップス エレクトロニクス エヌ ヴィ トランスコードのための方法および装置
US7725313B2 (en) * 2004-09-13 2010-05-25 Ittiam Systems (P) Ltd. Method, system and apparatus for allocating bits in perceptual audio coders
CN101241701B (zh) * 2004-09-17 2012-06-27 广州广晟数码技术有限公司 用于对音频信号进行解码的方法和设备
US7895034B2 (en) * 2004-09-17 2011-02-22 Digital Rise Technology Co., Ltd. Audio encoding system
CN1969318B (zh) * 2004-09-17 2011-11-02 松下电器产业株式会社 音频编码装置、解码装置以及方法
US7937271B2 (en) * 2004-09-17 2011-05-03 Digital Rise Technology Co., Ltd. Audio decoding using variable-length codebook application ranges
US7630902B2 (en) * 2004-09-17 2009-12-08 Digital Rise Technology Co., Ltd. Apparatus and methods for digital audio coding using codebook application ranges
WO2006035705A1 (ja) * 2004-09-28 2006-04-06 Matsushita Electric Industrial Co., Ltd. スケーラブル符号化装置およびスケーラブル符号化方法
JP4892184B2 (ja) * 2004-10-14 2012-03-07 パナソニック株式会社 音響信号符号化装置及び音響信号復号装置
US7061405B2 (en) * 2004-10-15 2006-06-13 Yazaki North America, Inc. Device and method for interfacing video devices over a fiber optic link
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
JP4815780B2 (ja) * 2004-10-20 2011-11-16 ヤマハ株式会社 オーバーサンプリングシステム、デコードlsi、およびオーバーサンプリング方法
SE0402652D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Methods for improved performance of prediction based multi- channel reconstruction
SE0402651D0 (sv) * 2004-11-02 2004-11-02 Coding Tech Ab Advanced methods for interpolation and parameter signalling
WO2006060279A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
EP1817766B1 (en) 2004-11-30 2009-10-21 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
EP1713060A4 (en) * 2004-12-22 2007-04-25 Matsushita Electric Ind Co Ltd MPEG AUDIO DECODING METHOD
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
WO2006075079A1 (fr) * 2005-01-14 2006-07-20 France Telecom Procede d’encodage de pistes audio d’un contenu multimedia destine a une diffusion sur terminaux mobiles
US7208372B2 (en) * 2005-01-19 2007-04-24 Sharp Laboratories Of America, Inc. Non-volatile memory resistor cell with nanotip electrode
KR100765747B1 (ko) * 2005-01-22 2007-10-15 삼성전자주식회사 트리 구조 벡터 양자화를 이용한 스케일러블 음성 부호화장치
US8068926B2 (en) * 2005-01-31 2011-11-29 Skype Limited Method for generating concealment frames in communication system
US7672742B2 (en) * 2005-02-16 2010-03-02 Adaptec, Inc. Method and system for reducing audio latency
US9626973B2 (en) * 2005-02-23 2017-04-18 Telefonaktiebolaget L M Ericsson (Publ) Adaptive bit allocation for multi-channel audio encoding
WO2006126859A2 (en) * 2005-05-26 2006-11-30 Lg Electronics Inc. Method of encoding and decoding an audio signal
US7548853B2 (en) * 2005-06-17 2009-06-16 Shmunk Dmitry V Scalable compressed audio bit stream and codec using a hierarchical filterbank and multichannel joint coding
KR100718132B1 (ko) * 2005-06-24 2007-05-14 삼성전자주식회사 오디오 신호의 비트스트림 생성 방법 및 장치, 그를 이용한부호화/복호화 방법 및 장치
US8185403B2 (en) * 2005-06-30 2012-05-22 Lg Electronics Inc. Method and apparatus for encoding and decoding an audio signal
JP5227794B2 (ja) * 2005-06-30 2013-07-03 エルジー エレクトロニクス インコーポレイティド オーディオ信号をエンコーディング及びデコーディングするための装置とその方法
AU2006266655B2 (en) * 2005-06-30 2009-08-20 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
US7539612B2 (en) 2005-07-15 2009-05-26 Microsoft Corporation Coding and decoding scale factor information
US7693709B2 (en) * 2005-07-15 2010-04-06 Microsoft Corporation Reordering coefficients for waveform coding or decoding
KR100851970B1 (ko) * 2005-07-15 2008-08-12 삼성전자주식회사 오디오 신호의 중요주파수 성분 추출방법 및 장치와 이를이용한 저비트율 오디오 신호 부호화/복호화 방법 및 장치
US8225392B2 (en) * 2005-07-15 2012-07-17 Microsoft Corporation Immunizing HTML browsers and extensions from known vulnerabilities
US7684981B2 (en) * 2005-07-15 2010-03-23 Microsoft Corporation Prediction of spectral coefficients in waveform coding and decoding
US7630882B2 (en) * 2005-07-15 2009-12-08 Microsoft Corporation Frequency segmentation to obtain bands for efficient coding of digital media
US7562021B2 (en) * 2005-07-15 2009-07-14 Microsoft Corporation Modification of codewords in dictionary used for efficient coding of digital media spectral data
US7599840B2 (en) 2005-07-15 2009-10-06 Microsoft Corporation Selectively using multiple entropy models in adaptive coding and decoding
CN1909066B (zh) * 2005-08-03 2011-02-09 昆山杰得微电子有限公司 音频编码码量控制和调整的方法
WO2007019530A2 (en) * 2005-08-04 2007-02-15 R2Di, Llc Multi-channel wireless digital audio distribution system and methods
US7565018B2 (en) 2005-08-12 2009-07-21 Microsoft Corporation Adaptive coding and decoding of wide-range coefficients
US7933337B2 (en) 2005-08-12 2011-04-26 Microsoft Corporation Prediction of transform coefficients for image compression
US8577483B2 (en) * 2005-08-30 2013-11-05 Lg Electronics, Inc. Method for decoding an audio signal
WO2007027051A1 (en) * 2005-08-30 2007-03-08 Lg Electronics Inc. Apparatus for encoding and decoding audio signal and method thereof
KR20070025905A (ko) * 2005-08-30 2007-03-08 엘지전자 주식회사 멀티채널 오디오 코딩에서 효과적인 샘플링 주파수비트스트림 구성방법
KR20080049735A (ko) * 2005-08-30 2008-06-04 엘지전자 주식회사 오디오 신호의 디코딩 방법 및 장치
US7788107B2 (en) * 2005-08-30 2010-08-31 Lg Electronics Inc. Method for decoding an audio signal
WO2007039957A1 (ja) * 2005-10-03 2007-04-12 Sharp Kabushiki Kaisha 表示装置
WO2007040363A1 (en) * 2005-10-05 2007-04-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
KR100857115B1 (ko) 2005-10-05 2008-09-05 엘지전자 주식회사 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치
US7646319B2 (en) * 2005-10-05 2010-01-12 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7751485B2 (en) * 2005-10-05 2010-07-06 Lg Electronics Inc. Signal processing using pilot based coding
US7696907B2 (en) * 2005-10-05 2010-04-13 Lg Electronics Inc. Method and apparatus for signal processing and encoding and decoding method, and apparatus therefor
US7672379B2 (en) * 2005-10-05 2010-03-02 Lg Electronics Inc. Audio signal processing, encoding, and decoding
DE102005048581B4 (de) * 2005-10-06 2022-06-09 Robert Bosch Gmbh Teilnehmerschnittstelle zwischen einem FlexRay-Kommunikationsbaustein und einem FlexRay-Teilnehmer und Verfahren zur Übertragung von Botschaften über eine solche Schnittstelle
KR100851972B1 (ko) * 2005-10-12 2008-08-12 삼성전자주식회사 오디오 데이터 및 확장 데이터 부호화/복호화 방법 및 장치
BRPI0617447A2 (pt) * 2005-10-14 2012-04-17 Matsushita Electric Ind Co Ltd codificador de transformada e método de codificação de transformada
US20070094035A1 (en) * 2005-10-21 2007-04-26 Nokia Corporation Audio coding
US7742913B2 (en) * 2005-10-24 2010-06-22 Lg Electronics Inc. Removing time delays in signal paths
TWI307037B (en) * 2005-10-31 2009-03-01 Holtek Semiconductor Inc Audio calculation method
US20080162862A1 (en) * 2005-12-02 2008-07-03 Yoshiki Matsumoto Signal Processing Apparatus and Signal Processing Method
US8345890B2 (en) 2006-01-05 2013-01-01 Audience, Inc. System and method for utilizing inter-microphone level differences for speech enhancement
US8332216B2 (en) * 2006-01-12 2012-12-11 Stmicroelectronics Asia Pacific Pte., Ltd. System and method for low power stereo perceptual audio coding using adaptive masking threshold
US7752053B2 (en) 2006-01-13 2010-07-06 Lg Electronics Inc. Audio signal processing using pilot based coding
US7953604B2 (en) * 2006-01-20 2011-05-31 Microsoft Corporation Shape and scale parameters for extended-band frequency coding
US8190425B2 (en) * 2006-01-20 2012-05-29 Microsoft Corporation Complex cross-correlation parameters for multi-channel audio
US7831434B2 (en) 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8194880B2 (en) 2006-01-30 2012-06-05 Audience, Inc. System and method for utilizing omni-directional microphones for speech enhancement
US8744844B2 (en) 2007-07-06 2014-06-03 Audience, Inc. System and method for adaptive intelligent noise suppression
US9185487B2 (en) * 2006-01-30 2015-11-10 Audience, Inc. System and method for providing noise suppression utilizing null processing noise subtraction
US8204252B1 (en) 2006-10-10 2012-06-19 Audience, Inc. System and method for providing close microphone adaptive array processing
JP2007249075A (ja) * 2006-03-17 2007-09-27 Toshiba Corp 音声再生装置および高域補間処理方法
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
EP1853092B1 (en) * 2006-05-04 2011-10-05 LG Electronics, Inc. Enhancing stereo audio with remix capability
DE102006022346B4 (de) * 2006-05-12 2008-02-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalcodierung
US8204253B1 (en) 2008-06-30 2012-06-19 Audience, Inc. Self calibration of audio device
US8849231B1 (en) 2007-08-08 2014-09-30 Audience, Inc. System and method for adaptive power control
US8150065B2 (en) * 2006-05-25 2012-04-03 Audience, Inc. System and method for processing an audio signal
US8949120B1 (en) 2006-05-25 2015-02-03 Audience, Inc. Adaptive noise cancelation
US8934641B2 (en) * 2006-05-25 2015-01-13 Audience, Inc. Systems and methods for reconstructing decomposed audio signals
US8326609B2 (en) * 2006-06-29 2012-12-04 Lg Electronics Inc. Method and apparatus for an audio signal processing
US8682652B2 (en) 2006-06-30 2014-03-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Audio encoder, audio decoder and audio processor having a dynamically variable warping characteristic
WO2008004649A1 (en) * 2006-07-07 2008-01-10 Nec Corporation Audio encoding device, audio encoding method, and program thereof
US7797155B2 (en) * 2006-07-26 2010-09-14 Ittiam Systems (P) Ltd. System and method for measurement of perceivable quantization noise in perceptual audio coders
US7907579B2 (en) * 2006-08-15 2011-03-15 Cisco Technology, Inc. WiFi geolocation from carrier-managed system geolocation of a dual mode device
CN100531398C (zh) * 2006-08-23 2009-08-19 中兴通讯股份有限公司 一种移动多媒体广播系统的多音轨实现方法
US7882462B2 (en) * 2006-09-11 2011-02-01 The Mathworks, Inc. Hardware definition language generation for frame-based processing
US8745557B1 (en) 2006-09-11 2014-06-03 The Mathworks, Inc. Hardware definition language generation for data serialization from executable graphical models
US7461106B2 (en) * 2006-09-12 2008-12-02 Motorola, Inc. Apparatus and method for low complexity combinatorial coding of signals
JP4823001B2 (ja) * 2006-09-27 2011-11-24 富士通セミコンダクター株式会社 オーディオ符号化装置
JP5174027B2 (ja) * 2006-09-29 2013-04-03 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びミックス信号処理方法
JP5232791B2 (ja) 2006-10-12 2013-07-10 エルジー エレクトロニクス インコーポレイティド ミックス信号処理装置及びその方法
JP5325108B2 (ja) * 2006-10-13 2013-10-23 ギャラクシー ステューディオス エヌヴェー デジタルデータ集合を結合するための方法及び符号器、結合デジタルデータ集合の復号方法及び復号器、並びに結合デジタルデータ集合を記憶するための記録媒体
DE602006015328D1 (de) * 2006-11-03 2010-08-19 Psytechnics Ltd Abtastfehlerkompensation
US7616568B2 (en) * 2006-11-06 2009-11-10 Ixia Generic packet generation
BRPI0718614A2 (pt) * 2006-11-15 2014-02-25 Lg Electronics Inc Método e aparelho para decodificar sinal de áudio.
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
KR101100223B1 (ko) 2006-12-07 2011-12-28 엘지전자 주식회사 오디오 처리 방법 및 장치
WO2008069584A2 (en) 2006-12-07 2008-06-12 Lg Electronics Inc. A method and an apparatus for decoding an audio signal
US7508326B2 (en) * 2006-12-21 2009-03-24 Sigmatel, Inc. Automatically disabling input/output signal processing based on the required multimedia format
US8255226B2 (en) * 2006-12-22 2012-08-28 Broadcom Corporation Efficient background audio encoding in a real time system
FR2911031B1 (fr) * 2006-12-28 2009-04-10 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
FR2911020B1 (fr) * 2006-12-28 2009-05-01 Actimagine Soc Par Actions Sim Procede et dispositif de codage audio
EP2109861B1 (en) * 2007-01-10 2019-03-13 Koninklijke Philips N.V. Audio decoder
US8275611B2 (en) * 2007-01-18 2012-09-25 Stmicroelectronics Asia Pacific Pte., Ltd. Adaptive noise suppression for digital speech signals
US20100121470A1 (en) * 2007-02-13 2010-05-13 Lg Electronics Inc. Method and an apparatus for processing an audio signal
JP2010518460A (ja) * 2007-02-13 2010-05-27 エルジー エレクトロニクス インコーポレイティド オーディオ信号の処理方法及び装置
TWI396187B (zh) * 2007-02-14 2013-05-11 Lg Electronics Inc 用於將以物件為主之音訊信號編碼與解碼之方法與裝置
US8184710B2 (en) 2007-02-21 2012-05-22 Microsoft Corporation Adaptive truncation of transform coefficient data in a transform-based digital media codec
US8259926B1 (en) 2007-02-23 2012-09-04 Audience, Inc. System and method for 2-channel and 3-channel acoustic echo cancellation
KR101149449B1 (ko) * 2007-03-20 2012-05-25 삼성전자주식회사 오디오 신호의 인코딩 방법 및 장치, 그리고 오디오 신호의디코딩 방법 및 장치
CN101272209B (zh) * 2007-03-21 2012-04-25 大唐移动通信设备有限公司 一种对多通道复用数据进行滤波的方法及设备
US9466307B1 (en) * 2007-05-22 2016-10-11 Digimarc Corporation Robust spectral encoding and decoding methods
US7761290B2 (en) 2007-06-15 2010-07-20 Microsoft Corporation Flexible frequency and time partitioning in perceptual transform coding of audio
US8719012B2 (en) * 2007-06-15 2014-05-06 Orange Methods and apparatus for coding digital audio signals using a filtered quantizing noise
US8046214B2 (en) 2007-06-22 2011-10-25 Microsoft Corporation Low complexity decoder for complex transform coding of multi-channel sound
US7944847B2 (en) * 2007-06-25 2011-05-17 Efj, Inc. Voting comparator method, apparatus, and system using a limited number of digital signal processor modules to process a larger number of analog audio streams without affecting the quality of the voted audio stream
US7885819B2 (en) 2007-06-29 2011-02-08 Microsoft Corporation Bitstream syntax for multi-process audio decoding
US8189766B1 (en) 2007-07-26 2012-05-29 Audience, Inc. System and method for blind subband acoustic echo cancellation postfiltering
US8285554B2 (en) * 2007-07-27 2012-10-09 Dsp Group Limited Method and system for dynamic aliasing suppression
KR101403340B1 (ko) * 2007-08-02 2014-06-09 삼성전자주식회사 변환 부호화 방법 및 장치
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
US8576096B2 (en) * 2007-10-11 2013-11-05 Motorola Mobility Llc Apparatus and method for low complexity combinatorial coding of signals
US8209190B2 (en) * 2007-10-25 2012-06-26 Motorola Mobility, Inc. Method and apparatus for generating an enhancement layer within an audio coding system
US8249883B2 (en) 2007-10-26 2012-08-21 Microsoft Corporation Channel extension coding for multi-channel source
US8199927B1 (en) 2007-10-31 2012-06-12 ClearOnce Communications, Inc. Conferencing system implementing echo cancellation and push-to-talk microphone detection using two-stage frequency filter
GB2454208A (en) 2007-10-31 2009-05-06 Cambridge Silicon Radio Ltd Compression using a perceptual model and a signal-to-mask ratio (SMR) parameter tuned based on target bitrate and previously encoded data
CN101903944B (zh) * 2007-12-18 2013-04-03 Lg电子株式会社 用于处理音频信号的方法和装置
US20090164223A1 (en) * 2007-12-19 2009-06-25 Dts, Inc. Lossless multi-channel audio codec
US8239210B2 (en) * 2007-12-19 2012-08-07 Dts, Inc. Lossless multi-channel audio codec
US8180064B1 (en) 2007-12-21 2012-05-15 Audience, Inc. System and method for providing voice equalization
US8143620B1 (en) 2007-12-21 2012-03-27 Audience, Inc. System and method for adaptive classification of audio sources
US8359196B2 (en) * 2007-12-28 2013-01-22 Panasonic Corporation Stereo sound decoding apparatus, stereo sound encoding apparatus and lost-frame compensating method
ES2401817T3 (es) * 2008-01-31 2013-04-24 Agency For Science, Technology And Research Procedimiento y dispositivo de distribución/truncado de la velocidad de transmisión de bits para codificación de audio escalable
KR101441898B1 (ko) * 2008-02-01 2014-09-23 삼성전자주식회사 주파수 부호화 방법 및 장치와 주파수 복호화 방법 및 장치
US20090210222A1 (en) * 2008-02-15 2009-08-20 Microsoft Corporation Multi-Channel Hole-Filling For Audio Compression
US8194882B2 (en) 2008-02-29 2012-06-05 Audience, Inc. System and method for providing single microphone noise suppression fallback
US20090234642A1 (en) * 2008-03-13 2009-09-17 Motorola, Inc. Method and Apparatus for Low Complexity Combinatorial Coding of Signals
US8355511B2 (en) 2008-03-18 2013-01-15 Audience, Inc. System and method for envelope-based acoustic echo cancellation
US8639519B2 (en) * 2008-04-09 2014-01-28 Motorola Mobility Llc Method and apparatus for selective signal coding based on core encoder performance
KR101599875B1 (ko) * 2008-04-17 2016-03-14 삼성전자주식회사 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 부호화 방법 및 장치, 멀티미디어의 컨텐트 특성에 기반한 멀티미디어 복호화 방법 및 장치
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
KR20090110242A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 신호를 처리하는 방법 및 장치
AU2009274456B2 (en) * 2008-04-18 2011-08-25 Dolby Laboratories Licensing Corporation Method and apparatus for maintaining speech audibility in multi-channel audio with minimal impact on surround experience
US8179974B2 (en) 2008-05-02 2012-05-15 Microsoft Corporation Multi-level representation of reordered transform coefficients
US8630848B2 (en) 2008-05-30 2014-01-14 Digital Rise Technology Co., Ltd. Audio signal transient detection
CN101605017A (zh) * 2008-06-12 2009-12-16 华为技术有限公司 编码比特的分配方法和装置
US8909361B2 (en) * 2008-06-19 2014-12-09 Broadcom Corporation Method and system for processing high quality audio in a hardware audio codec for audio transmission
ATE557386T1 (de) * 2008-06-26 2012-05-15 France Telecom Raumsynthese mehrkanaliger tonsignale
US8774423B1 (en) 2008-06-30 2014-07-08 Audience, Inc. System and method for controlling adaptivity of signal modification using a phantom coefficient
US8521530B1 (en) 2008-06-30 2013-08-27 Audience, Inc. System and method for enhancing a monaural audio signal
US8380523B2 (en) * 2008-07-07 2013-02-19 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CA2729751C (en) * 2008-07-10 2017-10-24 Voiceage Corporation Device and method for quantizing and inverse quantizing lpc filters in a super-frame
TWI427619B (zh) * 2008-07-21 2014-02-21 Realtek Semiconductor Corp 音效混波裝置與方法
US8406307B2 (en) 2008-08-22 2013-03-26 Microsoft Corporation Entropy coding/decoding of hierarchically organized data
US8121830B2 (en) * 2008-10-24 2012-02-21 The Nielsen Company (Us), Llc Methods and apparatus to extract data encoded in media content
US8359205B2 (en) 2008-10-24 2013-01-22 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9667365B2 (en) 2008-10-24 2017-05-30 The Nielsen Company (Us), Llc Methods and apparatus to perform audio watermarking and watermark detection and extraction
US9947340B2 (en) 2008-12-10 2018-04-17 Skype Regeneration of wideband speech
GB2466201B (en) * 2008-12-10 2012-07-11 Skype Ltd Regeneration of wideband speech
GB0822537D0 (en) 2008-12-10 2009-01-14 Skype Ltd Regeneration of wideband speech
AT509439B1 (de) * 2008-12-19 2013-05-15 Siemens Entpr Communications Verfahren und mittel zur skalierbaren verbesserung der qualität eines signalcodierverfahrens
US8200496B2 (en) * 2008-12-29 2012-06-12 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8219408B2 (en) * 2008-12-29 2012-07-10 Motorola Mobility, Inc. Audio signal decoder and method for producing a scaled reconstructed audio signal
US8175888B2 (en) * 2008-12-29 2012-05-08 Motorola Mobility, Inc. Enhanced layered gain factor balancing within a multiple-channel audio coding system
US8140342B2 (en) * 2008-12-29 2012-03-20 Motorola Mobility, Inc. Selective scaling mask computation based on peak detection
CN102625982B (zh) 2009-05-01 2015-03-18 尼尔森(美国)有限公司 提供与主要广播媒体内容关联的辅助内容的方法、装置和制品
WO2011021238A1 (ja) * 2009-08-20 2011-02-24 トムソン ライセンシング レート制御装置、レート制御方法及びレート制御プログラム
GB0915766D0 (en) * 2009-09-09 2009-10-07 Apt Licensing Ltd Apparatus and method for multidimensional adaptive audio coding
EP2323130A1 (en) * 2009-11-12 2011-05-18 Koninklijke Philips Electronics N.V. Parametric encoding and decoding
US9838784B2 (en) 2009-12-02 2017-12-05 Knowles Electronics, Llc Directional audio capture
US9008329B1 (en) 2010-01-26 2015-04-14 Audience, Inc. Noise reduction using multi-feature cluster tracker
US8861742B2 (en) * 2010-01-26 2014-10-14 Yamaha Corporation Masker sound generation apparatus and program
US8718290B2 (en) 2010-01-26 2014-05-06 Audience, Inc. Adaptive noise reduction using level cues
DE102010006573B4 (de) * 2010-02-02 2012-03-15 Rohde & Schwarz Gmbh & Co. Kg IQ-Datenkompression für Breitbandanwendungen
EP2365630B1 (en) * 2010-03-02 2016-06-08 Harman Becker Automotive Systems GmbH Efficient sub-band adaptive fir-filtering
US8423355B2 (en) * 2010-03-05 2013-04-16 Motorola Mobility Llc Encoder for audio signal including generic audio and speech frames
US8428936B2 (en) * 2010-03-05 2013-04-23 Motorola Mobility Llc Decoder for audio signal including generic audio and speech frames
US8374858B2 (en) * 2010-03-09 2013-02-12 Dts, Inc. Scalable lossless audio codec and authoring tool
CN102222505B (zh) * 2010-04-13 2012-12-19 中兴通讯股份有限公司 可分层音频编解码方法系统及瞬态信号可分层编解码方法
JP5850216B2 (ja) * 2010-04-13 2016-02-03 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US9378754B1 (en) 2010-04-28 2016-06-28 Knowles Electronics, Llc Adaptive spatial classifier for multi-microphone systems
US20120029926A1 (en) 2010-07-30 2012-02-02 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for dependent-mode coding of audio signals
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US9208792B2 (en) 2010-08-17 2015-12-08 Qualcomm Incorporated Systems, methods, apparatus, and computer-readable media for noise injection
KR102014696B1 (ko) 2010-09-16 2019-08-27 돌비 인터네셔널 에이비 교차 곱 강화된 서브밴드 블록 기반 고조파 전위
CN103262158B (zh) * 2010-09-28 2015-07-29 华为技术有限公司 对解码的多声道音频信号或立体声信号进行后处理的装置和方法
JP5609591B2 (ja) * 2010-11-30 2014-10-22 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法及びオーディオ符号化用コンピュータプログラム
US9436441B1 (en) 2010-12-08 2016-09-06 The Mathworks, Inc. Systems and methods for hardware resource sharing
US9009030B2 (en) * 2011-01-05 2015-04-14 Google Inc. Method and system for facilitating text input
JP5666021B2 (ja) * 2011-02-14 2015-02-04 フラウンホーファー−ゲゼルシャフト・ツール・フェルデルング・デル・アンゲヴァンテン・フォルシュング・アインゲトラーゲネル・フェライン 復号後オーディオ信号をスペクトル領域で処理する装置及び方法
CA2903681C (en) 2011-02-14 2017-03-28 Fraunhofer-Gesellschaft Zur Forderung Der Angewandten Forschung E.V. Audio codec using noise synthesis during inactive phases
JP5603484B2 (ja) 2011-04-05 2014-10-08 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、記録媒体
KR101859246B1 (ko) * 2011-04-20 2018-05-17 파나소닉 인텔렉츄얼 프로퍼티 코포레이션 오브 아메리카 허프만 부호화를 실행하기 위한 장치 및 방법
GB2490879B (en) * 2011-05-12 2018-12-26 Qualcomm Technologies Int Ltd Hybrid coded audio data streaming apparatus and method
MX337772B (es) 2011-05-13 2016-03-18 Samsung Electronics Co Ltd Asignacion de bits, codificacion y decodificacion de audio.
US8731949B2 (en) * 2011-06-30 2014-05-20 Zte Corporation Method and system for audio encoding and decoding and method for estimating noise level
US9355000B1 (en) 2011-08-23 2016-05-31 The Mathworks, Inc. Model level power consumption optimization in hardware description generation
US8781023B2 (en) * 2011-11-01 2014-07-15 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth expanded channel
US8774308B2 (en) * 2011-11-01 2014-07-08 At&T Intellectual Property I, L.P. Method and apparatus for improving transmission of data on a bandwidth mismatched channel
FR2984579B1 (fr) * 2011-12-14 2013-12-13 Inst Polytechnique Grenoble Procede de traitement numerique sur un ensemble de pistes audio avant mixage
ES2540215T3 (es) * 2012-04-05 2015-07-09 Huawei Technologies Co., Ltd. Método de estimación de diferencia inter-canal y dispositivo de codificación de audio espacial
JP5998603B2 (ja) * 2012-04-18 2016-09-28 ソニー株式会社 音検出装置、音検出方法、音特徴量検出装置、音特徴量検出方法、音区間検出装置、音区間検出方法およびプログラム
TWI505262B (zh) * 2012-05-15 2015-10-21 Dolby Int Ab 具多重子流之多通道音頻信號的有效編碼與解碼
GB201210373D0 (en) * 2012-06-12 2012-07-25 Meridian Audio Ltd Doubly compatible lossless audio sandwidth extension
CN102752058B (zh) * 2012-06-16 2013-10-16 天地融科技股份有限公司 音频数据传输系统、音频数据传输装置及电子签名工具
TWI586150B (zh) * 2012-06-29 2017-06-01 新力股份有限公司 影像處理裝置及非暫態電腦可讀儲存媒體
JP6065452B2 (ja) 2012-08-14 2017-01-25 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
US9129600B2 (en) 2012-09-26 2015-09-08 Google Technology Holdings LLC Method and apparatus for encoding an audio signal
JP5447628B1 (ja) * 2012-09-28 2014-03-19 パナソニック株式会社 無線通信装置及び通信端末
KR102200643B1 (ko) 2012-12-13 2021-01-08 프라운호퍼-게젤샤프트 추르 푀르데룽 데어 안제반텐 포르슝 에 파우 음성 음향 부호화 장치, 음성 음향 복호 장치, 음성 음향 부호화 방법 및 음성 음향 복호 방법
CA3076775C (en) 2013-01-08 2020-10-27 Dolby International Ab Model based prediction in a critically sampled filterbank
JP6179122B2 (ja) * 2013-02-20 2017-08-16 富士通株式会社 オーディオ符号化装置、オーディオ符号化方法、オーディオ符号化プログラム
US9093064B2 (en) 2013-03-11 2015-07-28 The Nielsen Company (Us), Llc Down-mixing compensation for audio watermarking
WO2014164361A1 (en) 2013-03-13 2014-10-09 Dts Llc System and methods for processing stereo audio content
JP6146069B2 (ja) * 2013-03-18 2017-06-14 富士通株式会社 データ埋め込み装置及び方法、データ抽出装置及び方法、並びにプログラム
EP2981961B1 (en) 2013-04-05 2017-05-10 Dolby International AB Advanced quantizer
US9495968B2 (en) 2013-05-29 2016-11-15 Qualcomm Incorporated Identifying sources from which higher order ambisonic audio data is generated
US9536540B2 (en) 2013-07-19 2017-01-03 Knowles Electronics, Llc Speech signal separation and synthesis based on auditory scene analysis and speech modeling
CN111179946B (zh) * 2013-09-13 2023-10-13 三星电子株式会社 无损编码方法和无损解码方法
CA2926243C (en) * 2013-10-21 2018-01-23 Lars Villemoes Decorrelator structure for parametric reconstruction of audio signals
WO2015060652A1 (ko) * 2013-10-22 2015-04-30 연세대학교 산학협력단 오디오 신호 처리 방법 및 장치
US9817931B1 (en) 2013-12-05 2017-11-14 The Mathworks, Inc. Systems and methods for generating optimized hardware descriptions for models
US10078717B1 (en) 2013-12-05 2018-09-18 The Mathworks, Inc. Systems and methods for estimating performance characteristics of hardware implementations of executable models
KR102356012B1 (ko) 2013-12-27 2022-01-27 소니그룹주식회사 복호화 장치 및 방법, 및 프로그램
US8767996B1 (en) 2014-01-06 2014-07-01 Alpine Electronics of Silicon Valley, Inc. Methods and devices for reproducing audio signals with a haptic apparatus on acoustic headphones
US10986454B2 (en) 2014-01-06 2021-04-20 Alpine Electronics of Silicon Valley, Inc. Sound normalization and frequency remapping using haptic feedback
US8977376B1 (en) 2014-01-06 2015-03-10 Alpine Electronics of Silicon Valley, Inc. Reproducing audio signals with a haptic apparatus on acoustic headphones and their calibration and measurement
CN109905718B (zh) * 2014-02-27 2023-05-12 瑞典爱立信有限公司 用于棱椎矢量量化编索引和解索引的方法和装置
US9564136B2 (en) * 2014-03-06 2017-02-07 Dts, Inc. Post-encoding bitrate reduction of multiple object audio
TWI662543B (zh) 2014-03-24 2019-06-11 瑞典商杜比國際公司 應用動態範圍壓縮之方法和設備以及一種非暫態電腦可讀取儲存媒體
US9685164B2 (en) * 2014-03-31 2017-06-20 Qualcomm Incorporated Systems and methods of switching coding technologies at a device
FR3020732A1 (fr) * 2014-04-30 2015-11-06 Orange Correction de perte de trame perfectionnee avec information de voisement
US9997171B2 (en) * 2014-05-01 2018-06-12 Gn Hearing A/S Multi-band signal processor for digital audio signals
JP6700507B6 (ja) * 2014-06-10 2020-07-22 エムキューエー リミテッド オーディオ信号のデジタルカプセル化
JP6432180B2 (ja) * 2014-06-26 2018-12-05 ソニー株式会社 復号装置および方法、並びにプログラム
EP2960903A1 (en) * 2014-06-27 2015-12-30 Thomson Licensing Method and apparatus for determining for the compression of an HOA data frame representation a lowest integer number of bits required for representing non-differential gain values
CN113793617A (zh) * 2014-06-27 2021-12-14 杜比国际公司 针对hoa数据帧表示的压缩确定表示非差分增益值所需的最小整数比特数的方法
EP2980794A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder and decoder using a frequency domain processor and a time domain processor
EP2980795A1 (en) 2014-07-28 2016-02-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoding and decoding using a frequency domain processor, a time domain processor and a cross processor for initialization of the time domain processor
EP2988300A1 (en) * 2014-08-18 2016-02-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Switching of sampling rates at audio processing devices
US11670306B2 (en) * 2014-09-04 2023-06-06 Sony Corporation Transmission device, transmission method, reception device and reception method
CN107112025A (zh) 2014-09-12 2017-08-29 美商楼氏电子有限公司 用于恢复语音分量的系统和方法
ES2814900T3 (es) * 2014-10-01 2021-03-29 Dolby Int Ab Descodificación de una señal de audio codificada usando perfiles DRC
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及系统
US9659578B2 (en) * 2014-11-27 2017-05-23 Tata Consultancy Services Ltd. Computer implemented system and method for identifying significant speech frames within speech signals
EP3067885A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding a multi-channel signal
EP3067887A1 (en) * 2015-03-09 2016-09-14 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoder for encoding a multichannel signal and audio decoder for decoding an encoded audio signal
CN106161313A (zh) * 2015-03-30 2016-11-23 索尼公司 无线通信系统中的电子设备、无线通信系统和方法
US10043527B1 (en) * 2015-07-17 2018-08-07 Digimarc Corporation Human auditory system modeling with masking energy adaptation
EP3342188B1 (en) 2015-08-25 2020-08-12 Dolby Laboratories Licensing Corporation Audo decoder and decoding method
US10586553B2 (en) 2015-09-25 2020-03-10 Dolby Laboratories Licensing Corporation Processing high-definition audio data
US10423733B1 (en) 2015-12-03 2019-09-24 The Mathworks, Inc. Systems and methods for sharing resources having different data types
WO2017132366A1 (en) 2016-01-26 2017-08-03 Dolby Laboratories Licensing Corporation Adaptive quantization
US9820042B1 (en) 2016-05-02 2017-11-14 Knowles Electronics, Llc Stereo separation and directional suppression with omni-directional microphones
CA3024167A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method, apparatus and medium
US10699725B2 (en) * 2016-05-10 2020-06-30 Immersion Networks, Inc. Adaptive audio encoder system, method and article
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
US10770088B2 (en) * 2016-05-10 2020-09-08 Immersion Networks, Inc. Adaptive audio decoder system, method and article
US10756755B2 (en) * 2016-05-10 2020-08-25 Immersion Networks, Inc. Adaptive audio codec system, method and article
US20170330575A1 (en) * 2016-05-10 2017-11-16 Immersion Services LLC Adaptive audio codec system, method and article
CN105869648B (zh) * 2016-05-19 2019-11-22 日立楼宇技术(广州)有限公司 混音方法及装置
US10231073B2 (en) 2016-06-17 2019-03-12 Dts, Inc. Ambisonic audio rendering with depth decoding
US10375498B2 (en) 2016-11-16 2019-08-06 Dts, Inc. Graphical user interface for calibrating a surround sound system
US10950247B2 (en) * 2016-11-23 2021-03-16 Telefonaktiebolaget Lm Ericsson (Publ) Method and apparatus for adaptive control of decorrelation filters
JP2018092012A (ja) * 2016-12-05 2018-06-14 ソニー株式会社 情報処理装置、情報処理方法、およびプログラム
US10362269B2 (en) * 2017-01-11 2019-07-23 Ringcentral, Inc. Systems and methods for determining one or more active speakers during an audio or video conference session
US10339947B2 (en) * 2017-03-22 2019-07-02 Immersion Networks, Inc. System and method for processing audio data
US10699721B2 (en) 2017-04-25 2020-06-30 Dts, Inc. Encoding and decoding of digital audio signals using difference data
CN109427338B (zh) * 2017-08-23 2021-03-30 华为技术有限公司 立体声信号的编码方法和编码装置
WO2019049543A1 (ja) * 2017-09-08 2019-03-14 ソニー株式会社 音声処理装置、音声処理方法及びプログラム
US10609503B2 (en) 2018-04-08 2020-03-31 Dts, Inc. Ambisonic depth extraction
US11817111B2 (en) 2018-04-11 2023-11-14 Dolby Laboratories Licensing Corporation Perceptually-based loss functions for audio encoding and decoding based on machine learning
CN109243471B (zh) * 2018-09-26 2022-09-23 杭州联汇科技股份有限公司 一种快速编码广播用数字音频的方法
US10763885B2 (en) 2018-11-06 2020-09-01 Stmicroelectronics S.R.L. Method of error concealment, and associated device
CN109831280A (zh) * 2019-02-28 2019-05-31 深圳市友杰智新科技有限公司 一种声波通讯方法、装置及可读存储介质
KR20200123531A (ko) * 2019-04-22 2020-10-30 주식회사 쏠리드 통신 신호를 처리하는 방법 및 이를 이용하는 통신 노드
US11361772B2 (en) 2019-05-14 2022-06-14 Microsoft Technology Licensing, Llc Adaptive and fixed mapping for compression and decompression of audio data
US10681463B1 (en) * 2019-05-17 2020-06-09 Sonos, Inc. Wireless transmission to satellites for multichannel audio system
WO2020232631A1 (zh) * 2019-05-21 2020-11-26 深圳市汇顶科技股份有限公司 一种语音分频传输方法、源端、播放端、源端电路和播放端电路
CN113950845B (zh) 2019-05-31 2023-08-04 Dts公司 凹式音频渲染
CN110365342B (zh) * 2019-06-06 2023-05-12 中车青岛四方机车车辆股份有限公司 波形解码方法及装置
EP3751567B1 (en) * 2019-06-10 2022-01-26 Axis AB A method, a computer program, an encoder and a monitoring device
US11380343B2 (en) 2019-09-12 2022-07-05 Immersion Networks, Inc. Systems and methods for processing high frequency audio signal
GB2587196A (en) * 2019-09-13 2021-03-24 Nokia Technologies Oy Determination of spatial audio parameter encoding and associated decoding
CN112530444B (zh) * 2019-09-18 2023-10-03 华为技术有限公司 音频编码方法和装置
US20210224024A1 (en) * 2020-01-21 2021-07-22 Audiowise Technology Inc. Bluetooth audio system with low latency, and audio source and audio sink thereof
WO2021183916A1 (en) * 2020-03-13 2021-09-16 Immersion Networks, Inc. Loudness equalization system
CN112037802B (zh) * 2020-05-08 2022-04-01 珠海市杰理科技股份有限公司 基于语音端点检测的音频编码方法及装置、设备、介质
CN111583942B (zh) * 2020-05-26 2023-06-13 腾讯科技(深圳)有限公司 语音会话的编码码率控制方法、装置和计算机设备
CN112187397B (zh) * 2020-09-11 2022-04-29 烽火通信科技股份有限公司 一种通用的多通道数据同步方法和装置
CN112885364B (zh) * 2021-01-21 2023-10-13 维沃移动通信有限公司 音频编码方法和解码方法、音频编码装置和解码装置
US20230154474A1 (en) * 2021-11-17 2023-05-18 Agora Lab, Inc. System and method for providing high quality audio communication over low bit rate connection
WO2024012666A1 (en) * 2022-07-12 2024-01-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding or decoding ar/vr metadata with generic codebooks
CN115171709B (zh) * 2022-09-05 2022-11-18 腾讯科技(深圳)有限公司 语音编码、解码方法、装置、计算机设备和存储介质
US11935550B1 (en) * 2023-03-31 2024-03-19 The Adt Security Corporation Audio compression for low overhead decompression

Family Cites Families (62)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
DE3171990D1 (en) * 1981-04-30 1985-10-03 Ibm Speech coding methods and apparatus for carrying out the method
JPS5921039B2 (ja) * 1981-11-04 1984-05-17 日本電信電話株式会社 適応予測符号化方式
US4455649A (en) * 1982-01-15 1984-06-19 International Business Machines Corporation Method and apparatus for efficient statistical multiplexing of voice and data signals
US4547816A (en) 1982-05-03 1985-10-15 Robert Bosch Gmbh Method of recording digital audio and video signals in the same track
US4535472A (en) * 1982-11-05 1985-08-13 At&T Bell Laboratories Adaptive bit allocator
US5051991A (en) * 1984-10-17 1991-09-24 Ericsson Ge Mobile Communications Inc. Method and apparatus for efficient digital time delay compensation in compressed bandwidth signal processing
US4817146A (en) * 1984-10-17 1989-03-28 General Electric Company Cryptographic digital signal transceiver method and apparatus
US4757536A (en) * 1984-10-17 1988-07-12 General Electric Company Method and apparatus for transceiving cryptographically encoded digital data
US4622680A (en) * 1984-10-17 1986-11-11 General Electric Company Hybrid subband coder/decoder method and apparatus
US4675863A (en) * 1985-03-20 1987-06-23 International Mobile Machines Corp. Subscriber RF telephone system for providing multiple speech and/or data signals simultaneously over either a single or a plurality of RF channels
JPS62154368A (ja) 1985-12-27 1987-07-09 Canon Inc 記録装置
US4815074A (en) * 1986-08-01 1989-03-21 General Datacomm, Inc. High speed bit interleaved time division multiplexer for multinode communication systems
US4899384A (en) * 1986-08-25 1990-02-06 Ibm Corporation Table controlled dynamic bit allocation in a variable rate sub-band speech coder
DE3639753A1 (de) * 1986-11-21 1988-06-01 Inst Rundfunktechnik Gmbh Verfahren zum uebertragen digitalisierter tonsignale
NL8700985A (nl) * 1987-04-27 1988-11-16 Philips Nv Systeem voor sub-band codering van een digitaal audiosignaal.
JPH0783315B2 (ja) * 1988-09-26 1995-09-06 富士通株式会社 可変レート音声信号符号化方式
US4881224A (en) 1988-10-19 1989-11-14 General Datacomm, Inc. Framing algorithm for bit interleaved time division multiplexer
US5341457A (en) * 1988-12-30 1994-08-23 At&T Bell Laboratories Perceptual coding of audio signals
EP0411998B1 (en) 1989-07-29 1995-03-22 Sony Corporation 4-Channel PCM signal processing apparatus
US5115240A (en) * 1989-09-26 1992-05-19 Sony Corporation Method and apparatus for encoding voice signals divided into a plurality of frequency bands
DE69028176T2 (de) * 1989-11-14 1997-01-23 Nec Corp Adaptive Transformationskodierung durch optimale Blocklängenselektion in Abhängigkeit von Unterschieden zwischen aufeinanderfolgenden Blöcken
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5388181A (en) * 1990-05-29 1995-02-07 Anderson; David J. Digital audio compression system
JP2841765B2 (ja) * 1990-07-13 1998-12-24 日本電気株式会社 適応ビット割当て方法及び装置
JPH04127747A (ja) * 1990-09-19 1992-04-28 Toshiba Corp 可変レート符号化方式
US5365553A (en) * 1990-11-30 1994-11-15 U.S. Philips Corporation Transmitter, encoding system and method employing use of a bit need determiner for subband coding a digital signal
US5136377A (en) * 1990-12-11 1992-08-04 At&T Bell Laboratories Adaptive non-linear quantizer
US5123015A (en) * 1990-12-20 1992-06-16 Hughes Aircraft Company Daisy chain multiplexer
DE69210689T2 (de) * 1991-01-08 1996-11-21 Dolby Lab Licensing Corp Kodierer/dekodierer für mehrdimensionale schallfelder
NL9100285A (nl) * 1991-02-19 1992-09-16 Koninkl Philips Electronics Nv Transmissiesysteem, en ontvanger te gebruiken in het transmissiesysteem.
ZA921988B (en) * 1991-03-29 1993-02-24 Sony Corp High efficiency digital data encoding and decoding apparatus
EP0506394A2 (en) * 1991-03-29 1992-09-30 Sony Corporation Coding apparatus for digital signals
JP3134338B2 (ja) * 1991-03-30 2001-02-13 ソニー株式会社 ディジタル音声信号符号化方法
ES2240252T3 (es) * 1991-06-11 2005-10-16 Qualcomm Incorporated Vocodificador de velocidad variable.
JP3508138B2 (ja) 1991-06-25 2004-03-22 ソニー株式会社 信号処理装置
KR100268623B1 (ko) * 1991-06-28 2000-10-16 이데이 노부유끼 압축 데이타 기록 재생 장치 및 신호 처리 방법
ES2164640T3 (es) * 1991-08-02 2002-03-01 Sony Corp Codificador digital con asignacion dinamica de bits de cuantificacion.
KR100263599B1 (ko) * 1991-09-02 2000-08-01 요트.게.아. 롤페즈 인코딩 시스템
JP3226945B2 (ja) * 1991-10-02 2001-11-12 キヤノン株式会社 マルチメディア通信装置
FR2685593B1 (fr) * 1991-12-20 1994-02-11 France Telecom Dispositif de demultiplexage en frequence a filtres numeriques.
US5642437A (en) * 1992-02-22 1997-06-24 Texas Instruments Incorporated System decoder circuit with temporary bit storage and method of operation
US5285498A (en) * 1992-03-02 1994-02-08 At&T Bell Laboratories Method and apparatus for coding audio signals based on perceptual model
EP0559348A3 (en) * 1992-03-02 1993-11-03 AT&T Corp. Rate control loop processor for perceptual encoder/decoder
CA2090052C (en) * 1992-03-02 1998-11-24 Anibal Joao De Sousa Ferreira Method and apparatus for the perceptual coding of audio signals
DE4209544A1 (de) * 1992-03-24 1993-09-30 Inst Rundfunktechnik Gmbh Verfahren zum Übertragen oder Speichern digitalisierter, mehrkanaliger Tonsignale
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5734789A (en) * 1992-06-01 1998-03-31 Hughes Electronics Voiced, unvoiced or noise modes in a CELP vocoder
TW235392B (zh) * 1992-06-02 1994-12-01 Philips Electronics Nv
US5436940A (en) * 1992-06-11 1995-07-25 Massachusetts Institute Of Technology Quadrature mirror filter banks and method
JP2976701B2 (ja) * 1992-06-24 1999-11-10 日本電気株式会社 量子化ビット数割当方法
US5408580A (en) * 1992-09-21 1995-04-18 Aware, Inc. Audio compression system employing multi-rate signal analysis
US5396489A (en) * 1992-10-26 1995-03-07 Motorola Inc. Method and means for transmultiplexing signals between signal terminals and radio frequency channels
US5381145A (en) * 1993-02-10 1995-01-10 Ricoh Corporation Method and apparatus for parallel decoding and encoding of data
US5657423A (en) * 1993-02-22 1997-08-12 Texas Instruments Incorporated Hardware filter circuit and address circuitry for MPEG encoded data
TW272341B (zh) * 1993-07-16 1996-03-11 Sony Co Ltd
US5451954A (en) * 1993-08-04 1995-09-19 Dolby Laboratories Licensing Corporation Quantization noise suppression for encoder/decoder system
US5488665A (en) * 1993-11-23 1996-01-30 At&T Corp. Multi-channel perceptual audio compression system with encoding mode switching among matrixed channels
JPH07202820A (ja) * 1993-12-28 1995-08-04 Matsushita Electric Ind Co Ltd ビットレート制御システム
US5608713A (en) * 1994-02-09 1997-03-04 Sony Corporation Bit allocation of digital audio signal blocks by non-linear processing
JP2778482B2 (ja) * 1994-09-26 1998-07-23 日本電気株式会社 帯域分割符号化装置
US5748903A (en) * 1995-07-21 1998-05-05 Intel Corporation Encoding images using decode rate control
ES2201929B1 (es) * 2002-09-12 2005-05-16 Araclon Biotech, S.L. Anticuerpos policlonales, metodo de preparacion y uso de los mismos.

Cited By (58)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102833538B (zh) * 2004-06-27 2015-04-22 苹果公司 多通路视频编码
CN1822508B (zh) * 2005-01-19 2012-07-18 三星电子株式会社 对数字信号进行编码和解码的方法和设备
CN101124740B (zh) * 2005-02-23 2012-05-30 艾利森电话股份有限公司 多声道音频信号编码和解码的方法和装置和音频传送系统
CN101133680B (zh) * 2005-03-04 2012-08-08 弗劳恩霍夫应用研究促进协会 用于产生已编码立体声信号的设备及方法
CN101185119B (zh) * 2005-05-26 2011-07-27 Lg电子株式会社 解码音频信号的方法和装置
US9595267B2 (en) 2005-05-26 2017-03-14 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8917874B2 (en) 2005-05-26 2014-12-23 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8577686B2 (en) 2005-05-26 2013-11-05 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8543386B2 (en) 2005-05-26 2013-09-24 Lg Electronics Inc. Method and apparatus for decoding an audio signal
US8554568B2 (en) 2005-07-11 2013-10-08 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with each coded-coefficients
US8149877B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
CN101243496B (zh) * 2005-07-11 2011-12-07 Lg电子株式会社 处理音频信号的装置和方法
US8155153B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8155144B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8155152B2 (en) 2005-07-11 2012-04-10 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8255227B2 (en) 2005-07-11 2012-08-28 Lg Electronics, Inc. Scalable encoding and decoding of multichannel audio with up to five levels in subdivision hierarchy
US8275476B2 (en) 2005-07-11 2012-09-25 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signals
US8149878B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8149876B2 (en) 2005-07-11 2012-04-03 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8326132B2 (en) 2005-07-11 2012-12-04 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8180631B2 (en) 2005-07-11 2012-05-15 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing a unique offset associated with each coded-coefficient
US8510119B2 (en) 2005-07-11 2013-08-13 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with coded-coefficients
US8417100B2 (en) 2005-07-11 2013-04-09 Lg Electronics Inc. Apparatus and method of encoding and decoding audio signal
US8510120B2 (en) 2005-07-11 2013-08-13 Lg Electronics Inc. Apparatus and method of processing an audio signal, utilizing unique offsets associated with coded-coefficients
US8488819B2 (en) 2006-01-19 2013-07-16 Lg Electronics Inc. Method and apparatus for processing a media signal
US8411869B2 (en) 2006-01-19 2013-04-02 Lg Electronics Inc. Method and apparatus for processing a media signal
US8351611B2 (en) 2006-01-19 2013-01-08 Lg Electronics Inc. Method and apparatus for processing a media signal
US8521313B2 (en) 2006-01-19 2013-08-27 Lg Electronics Inc. Method and apparatus for processing a media signal
US8208641B2 (en) 2006-01-19 2012-06-26 Lg Electronics Inc. Method and apparatus for processing a media signal
US8638945B2 (en) 2006-02-07 2014-01-28 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
US8285556B2 (en) 2006-02-07 2012-10-09 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8612238B2 (en) 2006-02-07 2013-12-17 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
US8625810B2 (en) 2006-02-07 2014-01-07 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
US8712058B2 (en) 2006-02-07 2014-04-29 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
US8160258B2 (en) 2006-02-07 2012-04-17 Lg Electronics Inc. Apparatus and method for encoding/decoding signal
US8296156B2 (en) 2006-02-07 2012-10-23 Lg Electronics, Inc. Apparatus and method for encoding/decoding signal
CN101809653A (zh) * 2007-12-06 2010-08-18 Lg电子株式会社 用于处理音频信号的方法和装置
US8577485B2 (en) 2007-12-06 2013-11-05 Lg Electronics Inc. Method and an apparatus for processing an audio signal
CN102177426B (zh) * 2008-10-08 2014-11-05 弗兰霍菲尔运输应用研究公司 多分辨率切换音频编码/解码方案
US9043215B2 (en) 2008-10-08 2015-05-26 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Multi-resolution switched audio encoding/decoding scheme
CN103250207A (zh) * 2010-11-05 2013-08-14 汤姆逊许可公司 高阶高保真度立体声响复制音频数据的数据结构
US9241216B2 (en) 2010-11-05 2016-01-19 Thomson Licensing Data structure for higher order ambisonics audio data
CN103250207B (zh) * 2010-11-05 2016-01-20 汤姆逊许可公司 高阶高保真度立体声响复制音频数据的数据结构
US9736607B2 (en) 2013-04-29 2017-08-15 Dolby Laboratories Licensing Corporation Method and apparatus for compressing and decompressing a Higher Order Ambisonics representation
US11284210B2 (en) 2013-04-29 2022-03-22 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
US11895477B2 (en) 2013-04-29 2024-02-06 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
US9913063B2 (en) 2013-04-29 2018-03-06 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
US10264382B2 (en) 2013-04-29 2019-04-16 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
US10623878B2 (en) 2013-04-29 2020-04-14 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
US11758344B2 (en) 2013-04-29 2023-09-12 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
CN105144752A (zh) * 2013-04-29 2015-12-09 汤姆逊许可公司 对更高阶高保真度立体声响复制表示进行压缩和解压缩的方法和装置
US10999688B2 (en) 2013-04-29 2021-05-04 Dolby Laboratories Licensing Corporation Methods and apparatus for compressing and decompressing a higher order ambisonics representation
CN107430862B (zh) * 2015-02-27 2022-10-04 奥罗技术公司 数字数据集合的编码和解码
CN107430862A (zh) * 2015-02-27 2017-12-01 奥罗技术公司 数字数据集合的编码和解码
CN111341303A (zh) * 2018-12-19 2020-06-26 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN111341303B (zh) * 2018-12-19 2023-10-31 北京猎户星空科技有限公司 一种声学模型的训练方法及装置、语音识别方法及装置
CN111261194A (zh) * 2020-04-29 2020-06-09 浙江百应科技有限公司 一种基于pcm技术的音量分析方法
CN113485190A (zh) * 2021-07-13 2021-10-08 西安电子科技大学 一种多通道数据采集系统及采集方法

Also Published As

Publication number Publication date
CA2238026A1 (en) 1997-06-12
HK1015510A1 (en) 1999-10-15
EP0864146A4 (en) 2001-09-19
JP2000501846A (ja) 2000-02-15
CA2331611A1 (en) 1997-06-12
EA199800505A1 (ru) 1998-12-24
CN1208489A (zh) 1999-02-17
PL183092B1 (pl) 2002-05-31
CA2331611C (en) 2001-09-11
CN101872618A (zh) 2010-10-27
CN1848241A (zh) 2006-10-18
CN1303583C (zh) 2007-03-07
ATE279770T1 (de) 2004-10-15
KR100277819B1 (ko) 2001-01-15
EA001087B1 (ru) 2000-10-30
US5956674A (en) 1999-09-21
HK1149979A1 (en) 2011-10-21
PL183498B1 (pl) 2002-06-28
PT864146E (pt) 2005-02-28
CN101872618B (zh) 2012-08-22
AU1058997A (en) 1997-06-27
MX9804320A (es) 1998-11-30
US5978762A (en) 1999-11-02
HK1092270A1 (en) 2007-02-02
AU705194B2 (en) 1999-05-20
PL327082A1 (en) 1998-11-23
KR19990071708A (ko) 1999-09-27
EP0864146B1 (en) 2004-10-13
DE69633633T2 (de) 2005-10-27
JP4174072B2 (ja) 2008-10-29
US5974380A (en) 1999-10-26
CN1132151C (zh) 2003-12-24
CN1848242A (zh) 2006-10-18
CN1848242B (zh) 2012-04-18
BR9611852A (pt) 2000-05-16
CA2238026C (en) 2002-07-09
ES2232842T3 (es) 2005-06-01
DE69633633D1 (de) 2004-11-18
US6487535B1 (en) 2002-11-26
HK1092271A1 (en) 2007-02-02
PL182240B1 (pl) 2001-11-30
WO1997021211A1 (en) 1997-06-12
CN1848241B (zh) 2010-12-15
EP0864146A1 (en) 1998-09-16
DK0864146T3 (da) 2005-02-14

Similar Documents

Publication Publication Date Title
CN1132151C (zh) 多通道声解码器
CN1065382C (zh) 编码方法、译码方法、以及编码装置
CN1126265C (zh) 可伸缩的立体声音频编码/解码方法和装置
CN1116737C (zh) 用户可调节的适应听力的音量控制
CN100338649C (zh) 处理音频信号、生成重建的音频信号的方法、设备及媒体
JP5171269B2 (ja) マルチチャネルオーディオ符号化における忠実度の最適化及び信号伝送量の低減
CN101044794A (zh) 用于双声道提示码编码方案和类似方案的散射声音整形
CN1288622C (zh) 编码设备和解码设备
CN1748443A (zh) 多声道音频扩展支持
CN1205842C (zh) 编码方法和装置、解码方法和装置
CN101048935A (zh) 计算和调节音频信号的感觉响度和/或感觉频谱平衡
CN1233163C (zh) 多声道数字音频信号的压缩编码和解码设备及其方法
CN101044551A (zh) 用于双声道提示编码方案和类似方案的单通道整形
CN1111959C (zh) 量化装置、量化方法、高效率编码装置、高效率编码方法、解码装置和高效率解码装置
CN1694580A (zh) 测量装置及方法,以及记录介质
CN1071036A (zh) 可变速率声码器
CN1639984A (zh) 数字信号编码方法、解码方法、编码设备、解码设备、数字信号编码程序和解码程序
CN1969317A (zh) 基于多个参数化的多声道重构
CN1338104A (zh) 自适应块长编码系统的数据分帧
CN1659625A (zh) 在基于线性预测的语音编码解码器中有效帧删除隐藏的方法和器件
CN102714035A (zh) 用以利用平均值而基于下混信号表示形态和与下混信号表示形态相关联的参数侧边信息来提供用于提供上混信号表示形态的一或多个经调整参数的装置、方法与计算机程序
CN1463434A (zh) 数据记录/再现方法和装置及数据编辑方法和装置
CN1194737A (zh) 编码若干信息信号的编码装置
Smyth et al. DTS Coherent Acoustics Delivering High-Quality Multichannel Sound to the Consumer
CN1783726A (zh) 用于从音频数据码流中解码重建多声道音频信号的解码器

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1063682

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
C56 Change in the name or address of the patentee

Owner name: DTS CO.,LTD.

Free format text: FORMER NAME OR ADDRESS: DIGITAL THEATER SYSTEMS INC

ASS Succession or assignment of patent right

Owner name: DTS(BVI) CO., LTD.

Free format text: FORMER OWNER: DTS CO.,LTD.

Effective date: 20090403

C41 Transfer of patent application or patent right or utility model
TR01 Transfer of patent right

Effective date of registration: 20090403

Address after: The British Virgin Islands

Patentee after: DTS Inc.

Address before: American California

Patentee before: Dts Licensing Ltd.

REG Reference to a national code

Ref country code: HK

Ref legal event code: WD

Ref document number: 1063682

Country of ref document: HK

CX01 Expiry of patent term

Granted publication date: 20070307

EXPY Termination of patent right or utility model