CN101218631A - 处理音频信号的装置和方法 - Google Patents

处理音频信号的装置和方法 Download PDF

Info

Publication number
CN101218631A
CN101218631A CNA2006800251376A CN200680025137A CN101218631A CN 101218631 A CN101218631 A CN 101218631A CN A2006800251376 A CNA2006800251376 A CN A2006800251376A CN 200680025137 A CN200680025137 A CN 200680025137A CN 101218631 A CN101218631 A CN 101218631A
Authority
CN
China
Prior art keywords
random access
information
frame
access units
indication
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA2006800251376A
Other languages
English (en)
Inventor
T·利伯成
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
LG Electronics Inc
Original Assignee
LG Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from PCT/KR2005/002290 external-priority patent/WO2007011078A1/en
Priority claimed from PCT/KR2005/002292 external-priority patent/WO2007011080A1/en
Priority claimed from PCT/KR2005/002291 external-priority patent/WO2007011079A1/en
Priority claimed from PCT/KR2005/002308 external-priority patent/WO2007011085A1/en
Priority claimed from PCT/KR2005/002307 external-priority patent/WO2007011084A1/en
Priority claimed from PCT/KR2005/002306 external-priority patent/WO2007011083A1/en
Application filed by LG Electronics Inc filed Critical LG Electronics Inc
Publication of CN101218631A publication Critical patent/CN101218631A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/008Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/022Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/08Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
    • G10L19/12Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B27/00Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
    • G11B27/10Indexing; Addressing; Timing or synchronising; Measuring tape travel
    • G11B27/102Programmed access in sequence to addressed parts of tracks of operating record carriers
    • G11B27/105Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04SSTEREOPHONIC SYSTEMS 
    • H04S1/00Two-channel systems
    • H04S1/007Two-channel systems in which the audio signals are in digital form
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/005Correction of errors induced by the transmission channel, if related to the coding algorithm
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/032Quantisation or dequantisation of spectral components
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/18Vocoders using multiple modes
    • G10L19/24Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
    • GPHYSICS
    • G11INFORMATION STORAGE
    • G11BINFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
    • G11B20/00Signal processing not specific to the method of recording or reproducing; Circuits therefor
    • G11B20/10Digital recording or reproducing
    • G11B20/10527Audio or video recording; Data buffering arrangements
    • G11B2020/10537Audio or video recording
    • G11B2020/10546Audio or video recording specifically adapted for audio data

Abstract

在一个实施例中,随机存取单元信息被添加至含多个随机存取单元的音频信号。每个随机存取单元包括多个帧,并且这些帧中的至少一个为随机存取帧。每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧。随机存取单元信息指示按字节计各随机存取帧中的至少两个之间的距离。

Description

处理音频信号的装置和方法
技术领域
本发明涉及一种处理音频信号的方法,更具体地涉及一种编码和解码音频信号的方法和装置。
背景技术
过去曾经以不同方法实现了音频信号的存储和重放。例如,音乐和语音业已通过留声技术(例如唱盘播放机)、磁技术(例如卡式磁带)和数字技术(例如光盘)来记录和保存。随着音频存储技术的发展,需要克服许多难题来优化音频信号的质量和可存储性。
为了音乐信号的存档和宽带传输,无损重建在借助诸如MP3或AAC等在MPEG标准中定义的感性编码进行的压缩中正成为比高效率更为重要的特征。
虽然DVD音频和超级CD音频包括专利无损压缩方案,但是在内容持有者和广播公司当中需要一种开放式和综合性的压缩方案。响应于这种需要,一种新的无损编码方案已经成为MPEG-4音频标准的延伸。无损音频编码法由于原始信号的完美重建而实现了没有任何质量损失的数字音频数据压缩。
发明内容
本发明涉及处理音频信号的方法。
在一个实施例中,随机存取单元信息被添加至包含多个随机存取单元的音频信号中。每个随机存取单元包括若干帧并且其中至少一个帧是随机存取帧。每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧。随机存取单元信息指示按字节计这些随机存取帧中的至少两个之间的距离。
例如,随机存取单元信息可被添加至音频信号的配置信息,并且随机存取单元信息指示按字节计连续随机存取帧之间的距离。
在一个实施例中,随机存取单元信息被与至少一个随机存取帧相关联地添加至音频信号,并且该随机存取单元信息指示按字节计该相关联的随机存取帧和下一随机存取帧之间的距离。
在一个实施例中,该方法还包括将通用信息添加至配置信息。通用信息指示按帧计连续随机存取帧之间的距离。
另一实施例还包括将通用信息添加至配置信息,其中通用信息指示随机存取单元信息是否是与随机存取帧相关联地定位和位于配置信息中这两者之一。
在一个实施例中,随机存取单元信息可指示按字节计随机存取单元的大小。
在本发明的一个实施例中,接收具有多个随机存取单元的音频信号。每个随机存取单元包括多个帧并且其中至少一个帧是随机存取帧,每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧。随机存取单元信息自音频信号中被读取,并且该随机存取单元信息指示按字节计这些随机存取帧中的至少两个之间的距离。这些随机存取帧中的至少一个是基于随机存取单元信息来解码的。
在一个实施例中,随机存取单元信息自音频信号的配置信息中被读取,并且该随机存取单元信息指示按字节计连续随机存取帧之间的距离。
在另一实施例中,相关联的随机存取帧的随机存取单元信息自音频信号中与该相关联的随机存取帧相关联的位置被读取,并且该随机存取单元信息指示按字节计该相关联的随机存取帧与下一随机存取帧之间的距离。
在一个实施例中,通用信息自配置信息中被读取,其中通用信息指示按帧计连续随机存取帧之间的距离。这些随机存取帧中的至少一个基于随机存取单元信息和通用信息来被解码。
在又一实施例中,通用信息自配置信息中被读取,其中通用信息指示随机存取单元信息是否是与随机存取帧相关联地定位和位于配置信息中这两者之一。随机存取单元信息基于通用信息被读出。
本发明还涉及编码音频信号的方法和装置以及解码音频信号的方法和装置。
附图说明
包括于此以提供对本发明的进一步理解、并被结合在本申请中且构成其一部分的附图示出本发明的实施方式,其与说明书一起可用来解释本发明的原理。在附图中:
图1是根据本发明一个实施方式的编码器的示例图。
图2是根据本发明一个实施方式的解码器的示例图。
图3是根据本发明一个实施方式的压缩的M-声道文件的比特流结构的示例图。
图4是根据本发明一个实施方式的分级块切换方法的概念图的示例图。
图5是块切换示例及相应的块切换信息代码的示例图。
图6是根据本发明实施方式的多个声道的块切换方法的示例图。
具体实施方式
下面将详细参考本发明的优选实施方式,其具体示例图示于附图中。只要有可能,即在所有附图中使用相同的附图标记表示相同或相似的部件。
在对本发明进行叙述之前,应当指出的是本发明中揭示的大多数术语对应于本领域内公知的一般术语,但部分术语是由申请人根据需要选择的,并且将在本发明下文的描述中予以揭示。因此,由申请人定义的术语优选基于它们在本发明中的含义来理解。
在无损音频编码方法中,由于编码过程必须是完全可逆而不会有信息损失的,因此编码器和解码器两者的若干部件必须以确定性的方式来实现。
编解码器结构
图1是根据本发明一个的编码器1的示例图。
分割部件100将输入的音频数据分割成若干帧。在一帧内,每个声道还可进一步被细分成若干个音频采样块以做进一步处理。缓冲器110存储由分割部件100分割后的块和/或帧采样。
系数估算部件120针对每个块估算最优的一组系数值。系数的数目,即预测器的阶数也可以自适应地做出选择。系数估算部件120针对数字音频数据块计算一组部分自相关系数(parcor)值。部分自相关系数值指示预测器系数的部分自相关系数表示。量化部件130将该组部分自相关系数值量化。
第一熵编码部件140通过从部分自相关系数值减去一个偏移值来计算出部分自相关系数残差值,并使用由熵参数所定义的熵代码对部分自相关系数的残差值进行编码,其中偏移值和熵参数选自最优表。最优表是基于数字音频数据块的采样率从多个表中选择的。这多个表是分别对多个采样率范围预定义的以实现为传输而进行的数字音频数据的最优压缩。
系数转换部件150将量化了的部分自相关系数转换成线性预测编码(LPC)系数。预测器160使用线性预测编码系数从存储在缓冲器110中的之前的原始采样估算当前预测值。减法器170使用存储在缓冲器110中的数字音频数据的原始值和在预测器160中估算出的预测值计算数字音频数据块的预测残差。
第二熵编码部件180使用不同的熵代码编码预测残差并生成代码索引。所选择的代码索引作为辅助信息被发送。第二熵代码部件180使用具有不同复杂度的两种选择性编码技术之一编码预测残差。一种编码技术是公知的Golomb-Rice编码(在下文中简称为“Rice代码”)法而另一种是公知的分块Gilbert-Moore代码(在下文中简称为“BGMC”)法。Rice代码具有低复杂度但仍然是高效率的。BGMC算法编码方案以相比Rice代码复杂度稍高的代价提供更好的压缩。
最后,多路复用部件190将编码的预测残差、代码索引、编码的部分自相关系数残差值和其它附加信息多路复用以形成压缩的比特流。
编码器1还提供循环冗余校验(CRC)校验和,它主要被提供给解码器以校验解码的数据。在编码器方面,CRC用来保证压缩的数据能被无损地解码。
其它编码选项包括柔性块切换方案、随机存取和联合声道编码。编码器1可使用这些选项提供若干具有不同复杂度的压缩级别。联合声道编码利用立体声声道或多声道信号之间的相关性。这可通过在能够比原始信道之一更高效率地编码两个声道之间的差异的片段(segments)中编码这种差异来实现。这些编码选项将在参数根据本发明的示例性解码器的说明之后更为详细地予以说明。
图2是根据本发明的解码器2的示例图。更特别地,图2示出由于不必执行任何适应性调整因而复杂度显著低于编码器的无损音频信号解码器。
多路分解部件200接收音频信号并将数字音频数据块的编码的预测残差、代码索引、编码的部分自相关系数残差值和其它附加信息多路分解。第一熵解码部件210使用由熵参数定义的熵代码以解码部分自相关系数残差值并通过将偏移值加至解码的部分自相关系数残差值计算一组部分自相关系数值;其中偏移值和熵参数被选自一个表,该表是由解码器从基于数字音频数据块的采样速率的多个表中选择的。第二熵解码部件220使用代码系数对经多路分解后的编码的预测残差进行解码。系数转换部件230将熵解码的部分自相关系数值转换成LPC系数。预测器240使用LPC系数估算数字音频数据块的预测残差。加法器250将解码的预测残差与估算的预测残差相加以获得数字音频数据的原始块。组装部件260将解码的块数据组装为帧数据。
因此,解码器2将编码的预测残差和部分自相关系数残差解码,将部分自相关系数残差值转换成LPC系数,并运用逆预估滤波器以计算无损重构信号。解码器2的计算工作量取决于由编码器1选择的预测阶数。在多数情形下,实时解码即使在低端系统中也是可行的。
图3是根据本发明的包括多个声道的(例如M声道)压缩音频信号的比特流结构的示例图。
该比特流由包括多个声道(例如M声道)的至少一个音频帧构成。比特流配置语法(见下面的表6)中的“channels”字段指示声道数。使用根据本发明的块切换方案将每个声道分成多个块,这将在后面详细说明。每个再分块具有不同的大小并包括根据图1编码的编码数据。例如,一个再分块中的编码数据包含代码索引、预测阶数K、预测器系数和编码的残差值。如果使用声道对之间的联合编码法,则这两个声道的块分割是等同的,而且这些块以交织方式存储。比特流配置句法(表6)中的“js_stereo”字段指示联合立体声(声道差)是开启的还是关闭的,而frame_data句法(见下面的表7)中的“js_switch”字段指示是否选择联合立体声(声道差)。否则,每个声道的块分割是独立的。
下面将参照附图及其后的句法详细地说明前面提到的块切换、随机存取、预测和熵编码选项。
块切换
本发明的一个方面涉及在使用实际编码方案前将每个声道再分成多个块。下面,根据本发明的块分割(或再分)方法被称为“块切换方法”。
分级块切换
图4是根据本发明的分级块切换方法的概念图的示例图。例如,图4示出将一个声道按分级方式细分成32个块的方法。当在单个帧中提供多个声道时,每个声道被细分(或分割)成最多达32个块,并且每个声道的细分块配置成一个帧。因此,根据本发明的块切换方法由图1所示的分割部件100执行。此外,如上所述,预测和熵编码在细分的块单元上执行。
一般而言,传统的音频无损编码(ALS)包括相对简单的块切换机制。每一个N个采样的声道或者使用一个全长块(NB=N)进行编码,或者使用四个长度NB=N/4的块(例如1∶4切换)进行编码,其中同一块分割法适用于所有声道。在某些情形下,该方案会具有某些局限性。例如,尽管只有1∶1或1∶4切换是能用的,但其他切换法(例如1∶2、1∶8及其组合)在某些情形下却效率更高。另外在传统ALS中,对所有声道以等同的方式执行切换,虽然不同声道或许会从不同的切换法受益(如果声道并不相关时则尤为如此)。
因此,根据本发明实施方式的块切换方法提供相对灵活的块切换方案,其中一个帧的每个声道可按分级方式被细分成多个块。例如,图4示出能以分级方式细分成最多达32个块的声道。在根据所给出的实施方式的声道内,NB=N、N/2、N/4、N/8、N/16和N/32的块的任意组合是可能的,只要每个块是通过对双倍长度的上级块进行细分产生的即可。例如,如图4中的例子所示,分割成N/4+N/4+N/2是可能的,而分割成N/4+N/2+N/4是不行的(例如在下面描述的在图5(e)和图5中示出的块切换示例)。换言之,声道被分成这多个块从而使每个块的长度等于N/(mi)中的一个值,其中i=1,2,……p,N是声道的长度,m是大于或等于2的一个整数,而p表示在细分分级结构中的级数。
因此,在本发明的实施例中,比特流包括指示块切换等级的信息以及指示块切换结果的信息。这里,与块切换相关的信息被包含在用于解码处理的语法中,这将在下面进行描述。
例如,作出设定以使块切换处理后产生的最小块尺寸为NB=N/32。然而,这种设定仅为简化本发明说明的一个实例。因此,根据本发明的设定不局限于这一种设定。
更具体地说,当最小块大小为NB=N/32时,这表示块切换处理已按分级方式进行了5次,故将其称为5级块切换。或者,当最小块大小为NB=N/16时,这表示块切换处理已按分级方式执行了4次,故将其称为4级块切换。同样,当最小块大小为NB=N/8时,这表示块切换处理已按分级方式执行了3次,故将其称为3级块切换。而当最小块大小为NB=N/4时,这表示块切换处理已按分级方式执行了2次,故将其称为2级块切换。.当最小块大小为NB=N/2时,这表示块切换处理已按分级方式执行了1次,故将其称为1级块切换。最后,当最小块大小为NB=N时,这表示尚未执行块切换处理,故将其称为0级块切换。
在本发明的实施例中,指示块切换等级的信息被称为第一块切换信息。例如,第一块切换信息可由表6中的语法中的2比特字段“block_switching”表示,这将在后面的处理中予以说明。更具体地说,“block_switching=00”表示0级,“block_switching=01”表示1级至3级中的任何一个,“block_switching=10”表示4级,而“block_switching=11”表示5级。
另外,指示根据上述块切换等级对每个等级执行的块切换结果的信息在这些实施例中被称为第二块切换信息,这里,第二块切换信息可由“bs_info”字段表示,该字段在表7所示的语法中以8比特、16比特和32比特中的任何一个表示。更具体地说,如果“block_switching=01”(表示1级至3级的任何一个),则“bs_info”由8比特表示。如果“block_switching=10”(表示级4),则“bs_info”由16比特表示。换句话说,高达4级的块切换结果可用16比特表示。此外,如果“block_switching=11”(表示级5),则“bs_info”表示为32比特。换句话说,高达5级的块切换结果可用32比特指示。最后,如果“block_switching=00”(表示尚未进行块切换),则不发送“bs_info”。这表示一个声道构成一个块。
分配给第二块切换信息的总比特数是基于第一块切换信息的等级值而确定的。这可能会减小最终的比特率。在下面的表1中简述第一块切换信息和第二块切换信息之间的关系。
表1:块切换等级
最大等级数     最小NB “bs_info”的字节数
0(”block_swithing=00”)     N     0
1(”block_swithing=01”)     N/2     1(=8比特)
2(”block_swithing=01”)     N/4     1(=8比特)
3(”block_swithing=01”)     N/8     1(=8比特)
4(”block_swithing=10”)     N/16     2(=16比特)
5(”block_swithing=11”)     N/32     4(=32比特)
下面,将详细描述配置(或映射)第二块切换信息(bs_info)中每个比特的的方法的一个实施例。
bs_info字段根据上述实施方式可包括最多达4个字节。关于1级至5级的比特映射可以是[(0)1223333 44444444 55555555 555555555]。可保留第一比特以指示是独立块切换还是同步块切换,这将在后面的独立/同步块切换一节中更为详细地描述。图5(a)-5(f)示出可发生3级块切换的一个声道的不同块切换示例。因此,在这些示例中,最小块长度为NB=N/8,且bs_info由一个字节构成。从最大块长度NB=N开始,如果块被进一步细分,则bs_info的比特被置位。例如,在图5(a)中,根本不存在细分,因此“bs_info”为(0)000 0000。在图5(b)中,帧被细分((0)1……)而长度为N/2的第二块被进一步分((0)101……)成两个长度N/4的块;因此bs_info为(0)1010 0000。在图5(c)中,帧被细分((0)1…),且只有长度为N/2的第一块被进一步分((0)110…)成为两个长度为N/4的块;因此bs_info为(0)1100 0000。在图5(d)中,帧被细分((0)1……),长度为N/2的第一块和第二块被进一步分((0)111……)成长度为N/4的两个块,并且只有长度为N/4的第二块被进一步分((0)11101……)成长度为N/8的两个块;因此“bs_info”为(0)111 0100。
如上所述,图5(e)和5(f)中的示例表示不被允许的块切换的情形,这是因为图5(e)中的N/2块和图5(f)中的第一个N/4块不可能是通过细分前一级的块来获得的。
独立/同步块切换
图6(a)-6(c)是根据本发明实施例的块切换的示例图。
更具体地,图6(a)示出未对声道1、2和3执行块切换的示例。图6(b)示出的是其中两个声道(声道1和2)配置成一个声道对、且在声道1和声道2中同步地执行块切换的示例。在本例中还应用了交织处理。图6(c)示出的是其中两个声道(声道1和2)配置成一个声道对、且独立地对声道1和声道2执行块切换的示例。在本发明中,“声道对”指两个任意的音频声道。关于哪些声道组成声道对的决定可由编码器自动做出或由用户人工做出。(例如L和R声道、Ls和Rs声道)。
在独立块切换中,尽管在所有声道中每个声道的长度可以是相同的,但可对每个声道个别地执行块切换。即,如图6(c)所示,各声道可以不同方式分成块。如果一个声道对的两个声道彼此相关并且使用差分编码,则该声道对的两个声道可被同步地进行块切换。在同步块切换中,各声道以相同方式进行块切换(即分成块)。图6(b)示出这样的一个示例,并进一步示出这些块是可以被交织的。如果声道对的两个声道彼此不相关,则差分编码并无益处,因而不需要对声道同步地进行块切换。相反,独立地切换声道可能更合适。
此外,根据本发明的另一实施方式,所描述的独立或同步块切换方法可应用于声道数大于或等于3的多声道组。例如,如果该多声道组的所有声道彼此相关,则可以同步切换多声道组的所有声道。另一方面,如果多声道组的所有声道彼此不相关,则可以独立地切换多声道组的每个声道。
此外,“bs_info”字段被用作指示块切换结果的信息。另外,“bs_info”字段还被用作指示对配置成声道对的每个声道是独立地执行了块切换还是同步地执行了块切换的信息。在这种情况下,如上所述,可使用“bs_info”字段中的特定比特(例如第一比特)。例如,如果声道对的两个声道彼此独立,则“bs_info”字段的第一比特被置为“1”。另一方面,如果声道对的两个声道彼此同步,则“bs_info”字段的第一比特被置为“0”。
下面,将详细说明图6(a)、6(b)和6(c)。
参照图6(a),由于没有一个声道执行块切换,因此并不生成相关的“bs_info”。
参照图6(b),声道1和2配置成一个声道对,其中这两个声道彼此同步且同步执行了块切换。例如,在图6(b)中,声道1和声道2两者都被分割成长度为N/4的块,两者都具有相同的bs_info“bs_info=(0)101 0000”。因此,可针对每个声道对发送一个“bs_info”,这导致比特率下降。
此外,如果声道对是同步的,则声道对中的每个块会被要求彼此交织。这种交织是有益的(或有利的)。例如,一个声道对内的一个声道的块(例如图6(b)中的块1.2)对两个声道的之前的块(例如图6(b)中的块1.1和2.1)都有依赖关系,因此这些之前的块应当在当前块之前就已可用。
参照图6(c),声道1和2配置成一个声道对。然而,在本例中,块切换是独立执行的。更具体地,声道1被分割成大小(或长度)达N/4的块,并且bs_info是“bs_info=(1)101 0000”。声道2被分割成大小达N/2的块,并且bs_info是“bs_info=(1)100 0000”。在图6(c)所示例子中,在每个声道间独立地进行块切换,因此并不执行块之间的交织处理。换言之,对于独立地进行了块切换的声道,声道数据可单独编排。
联合声道编码
联合声道编码——也被称为联合立体声——可利用立体声信号的两个声道之间或多声道信号的任何两个声道之间的相关性。尽管独立地处理两个声道x1(n)和x2(n)更为直接,但利用声道之间相关性的简单方法是对差分信号进行编码:
d(n)=x2(n)-x1(n)
而不是对x1(n)或x2(n)进行编码。可通过对个体信号加以比较,根据哪两个信号能被最高效率地编码,在每个块中的x1(n)、x2(n)和d(n)之间进行切换。这种用切换的差分编码实现的预测在两个声道彼此非常相似的情形中是有利的。在多声道素材的情形中,可由编码器重新编排声道以指派合适的声道对。
除了简单的差分编码,无损音频编解码器还支持更为复杂的利用多声道信号的任意声道之间的声道间冗余的方案。
随机存取
本发明涉及音频无损编码并能够支持随机存取。随机存取意味着对编码的音频信号任意部分的快速存取而无需浪费地对之前的各部分进行解码。这对采用压缩数据的查找、编辑或流送的应用是一个重要特征。为了实现随机存取,在随机存取单元内,编码器需要插入一个能在无需解码之前各帧的情况下进行解码的帧。插入的帧被称为“随机存取帧”。在此类随机存取帧中,没有任何来自之前各帧的采样可供用于预测。
下面将详细描述根据本发明的用于实现随机存取的信息。参照配置句法(表6所示),与随机存取有关的信息作为配置信息发送。例如,“random_access”字段被用作指示是否允许随机存取的信息,它可用8比特表示。此外,如果允许随机存取,则该8比特“random_access”字段指定配置成一个随机存取单元的帧数。例如,当“random_access=0000 0000”时,不支持随机存取。换言之,当“random_access>0”时,则支持随机存取。更具体地,当“random_access=00000001”时,这指示配置成随机存取单元的帧数为1。这表示在所有的帧单元中均允许随机存取。此外,当“random_access=1111 1111”,这指示配置成随机存取单元的帧数为255。因此,“random_access”信息对应于当前随机存取单元内的随机存取帧与下一随机存取单元中的随机存取帧之间的距离。在本发明中,所述距离用帧数表达。
一个32比特的“ra_unit_size”字段被包含在比特流中并且被发送。在本发明中,“ra_unit_size”字段指示以字节计的随机存取单元的大小并因此指示以字节计从当前随机存取帧到下一随机存取帧的距离。“ra_unit_size”字段或者包含在配置句法(表6)中或者包含在帧数据句法(表7)中。配置句法(表6)还可包括指示“ra_unit_size”信息在比特流中的存储位置的信息。该信息被表示为2比特的“ra_flag”字段。更具体地,例如,当“ra_flag=00”时,这表示“ra_unit_size”信息未存储在比特流中。当“ra_flag=01”时,这表示“ra_unit_size”信息被存储在比特流内的帧数据句法(表7)中。
此外,当“ra_flag=10”时,“ra_unit_size”信息被存储在比特流的配置句法(表6)。如果“ra_unit_size”信息被包含在配置句法中,则这表示“ra_unit_size”信息只在比特流上发送一次并且被等同地应用于所有随机存取单元。或者,如果“ra_unit_size”信息包含帧数据句法中,则这表示当前随机存取单元内的随机存取帧和下一随机存取单元内的随机存取帧内之间的距离。因此,由于距离会改变,针对比特流中的每一个随机存取单元发送“ra_unit_size”信息。
因此,配置句法(表6)内的“random_access”字段也可被称为第一通用消息。另外,“ra_flag”字段也可被称为第二通用消息。在本发明的这个方面中,音频信号包括配置信息和多个随机存取单元,每个随机存取单元含有一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧,其中所述配置信息包括指示诸帧中的两相邻随机存取帧之间的距离的第一通用信息、以及指示每个随机存取单元的随机存取单元大小信息被存储在哪里的第二通用信息。随机存取单元大小信息指示以字节计两相邻随机存取帧之间的距离。
或者,在本发明的这个方面,一种解码音频信号的方法包括:接收具有配置信息和多个随机存取单元的音频信号,每个随机存取单元含有一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧;从配置信息读取第一通用信息,所述第一通用信息指示诸帧中两相邻随机存取帧之间的距离;以及从配置信息读取第二通用信息,所述第二通用信息指示每个随机存取单元的随机存取大小信息被存储在哪里,而随机存取单元大小信息指示以字节计两相邻随机存取帧之间的距离。解码器随后访问随机存取单元大小信息并使用该信息以及第一和第二通用信息来执行对音频信号中的音频数据的随机存取。
声道配置
如图3所示,音频信号包括根据本发明的多声道信息。例如,每个声道可按与音频扬声器的位置一一对应的关系来映射。配置句法(下面的表6)包括声道配置信息,它被表示为16比特的“chan_config_info”字段和16比特的“channels”字段。“chan_config_info”字段包括将声道映射到扬声器位置的信息,而16比特的“channels”字段包括指示声道总数的信息。例如,当“channels”字段等于“0”时,这表示声道对应于单声道。当“channels”字段等于“1”时,这表示这个声道对应于立体声声道中的一个。另外,当“channels”字段等于或大于“2”时,这表示这个声道对应于多声道中的一个。
下面的表2示出配置成“chan_config_info”字段的每个比特以及与之对应的各个声道的示例。更具体地,当所发送的比特流中存在相应声道时,“chan_config_info”字段内的相应比特被置为“1”。或者,当所发送的比特流中不存在相应声道时,“chan_config_info”字段内的相应比特被置为“0”。本发明还包括指示配置句法(表6)内是否存在“chan_config_info”的信息。该信息被表示为1比特的“chan_config”标志。更具体地,“chan_config=0”指示“chan_config_info”字段不存在。而“chan_config=1”指示“chan_config_info”字段存在。因此,当“chan_config=0”时,这表示“chan_config_info”字段不是在配置句法(表6)内新定义的。
表2:声道配置
扬声器位置 缩写 chan_config_info中比特位置
L  1
R  2
左后 Lr  3
右后 Rr  4
左侧 Ls  5
右侧 Rs  6
中置 C  7
中后置/环绕 S  8
低频效果 LFE  9
左混频 L0  10
右混频 R0  11
单声道混频 M  12
(保留)  13-16
帧长度
如图3所示,根据本发明的音频信号包括多个声道或多声道。因此,当执行编码时,关于配置成一帧的多声道的数目的信息以及关于每个声道的采样数的信息被插入到比特流中并被发送。参照配置句法(表6),32比特的“samples”字段被用作指示配置成每个声道的音频数据采样总数的信息。此外,16比特的“frame_length”(帧长度)字段被用作指示相应帧内每个声道的采样数的信息。
此外,“frame_length”字段的16比特值是由编码器所使用的值确定的,并且被称为用户定义值。换言之,用户定义值不是固定值,而是可在编码过程中任意确定的值。例如,该值可由编码过程的用户设定。
因此,在解码过程中,当通过图2所示的多路分解部件200接收到比特流时,应当首先获取每个声道的帧数。该值是根据下面所示的算法得到的。
frame=samples/frame_length;
rest=samples%frame_length;
if(rest)
  {
    frame++;
    frlen_last=rest;
}
    else
        frlen_last=frame_length;
更具体地,每个声道的帧总数是通过将经由比特流发送的“samples”字段确定的每个声道的采样总数除以由“frame_length”字段确定的每个声道的一个帧内的采样数来计算得到的。例如,当由“samples”字段确定的采样总数恰好是由“frame_length”字段确定的每个帧内的采样数的倍数时,则该倍数值成为帧总数。
然而,如果由“samples”字段确定的采样总数并非恰好是由“frame_length”字段确定的采样数的倍数,而是存在余数(或残差),则总帧数比倍数值增加“1”。此外,最末帧的采样数(frlen_last)被确定为该余数(或残差)。这表示仅最末帧的采样数与其之前的帧不同。
通过如上所述地在编码器和解码器之间定义一套标准化的规则,编码器就可自由地确定并发送每个声道的采样总数(“samples”字段)以及每个声道的一个帧内的采样数(“frame_length”字段)。此外,解码器可通过对所发送信息上使用上述算法而精确地确定要用于解码的每个声道的帧数。
线性预测
在本发明中,应用线性预测以实现无损音频编码。图1所示的预测器160包括至少一个或多个滤波器系数以从之前的采样值预测当前的采样值。随后,第二熵编码部件180对与预测值和原始值之差相对应的残差值执行熵编码。
另外,应用于预测器160的每个块的预测器系数值是作为最优值从系数估算部件120选择的。此外,预测器系数值由第一熵编码部件140进行熵编码处理。已由第一熵编码部件140和第二熵编码部件180编码的数据作为比特流的一部分由多路复用部件190插入且随后被发送。
下面将详细说明根据本发明的执行线性预测的方法。
用FIR滤波器的预测
线性预测在许多应用场合中被用于实现语音和音频信号处理。在下文中,基于有限冲激响应(FIR)滤波器描述预测器160的示例性操作。然而,本例明显不是对本发明范围的限制。
时间离散信号x(n)的当前采样可根据之前的采样x(n-k)大致地预测出。预测由以下方程式给出。
x ^ ( n ) = Σ k = 1 K h k * x ( n - k ) ,
其中K是预测器的阶数。如果预测的采样接近原始采样,则残差如下所示:
e ( n ) = x ( n ) - x ^ ( n )
它具有比x(n)本身更小的变化,因此能更有效地编码e(n)。
从输入采样的片段估算预测器系数然后再对该片段进行滤波处理的程序被称为前向自适应。在这种情况下,应当发送这些系数。另一方面,如果是从之前已处理的片段或采样(例如从残差)估算系数,则称为后向自适应。后向适应程序的优点在于不需要发送系数,因为估算系数所需的数据对于解码器也是可用的。
10阶左右的前向自适应预测方法被广泛地用于语音编码,并且可同样适用于无损音频编码。大多数前向自适应无损预测方案的最大阶数仍然相当小,例如K=32。一个例外是超级音频CD专用的1比特无损编解码器,它使用高达128的预测阶数。
另一方面,具有几百个系数的后向自适应FIR滤波器通用于许多领域,例如声道均衡和回波抵消。这些系统大多数是基于LMS算法或其变型的,这些算法也被推荐用于无损音频编码。  这类具有高阶数的基于LMS的编码方案是可行的,因为并非必须要将预测器系数作为辅助信息发送,因此它们的数目对数据速率不产生影响。然而,后向自适应的编解码器的缺点在于:必须在编码器和解码器两者中作出自适应,这使解码器明显比前向自适应情况下的解码器更为复杂。
向前适应预测
作为本发明的示例性实施方式,前向自适应预测将作为一个示例在本文的描述中给出。在前向自适应线性预测中,一般使用自相关方法或协方差方法由系数估算部件120估算每个块的最优预测器系数hk(在残差方差最小化的意义上)。使用传统的Levinson-Durbin算法的自相关方法的额外优点是提供了一种迭代式自适应调整预测器阶数的简单方法。此外,该算法本身也计算相应的部分自相关系数。
前向自适应预测的另一方面是确定合适的预测阶数。阶数增大使预测误差的方差减小,这导致残差的比特率Re变小。另一方面,预测器系数的比特率Rc随着要被发送的系数的数目而提高。因此,任务是找到使总比特率最小化的最优阶数。这可通过关于预测阶数K使下面的等式最小化来表达:
Rtotal(K)=Re(K)+Rc(K),
其中K是预测阶数。由于预测增益随阶数升高而单调上升,因此Re随着K值而下降。另一方面,由于要发送的系数的数目增加,因此Rc随K值单调上升。
搜索最优阶数可由系数估算部件120高效率地执行,所述系数估算部件120用递归方式确定阶数递增的所有预测器。对于每个阶数,计算完整的一组预测器系数。另外,可推导出相应残差的方差σe 2,从而得到残差的预期比特率的估算值。在每次迭代过程中——即针对每个预测阶数——在确定各系数的比特率的同时还可确定总比特率。最优阶数在总比特率不再减小的点找到。
尽管从上述方程式可以清楚知道系数比特率对总比特率有直接的影响,但是,Rc缓慢的增长也使得Rtotal的最小值移至较高的阶数(其中Re同样较小),这可产生更好的压缩。因此,预测器系数的高效率但仍准确的量化在实现最大压缩中发挥着重要作用。
预测阶数
在本发明中,确定了预测阶数K,预测阶数K决定用于进行线性预测的预测器系数的数目。预测阶数K也是由系数估算部件120予以确定。在本发明中,关于所确定的预测阶数的信息被包含在比特流中并随后被发送。
配置句法(表6)包括与预测阶数K有关的信息。例如,1比特至10比特的“max_order”字段对应于指示最大阶数值的信息。1比特至10比特的“max_order”字段的最大值是K=1023(例如10比特)。作为与预测阶数K有关的另一信息,配置句法(表6)包括1比特的“adapt_order”字段,它指示每个块是否存在最优阶数。例如,当“adapt_order=1”时,应当给每个块提供最优阶数。在block_data句法(表8)中,最优阶数作为1比特至10比特的“opt_order”字段提供。此外,当“adapt_order=0”时,则不对每个块提供单独的最优阶数。在这种情况下,“max_order”字段即成为应用于所有块的最终阶数。
最优阶数(opt_order)是基于max_order字段值和相应块的大小(NB)确定的。更具体地,例如当max_order被确定为Kmax=10并且“adap_order=1”时,则可考虑相应块的大小确定每个块的opt_order。在某些情况下,大于max_order(Kmax=10)的opt_order值是可能的。
特别地,本发明涉及较高的预测阶数。根据本发明的实施方式,在没有分级块切换的情形中,在长和短的块长度之间可能是4倍因数的关系(例如4096与1024或8192与2048)。另一方面,在采用了分级块切换的实施方式中,这个因数可以提高(例如高达32),以使范围更大(例如从16384下至512或甚至在高采样率下从32768至1024)。
在执行了分级块切换的实施方式中,为了更好地使用非常长的块,可采用更高的最大预测阶数。最大阶数可以是Kmax=1023。在这些实施方式中,Kmax可由块长度NB界定,例如Kmax<NB/8(例如当NB=2048时,Kmax=255)。因此,使用Kmax=1023需要至少NB=8192的块长度。在这些实施方式中,配置句法(表6)中的“max_order”字段可高达10比特而block_data句法(表8)中的“opt_order”字段同样可高达10比特。具体块中的实际比特数可取决于一个块所允许的最大阶数。如果块是短块,则本地预测阶数可小于全局预测阶数。在本发明中,本地预测阶数是通过考虑相应块长度NB确定的,而全局预测阶数是通过配置句法中的“max_order”Kmax确定的。例如,如果Kmax=1023,但NB=2048,则由于本地预测阶数为255,因此“opt_order”字段被确定为8比特(而不是10比特)。
更具体地说,可基于下面的等式确定opt_order:
opt_order=min(全局预测阶数,本地预测阶数);
另外,全局和本地预测阶数可通过下面的等式确定:
全局预测阶数=ceil(log2(最大预测阶数+1))
本地预测阶数=max(ceil(log2((Nb>>3)-1)),1)
在这些实施方式中,预测了来自一个声道的细分块的数据采样。使用之前块的最末K个采样预测当前块的第一采样。K值是基于从上述方程式推导出的opt_order确定的。
如果当前块是声道的第一个块,则不使用来自之前块的采样。在这种情形中,采用的是渐进阶数预测。例如,假设相应块的opt_order值为K=5,则该块中的第一采样不执行预测。该块的第二采样使用该块的第一采样执行预测(如同K=1),该块的第三采样使用该块的第一采样和第二采样执行预测(如同K=2)等。因此,从第六采样开始以及对于这之后的采样,根据K=5的opt_order执行预测。如上所述,预测阶数从K=1渐进地增加至K=5。
当在随机存取帧中使用时,上述渐进阶数型预测是非常有利的。由于随机存取帧对应于随机存取单元的基准帧,因此随机存取帧不是通过使用之前的帧采样执行预测。即,这种渐进预测技术在随机存取帧的开头处就可应用。
预测器系数的量化
上述预测器系数在图1的量化部件130中量化。由于即便很小的量化误差也会导致大大偏离最优预测滤波器所需的频谱特性,因此预测系数hk的直接量化对发送而言不是非常高效率的。为此,预测器系数的量化是基于可由系数估算部件120计算得到的部分自相关(反射)系数rk。例如,如上所述,系数估算部件120是使用传统Levinson-Durbin算法处理的。
头两个部分自相关系数(相应地为γ1和γ2)通过使用下面的函数被量化:
Figure S2006800251376D00171
Figure S2006800251376D00172
而其余系数是使用简单的7比特的均匀量化器量化的:
αk=_64γk」;     (k>2).
在所有情况下,所得量化值αk被约束在范围[-64,63]内。
熵编码
如图1所示,在本发明中应用了两种类型的熵编码。更具体地,第一熵编码部件140被用于编码上述预测器系数。另外,第二熵编码部件180被用来编码上述音频原始采样和音频残差采样。在下文中将详细说明这两种类型的熵编码。
预测器系数的第一熵编码
相关技术的Rice代码被用作根据本发明的第一熵编码方法。例如,量化系数ak的发送是通过生成残差值执行的:
δk=ak-offsetk
这些残差值进而是通过使用第一熵编码部件140——例如用Rice代码方法来编码的。该过程中使用的Rice代码的相应偏移和参数可从以下表3、4和5所示的诸组中的一个以全局方式进行选择。表索引(即2比特的“coef_table”)在配置句法(表6)中指出。如果“coef_table=11”,则这表示未应用熵编码,并且量化的系数各自以7比特发送。在这种情形中,偏移始终是-64以获得被约束于[0,127]的无符号值δk=ak+64。相反,如果“coeff_table=00”,则选择下面的表3,而如果“coeff_table=01”,则选择下面的表4。最后,如果“coeff_table=10”,则选择表5。
当在图2的解码器中接收到这些经量化的系数时,第一熵解码部件220通过使用将残差值δk与偏移结合以生成部分自相关系数ak的量化索引的过程来重建预测器系数:ak=δk+offsetk
其后,通过使用下面的方程式执行头两个系数(γ1和γ2)的重建:
Figure S2006800251376D00181
Figure S2006800251376D00182
其中2Q表示重构的系数的整数表示所需的恒量(Q=20)比例因数,而Γ(.)是根据经验确定的映射表(未示出,因为映射表会根据实现而变化)。
因此,是根据采样频率提供用于进行第一熵编码的这三种类型的系数表。例如,采样频率可被分成48kHz、96kHz和192kHz。这里,三个表3、4、5中的每一个分别提供给每种采样频率。
可对整个文件选择三个不同的表中的一个,而不是使用单个表。一般应当根据采样率来选择表。对于44.1kHz的素材,本发明的申请人推荐使用48kHz表。然而,一般而言,也可按其它准则来选择表。
表3:用于编码量化系数(48kHz)的Rice码参数
系数# 偏移 Rice参数
  1   -52   4
  2   -29   5
  3   -31   4
  4   19   4
  5   -16   4
  6   12   3
  7   -7   3
  8   9   3
  9   -5   3
  10   6   3
  11   -4   3
  12   3   3
  13   -3   2
  14   3   2
  15   -2   2
  16   3   2
  17   -1   2
  18   2   2
  19   -1   2
  20   2   2
  2k-1,k>10   0   2
  2k,k>10   1   2
表4:用于编码量化系数(96kHz)的Rice码参数
系数# 偏移 Rice参数
 1 -58  3
 2 -42  4
 3 -46  4
 4 37  5
 5 -36  4
 6  29  4
 7  -29  4
 8  25  4
 9  -23  4
 10  20  4
 11  -17  4
 12  16  4
 13  -12  4
 14  12  3
 15  -10  4
 16  7  3
 17  -4  4
 18  3  3
 19  -1  3
 20  1  3
 2k-1,k>10  0  2
 2k,k>10  1  2
表5:用于编码量化系数(192kHz)的Rice码参数
系数# 偏移 Rice参数
 1  -59  3
 2  -45  5
 3  -50  4
 4  38  4
 5  -39  4
 6  32  4
 7  -30  4
 8  25  3
 9  -23  3
 10  20  3
 11  -20  3
 12  16  3
 13  -13  3
 14  10  3
 15  -7  3
 16  3  3
 17  0  3
 18  -1  3
 19  2  3
 20  -1  2
 2k-1,k>10  0  2
 2k,k>10  1  2
残差的第二熵编码
本发明包含应用于图1的第二熵编码部件180的编码方法的两种不同的模式,这将在下面予以详细说明。
在简单模式中,使用Rice代码对残差值e(n)进行熵编码。对于每个块,或者可使用同一Rice代码编码所有的值,或者可将块进一步分成四个部分,每个部分用一不同的Rice代码编码。如图1所示,发送所应用的代码的索引。由于存在不同的方法确定给定的一组数据的最优Rice代码,因此由编码器根据残差的统计结果选择合适的代码。
或者,编码器可利用BGMC模式使用更为复杂和高效率的编码方案。在BGMC模式中,残差的编码是通过将分布划分成两个类别实现的。这两种类型包括属于分布的中心区域|e(n)|<emax的残差,以及属于其尾部的残差。尾部的余数仅仅是被重新居中(re-centered)  (即对于e(n)>emax,提供et(n)=e(n)-emax)并使用如上所述的Rice代码编码。然而,为了编码处于分布中心的残差,BGMC首先将残差分成LSB和MSB分量,随后BGMC使用块Gilbert_Moore(算术)代码编码MSB。最后,BGMC使用直接固定长度代码发送LSB。可以对参数emax和直接发送的LSB的数目加以选择,使它们仅些微地影响这种方案的编码效率,同时使编码的复杂度明显降低。
根据本发明的配置句法(表6)和block_data句法(表8)包括与Rice代码和BGMC代码的编码有关的信息。现在对这种信息进行详细说明。
配置句法(表6)首先包括一个1比特的“bgmc_mode”字段。例如,“bgmc_mode”=0表示Rice代码,“bgmc_mode”=1表示BGMC代码。配置句法(表6)还包括一个1比特的“sb_part”字段。“sb_part”字段对应于与将块分割成子块并对经分割的子块进行编码的方法有关的信息。这里,“sb_part”的意义根据“bgmc_mode”字段的值而改变。
例如,当“bgmc_mode=0”时,即当应用Rice代码时,“sb_part=0”表示该块并不被分割成子块。或者,“sb_part=1”表示以1∶4子块分割比分割该块。或者,当“bgmc_mode=1”时,即当采用BGMC代码时,“sb_part=0”表示以1∶4子块分割比分割该块。或者,“sb_part=1”表示以1∶2∶4∶8子块分割比分割该块。
与包含在配置句法(表6)中的信息相对应的每个块的block_data句法(表8)包括0比特至2比特的可变“ec_sub”字段。更具体地,“ec_sub”字段指示存在于实际相应块中的子块的数目。这里,“ec_sub”字段的意义根据配置句法(表6)内的“bgmc_mode”字段+“sb_part”字段的值而变化。
例如,“bgmc_mode+sb_part=0”表示Rice代码并不配置该子块。这里,“ec_sub”字段是个0比特字段,这表示不包含任何信息。
除此之外,“bgmc_mode+sb_part=1”表示使用了Rice代码或BGMC代码来以1∶4的比率将该块分割成若干子块。这里,只有1比特被指派给“ec_sub”字段。例如,“ec_sub=0”指示一个子块(即该块没有分割成多个子块),而“ec_sub=1”指示配置了4个子块。
此外,“bgmc_mode+sb_part=2”表示使用了BGMC代码来以1∶2∶4∶8的比率将该块分割成若干子块。这里,2比特被指派给“ec_sub”字段。例如,“ec_sub=00”指示一个子块(即该块没有分割成多个子块),而“ec_sub=01”指示2个子块。另外,“ec_sub=10”指示4个子块,而“ec_sub=11”指示8个子块。
如上所述定义在每个块内的子块使用差分编码方法由第二熵编码部件180进行编码。下面描述使用Rice代码的一个示例。对于残差值的每个块,或者可使用同一Rice代码编码所有值,或者如果在配置句法中“sb_part”字段被设置,则该块可被分割成四个子块,每个编码的子块具有一不同的Rice代码。在后一种情况下,块数据句法(表8)中的“ec_sub”字段指示是使用一个块还是四个块。
尽管第一子块的参数s[i=0]或者用4比特(分辨率≤16比特)或者用5比特(分辨率>16比特)直接发送,但仅发送下列参数s[i>0]的差分(s[i]-s[i-1])。这些差分还使用适当选择的Rice代码再行编码。在这种情况下,差分使用的Rice代码参数具有值“0”。
语法
根据本发明的实施方式,包含在音频位流中的各种信息的句法示出于下表中。表6示出音频无损编码的配置句法。这种配置句法可形成周期性地置于比特流中的头部,可形成每个帧的帧头等。表7示出一种帧-数据句法,而表8示出一种块-数据句法。
表6:配置语法
  句法  比特
  ALSSpecificConfig(){samp_freq;samples;channels;file_type;resolution;floating;msb_first;frame_length;random_access;ra_flag;adapt_order;coef_table;long_term_prediction;max_order;block_switching;bgmc_mode;sb_part;joint_stereo;mc_coding;chan_config;chan_sort;crc_enabled;RLSLMS(reserved)if(chan_config)  {chan_config_info;}if(chan_sort)  {for(c=0;c<channels;c++)chan_pos[c];}header_size;trailer_size ;orig_header[];orig_trailer[];if(crc_enabled)  {crc;}if((ra_flag==2) && (random_access>0))  {for(f=0;f<(samples-1/frame_length)+1;f++)  { 323216331116821211021111111161681616header_size*8trailer_size*832
        ra_unit_size}}}   32
表7:Frame_data语法
  句法   比特
    frame_data(){if((ra_flag==1) && (frame_id%random_access==0)){ra_unit_size}if(mc_ coding&&joint_stereo)  {js_switch;byte_align;}if(mc_coding||js_switch){for(c=0;c<channels;c++)  {if(block_switching){bs_info ;}if(independent_bs)  {for(b=0;b<blocks;b++)  {block_data(c);}}else{for(b=0;b<blocks;b++)  {block_data(c);block_data(c+1);}c++;}}else{if(block_switching)  {bs_info;}for(b=0;b<blocks;b++)  {for(c=0;c<channels;c++)  {block_data(c);channel_data(c);}} 3218,16,328,16,32
    }if(floating){num_bytes_diff_float;diff_float_data();}} 32
表8:Block_data语法
句法 比特
    block_data(){block_type;if(block_type==0){const_block;js_block;(reserved)if(const_block==1){{if(resolution==8){const_val;}else if(resolution==16){const_val;}else if(resolution==24)  {const_val;}else{const_val;}}}else {js_block;if((bgmc_mode==0) && (sb_part==0)  {sub_blocks=1;}else if((bgmc_mode==1) && (sb_part==1){ec_sub;sub_blocks=1<<ec_sub;}else{ec_sub;sub_blocks=(ec_sub==1)?4∶1;} 11158162432121
    if(bgmc_mode==0){for(k=0;k<sub_block;k++){s[k];}}else{for(k=0;k<sub_blocks;k++){s[k],sx[k];}}sb_length=block_length/sub_blocks;shift_lsbs;if(shift_lsbs==1){shift_pos;}if(!RLSLMS){if(adapt_order==1){opt_order;}for(p=0;p<opt_order;p++){quant_cof[p];}} variesvaries141...10varies
压缩结果
下面,将无损音频编解码器与两种最流行的无损音频压缩程序——即开放式源代码编解码器FLAC和Monkey氏音频(MAC 3.97)作比较。这里,开放式源代码编解码器FLAC使用前向自适应预测,而Monkey氏音频(MAC 3.97)是作为压缩方面的当前技术发展水平的算法使用的后向自适应编解码器。这两种编解码器均在有提供最大压缩的选项(即flac-8和mac-c4000)的情况下运行。编码器的结果是针对中等压缩等级(其预测阶数限制于K_60)以及最大压缩等级(K_1023)来确定的,两者均具有500ms的随机存取。测试是在有1024MB内存的1.7GHz奔腾-M系统上进行的。测试包括采样率为48、96和192kHz、分辨率为16和24比特的将近1GB的立体声波形数据。
压缩率
下面,压缩率被定义为:
C=[(压缩的文件大小)/(原始文件大小)]*100%
其中越小的值指示越好的压缩。所检查的音频格式的结果示于表9(FLAC编解码器不支持192kHz的素材)。
表9:不同音频格式的平均压缩率比较(kHz/比特)
    格式     FLAC     MAC     ALS中值 ALS最大值
    48/16     48.6     45.3     45.5     44.7
    48/24     68.4     63.2     63.3     62.7
    96/24     56.7     48.1     46.5     46.2
    192/24     -     39.1     37.7     37.6
    累计     -     48.9     48.3     47.8
这些结果显示,最高等级的ALS在所有格式上性能都胜过FLAC和Monkey氏音频,但对于高清晰度素材(即,96kHz/24比特及以上)尤甚。即使在中间等级,ALS也提供最好的总压缩性。
复杂度
不同编解码器的复杂度强烈地取决于实际实现,尤其是编码器的实现。如上所述,本发明的音频信号编码器仍在发展之中。因此,我们将我们的分析限于解码器——简单的C语言代码实现而不作进一步的优化。压缩的数据由当前最佳的编码器实现生成。图10中示出了对在不同复杂度等级上编码的各种音频格式进行实时解码所用的平均CPU负荷。即使是对于最大复杂度,解码器的CPU负荷也只在20-25%左右,这进而表示基于文件的解码比实时解码快至少4-5倍。
表10:根据音频格式(kHz/比特)和ALS编码器复杂度的平均CPU负载(在1.7GHz奔腾-M上的百分比)
格式 ALS低 ALS平均 ALS最大
 48/16  1.6  4.9  18.7
 48/24  1.8  5.8  19.6
 96/24  3.6  12.0  23.8
 192/24  6.7  22.8  26.7
编解码器被设计成可提供大范围的复杂度等级。尽管最大等级以最慢编码和解码速度为代价实现最高压缩,但较快的中间等级仅些微地降低压缩性,解码的复杂度却显著地低于最大等级(即对于48kHz速材将近5%的CPU负荷)。使用低复杂度等级(即K_15,Rice编码)相比中间等级仅使压缩性降低1-1.5%,但解码器复杂度进一步降低3倍(即对于48kHz的素材而言低于2%的CPU负荷)。因而,音频数据甚至可以在计算能力很低的硬件上完成解码。
尽管编码器复杂度既会因较高的最大阶数也会因更复杂的块切换算法而增加(根据实施方式)而增大,但解码器会受到较高平均预测阶数的影响。
前面的实施方式(例如分级块切换)和优点仅为示例性的,不应被解释为是对所附权利要求书的限制。本领域技术人员会明白,上述原理可应用于其它装置和方法。许多选择、修改和变化对本领域内技术人员而言是显而易见的。
工业应用
本领域内技术人员可以理解,可对本发明作出各种修改和变化而不脱离本发明的精神或范围。例如,本发明的诸方面和实施方式很容易在如有损音频信号编解码器等的另一种音频信号编解码器中采用。因此,本发明旨在涵盖本发明的所有这些修改和变化。

Claims (34)

1.一种处理音频信号的方法,所述方法包括:
将随机存取单元信息添加至包含多个随机存取单元的音频信号中,每个随机存取单元包括若干个帧且其中至少一个帧是随机存取帧,每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧,并且所述随机存取单元信息指示按字节计所述各随机存取帧中的至少两个之间的距离。
2.如权利要求1所述的方法,其特征在于,所述添加步骤将所述随机存取单元信息添加至所述音频信号的配置信息中,并且所述随机存取单元信息指示按字节计连续随机存取帧之间的距离。
3.如权利要求2所述的方法,其特征在于,所述随机存取单元信息指示按字节计所述随机存取单元之间的大小。
4.如权利要求2所述的方法,其特征在于,还包括:
将第一通用消息添加至所述配置信息中,所述第一通用信息指示按帧计连续随机存取帧之间的距离。
5.如权利要求4所述的方法,其特征在于,还包括:
将第二通用信息添加至所述配置信息中,所述第二通用信息指示所述随机存取单元信息位于所述配置信息中。
6.如权利要求2所述的方法,其特征在于,还包括:
将位置信息添加至所述配置信息中,所述位置信息指示所述随机存取单元信息位于所述配置信息中。
7.如权利要求1所述的方法,其特征在于,所述添加步骤将所述随机存取单元信息与至少一个随机存取帧相关联地添加至所述音频信号中,并且所述随机存取单元大小信息表示按字节计所述相关联的随机存取帧与下一随机存取帧之间的距离。
8.如权利要求7所述的方法,其特征在于,所述随机存取单元信息表示按字节计包含所述相关联的随机存取帧的随机存取单元的大小。
9.如权利要求7所述的方法,其特征在于,还包括:
将第一通用信息添加至所述配置信息中,所述第一通用信息指示按帧计连续随机存取帧之间的距离。
10.如权利要求9所述的方法,其特征在于,还包括:
将第二通用信息添加至所述配置信息中,所述第二通用信息指示所述随机存取单元信息与所述随机存取帧相关联地定位。
11.如权利要求7所述的方法,其特征在于,还包括:
将位置信息添加至所述配置信息中,所述位置信息指示所述随机存取单元信息与所述随机存取帧相关联地定位。
12.如权利要求11所述的方法,其特征在于,所述位置信息指示所述随机存取单元信息位于所述相关联的随机存取帧的前面。
13.如权利要求1所述的方法,其特征在于,所述随机存取单元信息表示按字节计一个随机存取单元的大小。
14.如权利要求1所述的方法,其特征在于,还包括:
将第一通用信息添加至所述配置信息中,所述第一通用信息指示按帧计连续随机存取帧之间的距离。
15.如权利要求14所述的方法,其特征在于,还包括:
将第二通用信息添加至所述配置信息中,所述第二通用信息指示所述随机存取单元信息是否是与所述随机存取帧相关联地定位和位于所述配置信息中这两者之一。
16.如权利要求11所述的方法,其特征在于,还包括:
将位置信息添加至所述配置信息中,所述位置信息指示所述随机存取单元信息是否是与所述随机存取帧相关联地定位和位于所述配置信息中这两者之一。
17.一种处理音频信号的方法,所述方法包括:
接收具有多个随机存取单元的音频信号,每个随机存取单元包括多个帧且其中至少一个帧是随机存取帧,每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧;
从所述音频信号读取随机存取单元信息,所述随机存取单元信息指示按字节计所述各随机存取帧中的至少两个之间的距离;以及
基于所述随机存取单元信息解码所述各随机存取帧中的至少一个。
18.如权利要求17所述的方法,其特征在于,所述读取步骤从所述音频信号的配置信息中读取所述随机存取单元信息,并且所述随机存取单元信息指示按字节计连续随机存取帧之间的距离。
19.如权利要求18所述的方法,其特征在于,所述随机存取单元信息指示按字节计所述随机存取单元的大小。
20.如权利要求18所述的方法,其特征在于,还包括:
从所述配置信息中读取第一通用信息,所述第一通用信息指示按帧计连续随机存取帧之间的距离;
所述解码步骤基于所述随机存取单元信息和所述第一通用信息解码所述各随机存取帧中的至少一个。
21.如权利要求20所述的方法,其特征在于,还包括:
从所述配置信息中读取第二通用信息,所述第二通用信息指示所述随机存取单元信息位于所述配置信息中,并且其中
所述读取随机存取单元的信息步骤基于所述第二通用信息来读取所述随机存取单元信息。
22.如权利要求18所述的方法,其特征在于,还包括:
从所述配置信息中读取位置信息,所述位置信息指示所述随机存取单元信息位于所述配置信息中;并且其中
所述读取随机存取单元信息的步骤基于所述位置信息来读取所述随机存取单元信息。
23.如权利要求17所述的方法,其特征在于,所述读取步骤从所述音频信号中与一相关联的随机存取帧相关联的位置读取关于该相关联的随机存取帧的随机存取单元信息,并且所述随机存取单元信息指示按字节计所述相关联的随机存取帧与下一随机存取帧之间的距离。
24.如权利要求23所述的方法,其特征在于,所述随机存取单元信息指示按字节计包含所述相关联的随机存取帧的随机存取单元的大小。
25.如权利要求23所述的方法,其特征在于,还包括:
从所述配置信息中读取第一通用信息,所述第一通用信息指示按帧计连续随机存取帧之间的距离;并且其中
所述解码步骤基于所述随机存取单元信息和所述第一通用信息来解码至少一个随机存取帧。
26.如权利要求25所述的方法,其特征在于,还包括:
从所述配置信息中读取第二通用信息,所述第二通用信息指示所述随机存取单元信息与所述随机存取帧相关联地定位;并且其中
所述读取随机存取单元信息的步骤基于所述第二通用信息来读取所述随机存取单元信息。
27.如权利要求23所述的方法,其特征在于,还包括:
从所述配置信息读取位置信息,所述位置信息指示所述随机存取单元信息与所述随机存取帧相关联地定位;并且
所述读取随机存取单元信息的步骤基于所述位置信息来读取所述随机存取单元信息。
28.如权利要求27所述的方法,其特征在于,所述位置信息指示所述随机存取单元信息位于所述相关联的随机存取帧的前面。
29.如权利要求17所述的方法,其特征在于,所述随机存取单元信息指示按字节计一个随机存取帧的大小。
30.如权利要求17所述的方法,其特征在于,还包括:
从所述配置信息中读取第一通用信息,所述第一通用信息指示按帧计连续随机存取帧之间的距离;并且
所述解码步骤基于所述随机存取单元信息和所述第一通用信息来解码所述随机存取帧中的至少一个。
31.如权利要求30所述的方法,其特征在于,还包括:
从所述配置信息中读取第二通用信息;所述第二通用信息指示所述随机存取单元信息是否是与所述随机存取帧相关联地定位和位于所述配置信息中这两者之一;并且其中
所述读取随机存取单元信息的步骤基于所述第二通用信息来读取所述随机存取单元信息。
32.如权利要求17所述的方法,其特征在于,还包括:
从所述配置信息中读取位置信息,所述位置信息指示所述随机存取单元信息是否是与所述随机存取帧相关联地定位和位于所述配置信息中这两者之一;并且其中
所述读取随机存取单元信息的步骤基于所述位置信息来读取所述随机存取单元信息。
33.一种用于处理音频信号的装置,包括:
编码器,所述编码器被配置成将随机存取单元信息添加至含多个随机存取单元的音频信号中,每个随机存取单元包括多个帧且其中至少一个帧是随机存取帧,每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧,并且所述随机存取单元信息表示按字节计所述各随机存取帧中的至少两个之间的距离。
34.一种用于处理音频信号的装置,包括:
解码器,所述解码器被配置成接收具有多个随机存取单元的音频信号,每个随机存取单元包括多个帧且其中至少一个帧是随机存取帧,每个随机存取帧是以使得解码该随机存取帧不需要用到之前的帧的方式编码的帧;
所述解码器被配置成从所述音频信号中读取随机存取单元信息,所述随机存取单元信息指示按字节计所述各随机存取帧中的至少两个之间的距离;并且
所述解码器被配置成基于所述随机存取单元信息来解码所述各随机存取帧中的至少一个。
CNA2006800251376A 2005-07-11 2006-07-10 处理音频信号的装置和方法 Pending CN101218631A (zh)

Applications Claiming Priority (17)

Application Number Priority Date Filing Date Title
US69755105P 2005-07-11 2005-07-11
US60/697,551 2005-07-11
PCT/KR2005/002290 WO2007011078A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002292 WO2007011080A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
PCT/KR2005/002291 WO2007011079A1 (en) 2005-07-16 2005-07-16 Apparatus and method of encoding and decoding audio signal
KRPCT/KR2005/002292 2005-07-16
KRPCT/KR2005/002291 2005-07-16
KRPCT/KR2005/002290 2005-07-16
KRPCT/KR2005/002308 2005-07-18
PCT/KR2005/002308 WO2007011085A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
KRPCT/KR2005/002307 2005-07-18
PCT/KR2005/002307 WO2007011084A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
KRPCT/KR2005/002306 2005-07-18
PCT/KR2005/002306 WO2007011083A1 (en) 2005-07-18 2005-07-18 Apparatus and method of encoding and decoding audio signal
US70057005P 2005-07-19 2005-07-19
US60/700,570 2005-07-19
PCT/KR2006/002687 WO2007008009A1 (en) 2005-07-11 2006-07-10 Apparatus and method of processing an audio signal

Publications (1)

Publication Number Publication Date
CN101218631A true CN101218631A (zh) 2008-07-09

Family

ID=37637332

Family Applications (14)

Application Number Title Priority Date Filing Date
CNA200680028892XA Pending CN101238509A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800252699A Expired - Fee Related CN101218630B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305412A Pending CN101243497A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800305111A Pending CN101243494A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CN2006800294070A Expired - Fee Related CN101243496B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800304693A Pending CN101243492A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800305499A Pending CN101243495A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800251376A Pending CN101218631A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA200680024866XA Pending CN101218852A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800294174A Pending CN101243489A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800289829A Pending CN101238510A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251395A Pending CN101218629A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800251380A Expired - Fee Related CN101218628B (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304797A Pending CN101243493A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法

Family Applications Before (7)

Application Number Title Priority Date Filing Date
CNA200680028892XA Pending CN101238509A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800252699A Expired - Fee Related CN101218630B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800305412A Pending CN101243497A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800305111A Pending CN101243494A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CN2006800294070A Expired - Fee Related CN101243496B (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800304693A Pending CN101243492A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800305499A Pending CN101243495A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法

Family Applications After (6)

Application Number Title Priority Date Filing Date
CNA200680024866XA Pending CN101218852A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800294174A Pending CN101243489A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800289829A Pending CN101238510A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CNA2006800251395A Pending CN101218629A (zh) 2005-07-11 2006-07-10 处理音频信号的装置和方法
CN2006800251380A Expired - Fee Related CN101218628B (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法
CNA2006800304797A Pending CN101243493A (zh) 2005-07-11 2006-07-10 编码和解码音频信号的装置和方法

Country Status (5)

Country Link
US (36) US8032240B2 (zh)
EP (14) EP1913585A4 (zh)
JP (14) JP2009500681A (zh)
CN (14) CN101238509A (zh)
WO (14) WO2007008008A2 (zh)

Families Citing this family (74)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7182738B2 (en) 2003-04-23 2007-02-27 Marctec, Llc Patient monitoring apparatus and method for orthosis and other devices
WO2005083684A1 (en) * 2004-02-19 2005-09-09 Koninklijke Philips Electronics N.V. Decoding scheme for variable block length signals
US7930184B2 (en) 2004-08-04 2011-04-19 Dts, Inc. Multi-channel audio coding/decoding of random access points and transients
US8433581B2 (en) * 2005-04-28 2013-04-30 Panasonic Corporation Audio encoding device and audio encoding method
CN101185123B (zh) * 2005-05-31 2011-07-13 松下电器产业株式会社 可扩展编码装置及可扩展编码方法
US8032240B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
WO2007049881A1 (en) * 2005-10-26 2007-05-03 Lg Electronics Inc. Method for encoding and decoding multi-channel audio signal and apparatus thereof
JP4193865B2 (ja) * 2006-04-27 2008-12-10 ソニー株式会社 デジタル信号切換え装置及びその切換え方法
JP4769665B2 (ja) * 2006-08-29 2011-09-07 パナソニック株式会社 音楽再生装置および音楽再生端末
US9053753B2 (en) * 2006-11-09 2015-06-09 Broadcom Corporation Method and system for a flexible multiplexer and mixer
US20080114478A1 (en) * 2006-11-09 2008-05-15 David Wu Method and System for Multi-Channel PCM Audio Grouping in Hardware
US8521540B2 (en) * 2007-08-17 2013-08-27 Qualcomm Incorporated Encoding and/or decoding digital signals using a permutation value
KR101385956B1 (ko) * 2007-08-31 2014-04-17 삼성전자주식회사 미디어 신호 인코딩/디코딩 방법 및 장치
WO2009072685A1 (en) * 2007-12-06 2009-06-11 Lg Electronics Inc. A method and an apparatus for processing an audio signal
US8972247B2 (en) * 2007-12-26 2015-03-03 Marvell World Trade Ltd. Selection of speech encoding scheme in wireless communication terminals
ES2739667T3 (es) * 2008-03-10 2020-02-03 Fraunhofer Ges Forschung Dispositivo y método para manipular una señal de audio que tiene un evento transitorio
US20090268678A1 (en) * 2008-04-24 2009-10-29 Fujitsu Limited Method and apparatus for automatic gain control in a mobile orthogonal frequency division multiple access (ofdma) network
EP2144231A1 (en) * 2008-07-11 2010-01-13 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Low bitrate audio encoding/decoding scheme with common preprocessing
JP5253518B2 (ja) * 2008-12-22 2013-07-31 日本電信電話株式会社 符号化方法、復号方法、それらの装置、プログラム及び記録媒体
US8576910B2 (en) * 2009-01-23 2013-11-05 Nippon Telegraph And Telephone Corporation Parameter selection method, parameter selection apparatus, program, and recording medium
KR101622950B1 (ko) * 2009-01-28 2016-05-23 삼성전자주식회사 오디오 신호의 부호화 및 복호화 방법 및 그 장치
AR075199A1 (es) * 2009-01-28 2011-03-16 Fraunhofer Ges Forschung Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora
CN101609680B (zh) * 2009-06-01 2012-01-04 华为技术有限公司 压缩编码和解码的方法、编码器和解码器以及编码装置
JP5355690B2 (ja) * 2009-06-01 2013-11-27 三菱電機株式会社 信号処理装置
US20100324913A1 (en) * 2009-06-18 2010-12-23 Jacek Piotr Stachurski Method and System for Block Adaptive Fractional-Bit Per Sample Encoding
TWI413110B (zh) * 2009-10-06 2013-10-21 Dolby Int Ab 以選擇性通道解碼的有效多通道信號處理
US8207875B2 (en) * 2009-10-28 2012-06-26 Motorola Mobility, Inc. Encoder that optimizes bit allocation for information sub-parts
CA2803269A1 (en) * 2010-07-05 2012-01-12 Nippon Telegraph And Telephone Corporation Encoding method, decoding method, device, program, and recording medium
JP5337305B2 (ja) * 2010-07-05 2013-11-06 日本電信電話株式会社 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体
CN103270553B (zh) 2010-08-12 2015-08-12 弗兰霍菲尔运输应用研究公司 对正交镜像滤波器式音频编译码器的输出信号的重新取样
MY155997A (en) * 2010-10-06 2015-12-31 Fraunhofer Ges Forschung Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac)
US8842842B2 (en) * 2011-02-01 2014-09-23 Apple Inc. Detection of audio channel configuration
EP2686848A1 (en) * 2011-03-18 2014-01-22 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frame element positioning in frames of a bitstream representing audio content
CN102761735B (zh) * 2011-04-25 2014-12-24 中国科学院微电子研究所 编码方法及装置、图像压缩方法及系统
CN102810314B (zh) * 2011-06-02 2014-05-07 华为终端有限公司 音频编码方法及装置、音频解码方法及装置、编解码系统
CN102368385B (zh) * 2011-09-07 2013-08-14 中科开元信息技术(北京)有限公司 后向块自适应Golomb-Rice编解码方法及装置
US9799339B2 (en) * 2012-05-29 2017-10-24 Nokia Technologies Oy Stereo audio signal encoder
US9865269B2 (en) * 2012-07-19 2018-01-09 Nokia Technologies Oy Stereo audio signal encoder
US10346784B1 (en) 2012-07-27 2019-07-09 Google Llc Near-term delivery system performance simulation
KR102049602B1 (ko) * 2012-11-20 2019-11-27 한국전자통신연구원 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법
US10178489B2 (en) * 2013-02-08 2019-01-08 Qualcomm Incorporated Signaling audio rendering information in a bitstream
JP6377730B2 (ja) * 2013-06-05 2018-08-22 ドルビー・インターナショナル・アーベー オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置
EP2830058A1 (en) 2013-07-22 2015-01-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Frequency-domain audio coding supporting transform length switching
EP2838086A1 (en) 2013-07-22 2015-02-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment
EP2830332A3 (en) 2013-07-22 2015-03-11 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration
EP2830061A1 (en) * 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
US10075266B2 (en) * 2013-10-09 2018-09-11 Qualcomm Incorporated Data transmission scheme with unequal code block sizes
EP2866227A1 (en) 2013-10-22 2015-04-29 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder
ES2770407T3 (es) * 2014-01-24 2020-07-01 Nippon Telegraph & Telephone Aparato, método, programa y soporte de registro de análisis predictivo lineal
KR101850529B1 (ko) * 2014-01-24 2018-04-19 니폰 덴신 덴와 가부시끼가이샤 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체
CN106409300B (zh) 2014-03-19 2019-12-24 华为技术有限公司 用于信号处理的方法和装置
WO2015200498A1 (en) * 2014-06-24 2015-12-30 Hotel Trader LLC Reservation exchange server system
CA2956957C (en) * 2014-08-07 2019-02-12 ONE Media, LLC Dynamic configuration of a flexible orthogonal frequency division multiplexing phy transport data frame
CA2955611C (en) 2014-08-07 2022-03-22 Coherent Logix, Incorporated Multi-partition radio frames
CN105632503B (zh) * 2014-10-28 2019-09-03 南宁富桂精密工业有限公司 信息隐藏方法及系统
CN104392725A (zh) * 2014-12-02 2015-03-04 中科开元信息技术(北京)有限公司 多声道无损音频混合编解码方法及装置
CN106033671B (zh) * 2015-03-09 2020-11-06 华为技术有限公司 确定声道间时间差参数的方法和装置
US10500739B2 (en) * 2015-11-13 2019-12-10 Ethicon Llc Robotic surgical system
CN106131550B (zh) * 2016-07-25 2020-02-14 合一网络技术(北京)有限公司 播放多媒体文件的方法及装置
CN107221334B (zh) * 2016-11-01 2020-12-29 武汉大学深圳研究院 一种音频带宽扩展的方法及扩展装置
EP3324407A1 (en) * 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic
EP3324406A1 (en) 2016-11-17 2018-05-23 Fraunhofer Gesellschaft zur Förderung der Angewand Apparatus and method for decomposing an audio signal using a variable threshold
EP3382700A1 (en) * 2017-03-31 2018-10-03 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for post-processing an audio signal using a transient location detection
CN109389984B (zh) 2017-08-10 2021-09-14 华为技术有限公司 时域立体声编解码方法和相关产品
CN109389987B (zh) * 2017-08-10 2022-05-10 华为技术有限公司 音频编解码模式确定方法和相关产品
CN109859766B (zh) 2017-11-30 2021-08-20 华为技术有限公司 音频编解码方法和相关产品
KR20210021968A (ko) 2018-06-25 2021-03-02 소니 세미컨덕터 솔루션즈 가부시키가이샤 정보 처리 장치, 정보 처리 시스템, 프로그램 및 정보 처리 방법
US11545165B2 (en) * 2018-07-03 2023-01-03 Panasonic Intellectual Property Corporation Of America Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels
PH12019000380A1 (en) * 2018-12-17 2020-09-28 Nokia Technologies Oy An apparatus, a method and a computer program for video coding and decoding
WO2020164752A1 (en) * 2019-02-13 2020-08-20 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio transmitter processor, audio receiver processor and related methods and computer programs
TW202102010A (zh) 2019-05-24 2021-01-01 瑞典商赫爾桑茲股份有限公司 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品
US11271678B2 (en) * 2020-01-21 2022-03-08 Realtek Semiconductor Corp. Encoding method, related transmitter apparatus and related receiver apparatus for wireless local area network
CN111341330B (zh) * 2020-02-10 2023-07-25 科大讯飞股份有限公司 音频编解码方法、存取方法及其相关设备及存储装置
US11769478B1 (en) 2021-07-15 2023-09-26 Dialog Semiconductor B.V. Digital signal processing system

Family Cites Families (141)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US247035A (en) * 1881-09-13 Drill-chuck
US78687A (en) * 1868-06-09 Daniel e
US216262A (en) * 1879-06-10 Improvement in thill-coupling jacks
US138157A (en) * 1873-04-22 Improvement in breech-loading fire-arms
US63368A (en) * 1867-04-02 davids
US13405A (en) * 1855-08-07 Self-adjusting tongue-ihon
US117044A (en) * 1871-07-18 Improvement in ladies work-stands
US80829A (en) * 1868-08-11 Patkick lennox
US75153A (en) * 1868-03-03 Egbert d
US152557A (en) * 1874-06-30 Improvement in devices for coiling wire
US76333A (en) * 1868-04-07 To all whom it may concern
US37461A (en) * 1863-01-20 Improved car for carrying petroleum
US254281A (en) * 1882-02-28 Corn-sheller
US149322A (en) * 1874-04-07 Improvement in parasol-handles
US115051A (en) * 1871-05-23 Improvement in the manufacture of glucose sirups -and sugars
US2006A (en) * 1841-03-16 Clamp for crimping leather
US251330A (en) * 1881-12-20 Dust-collector for flour-mills
US125933A (en) * 1872-04-23 Improvement in compounds for the cure of colic and botts in horses
US4110571A (en) 1977-11-25 1978-08-29 Jimmy's Radio & Television Corporation Test unit for stereophonic speaker systems
US4922537A (en) * 1987-06-02 1990-05-01 Frederiksen & Shu Laboratories, Inc. Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals
US5243686A (en) 1988-12-09 1993-09-07 Oki Electric Industry Co., Ltd. Multi-stage linear predictive analysis method for feature extraction from acoustic signals
FR2646978B1 (fr) 1989-05-11 1991-08-23 France Etat Procede et installation a codage de signaux sonores
NL9000338A (nl) 1989-06-02 1991-01-02 Koninkl Philips Electronics Nv Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting.
EP0405591B1 (en) 1989-06-30 1997-10-01 Nec Corporation Varaible length block coding with changing characteristics of input samples
JPH03224130A (ja) 1990-01-30 1991-10-03 Konica Corp ディスク状磁気記録媒体
CN1062963C (zh) 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
US5283780A (en) 1990-10-18 1994-02-01 Stanford Telecommunications, Inc. Digital audio broadcasting system
US5165686A (en) * 1990-12-18 1992-11-24 Morgan Edward H Wooden baseball bat
CA2077662C (en) 1991-01-08 2001-04-17 Mark Franklin Davis Encoder/decoder for multidimensional sound fields
US5751773A (en) 1992-03-12 1998-05-12 Ntp Incorporated System for wireless serial transmission of encoded information
US5495552A (en) 1992-04-20 1996-02-27 Mitsubishi Denki Kabushiki Kaisha Methods of efficiently recording an audio signal in semiconductor memory
US5828784A (en) * 1992-07-13 1998-10-27 Hitachi Denshi Kabushiki Kaisha Data coding method and apparatus using a plurality of blocks of different length
US6161122A (en) * 1992-12-10 2000-12-12 Hawkes; Calvert T. Method and apparatus for interactively providing information at multiple sites
KR100287494B1 (ko) * 1993-06-30 2001-04-16 이데이 노부유끼 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체
JP3175446B2 (ja) 1993-11-29 2001-06-11 ソニー株式会社 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体
JP3125543B2 (ja) 1993-11-29 2001-01-22 ソニー株式会社 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体
DE4401227C2 (de) * 1994-01-18 1999-03-18 Ernst Peter Prof Dr M Strecker In den Körper eines Patienten perkutan implantierbare Endoprothese
JPH0831096A (ja) 1994-07-12 1996-02-02 Matsushita Electric Ind Co Ltd オーディオデータ符号化記録装置及びオーディオデータ復号再生装置
US6549666B1 (en) 1994-09-21 2003-04-15 Ricoh Company, Ltd Reversible embedded wavelet system implementation
US5751903A (en) 1994-12-19 1998-05-12 Hughes Electronics Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset
DE727780T1 (de) 1995-02-16 1997-02-13 Toshiba Kawasaki Kk Ausgabesteuerungssystem für umschaltbare Torkanäle
US5956674A (en) 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3705305B2 (ja) * 1996-05-16 2005-10-12 カシオ計算機株式会社 音声記憶再生装置
JP3364825B2 (ja) 1996-05-29 2003-01-08 三菱電機株式会社 音声符号化装置および音声符号化復号化装置
US6154549A (en) * 1996-06-18 2000-11-28 Extreme Audio Reality, Inc. Method and apparatus for providing sound in a spatial environment
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
DE69723959T2 (de) * 1996-11-11 2004-06-17 Koninklijke Philips Electronics N.V. Datenkompression und -dekompression durch rice-kodierer/-dekodierer
TW447193B (en) 1996-12-09 2001-07-21 Matsushita Electric Ind Co Ltd Signal processing device
EP1359755B1 (en) 1996-12-20 2005-11-09 Koninklijke Philips Electronics N.V. A coded information signal
EP0880246A3 (en) 1997-05-15 1999-12-01 Matsushita Electric Industrial Co., Ltd. Compressed code decoding device and audio decoding device
US6124895A (en) * 1997-10-17 2000-09-26 Dolby Laboratories Licensing Corporation Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment
US6069947A (en) 1997-12-16 2000-05-30 Nortel Networks Corporation Communication system architecture and operating protocol therefor
JP3802219B2 (ja) 1998-02-18 2006-07-26 富士通株式会社 音声符号化装置
US6831914B1 (en) * 1998-03-27 2004-12-14 Verizon Services Corp. Services control point selection in an advanced intelligent network
DE69826529T2 (de) 1998-04-15 2005-09-22 Stmicroelectronics Asia Pacific (Pte) Ltd. Schnelle datenrahmen-optimierung in einem audio-kodierer
US6298900B1 (en) * 1998-07-06 2001-10-09 Ford Global Technologies, Inc. Method of integrating wear plates into a spray formed rapid tool
US6480822B2 (en) 1998-08-24 2002-11-12 Conexant Systems, Inc. Low complexity random codebook structure
US6420980B1 (en) * 1998-10-06 2002-07-16 Matsushita Electric Industrial Co., Ltd. Lossless compression encoding method and device, and lossless compression decoding method and device
JP4610680B2 (ja) * 1998-11-02 2011-01-12 ソニー株式会社 信号処理装置および方法、記録装置、再生装置、記録再生装置、ならびに、映像信号記録再生装置
US6816491B1 (en) 1998-11-04 2004-11-09 Hitachi, Ltd. Multiplexed audio data decoding apparatus and receiver apparatus
US6300888B1 (en) 1998-12-14 2001-10-09 Microsoft Corporation Entrophy code mode switching for frequency-domain audio coding
US6628714B1 (en) 1998-12-18 2003-09-30 Zenith Electronics Corporation Down converting MPEG encoded high definition sequences to lower resolution with reduced memory in decoder loop
US6276608B1 (en) * 1998-12-29 2001-08-21 Daimlerchrysler Ag Data storage and communication system
CZ300954B6 (cs) 1999-01-07 2009-09-23 Koninklijke Philips Electronics N. V. Zarízení a zpusob pro kódování digitálního informacního signálu, zarízení pro dekódování a nosic záznamu
US6226608B1 (en) 1999-01-28 2001-05-01 Dolby Laboratories Licensing Corporation Data framing for adaptive-block-length coding system
US7051351B2 (en) * 1999-03-08 2006-05-23 Microsoft Corporation System and method of inserting advertisements into an information retrieval system display
DE60017825T2 (de) 1999-03-23 2006-01-12 Nippon Telegraph And Telephone Corp. Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür
EP1054575A3 (en) 1999-05-17 2002-09-18 Bose Corporation Directional decoding
US6691082B1 (en) 1999-08-03 2004-02-10 Lucent Technologies Inc Method and system for sub-band hybrid coding
JP3762579B2 (ja) 1999-08-05 2006-04-05 株式会社リコー デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体
US7096481B1 (en) 2000-01-04 2006-08-22 Emc Corporation Preparation of metadata for splicing of encoded MPEG video and audio
US6678332B1 (en) * 2000-01-04 2004-01-13 Emc Corporation Seamless splicing of encoded MPEG video and audio
US6810502B2 (en) * 2000-01-28 2004-10-26 Conexant Systems, Inc. Iteractive decoder employing multiple external code error checks to lower the error floor
US6675748B2 (en) * 2000-02-11 2004-01-13 Westport Research Inc. Method and apparatus for fuel injection into an internal combustion engine
US7266501B2 (en) 2000-03-02 2007-09-04 Akiba Electronics Institute Llc Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process
US7323299B2 (en) * 2000-03-21 2008-01-29 Neugenesis Corporation Methods for in vivo diversification of single genes
US6448890B1 (en) * 2000-05-01 2002-09-10 Breed Automotive Technology, Inc. Air bag system with biomechanical gray zones
SE522261C2 (sv) * 2000-05-10 2004-01-27 Global Ip Sound Ab Kodning och avkodning av en digital signal
WO2001097476A2 (en) 2000-06-12 2001-12-20 Time Domain Corporation A method for specifying non-temporal pulse characteristics
JP4538908B2 (ja) * 2000-06-14 2010-09-08 ソニー株式会社 データ変換装置及び方法
US6609947B1 (en) * 2000-08-30 2003-08-26 Micron Technology, Inc. Planarizing machines and control systems for mechanical and/or chemical-mechanical planarization of micro electronic substrates
US20020049586A1 (en) 2000-09-11 2002-04-25 Kousuke Nishio Audio encoder, audio decoder, and broadcasting system
US6775254B1 (en) * 2000-11-09 2004-08-10 Qualcomm Incorporated Method and apparatus for multiplexing high-speed packet data transmission with voice/data transmission
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
JP3639212B2 (ja) * 2000-12-11 2005-04-20 株式会社オプトウエア 光情報記録方法
US6675148B2 (en) 2001-01-05 2004-01-06 Digital Voice Systems, Inc. Lossless audio coder
US7930170B2 (en) * 2001-01-11 2011-04-19 Sasken Communication Technologies Limited Computationally efficient audio coder
US6871043B2 (en) * 2001-02-02 2005-03-22 Ecollege.Com Variable types of sensory interaction for an on-line educational system
US6696993B2 (en) * 2001-03-23 2004-02-24 Nokia Corporation Variable length coding
JP4867076B2 (ja) 2001-03-28 2012-02-01 日本電気株式会社 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法
FI118067B (fi) * 2001-05-04 2007-06-15 Nokia Corp Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite
JP3601473B2 (ja) 2001-05-11 2004-12-15 ヤマハ株式会社 ディジタルオーディオ圧縮回路および伸長回路
ATE311727T1 (de) 2001-08-03 2005-12-15 Koninkl Philips Electronics Nv Datenschutzsystem und -verfahren für audio-video übertragung
GB2379977B (en) * 2001-09-25 2005-04-06 Kidde Plc High sensitivity particle detection
US20030078687A1 (en) 2001-10-15 2003-04-24 Du Breuil Thomas Lemaigre Method and system for automatically configuring an audio environment
DE20117292U1 (de) * 2001-10-22 2002-01-17 Reitter & Schefenacker Gmbh Innenleuchte für Fahrzeuge, vorzugsweise für Kraftfahrzeuge
EP1308931A1 (de) * 2001-10-23 2003-05-07 Deutsche Thomson-Brandt Gmbh Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist
US7085401B2 (en) * 2001-10-31 2006-08-01 Infowrap Systems Ltd. Automatic object extraction
SE521600C2 (sv) 2001-12-04 2003-11-18 Global Ip Sound Ab Lågbittaktskodek
US20030018183A1 (en) * 2001-12-06 2003-01-23 Genentech, Inc. Secreted and transmembrane polypeptides and nucleic acids encoding the same
US6934677B2 (en) 2001-12-14 2005-08-23 Microsoft Corporation Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands
US6690307B2 (en) * 2002-01-22 2004-02-10 Nokia Corporation Adaptive variable length coding of digital video
BRPI0308691A2 (pt) 2002-04-10 2016-11-16 Koninkl Philips Electronics Nv métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, arranjos para codificar e decodificar um sinal de canal múltiplo, sinal de dados, meio legível por computador, e, dispositivo para comunicar um sinal de canal múltiplo.
ES2300567T3 (es) 2002-04-22 2008-06-16 Koninklijke Philips Electronics N.V. Representacion parametrica de audio espacial.
RU2313174C2 (ru) 2002-04-26 2007-12-20 Нокиа Корпорейшн Адаптивный способ и система для отображения значений параметров в индексы кодовых слов
JP4296753B2 (ja) 2002-05-20 2009-07-15 ソニー株式会社 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体
US6691028B2 (en) * 2002-06-07 2004-02-10 Motorola, Inc. Server-based navigation system and method of operating same
US20040015259A1 (en) * 2002-07-18 2004-01-22 A-Po Tsai NC machining program having easily selectable modes
JP4055122B2 (ja) 2002-07-24 2008-03-05 日本ビクター株式会社 音響信号符号化方法及び音響信号符号化装置
US6807732B2 (en) * 2002-07-24 2004-10-26 Agilent Technologies, Inc. Methods for modifying inner-layer circuit features of printed circuit boards
JP2004072345A (ja) * 2002-08-05 2004-03-04 Pioneer Electronic Corp 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造
JP4022111B2 (ja) 2002-08-23 2007-12-12 株式会社エヌ・ティ・ティ・ドコモ 信号符号化装置及び信号符号化方法
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
CA2501368C (en) 2002-10-11 2013-06-25 Nokia Corporation Methods and devices for source controlled variable bit-rate wideband speech coding
US20040076333A1 (en) 2002-10-22 2004-04-22 Huipin Zhang Adaptive interpolation filter system for motion compensated predictive video coding
AU2003302114A1 (en) 2002-11-21 2004-06-15 Nippon Telegraph And Telephone Corporation Digital signal processing method, processor thereof, program thereof, and recording medium containing the program
EP1427252A1 (en) 2002-12-02 2004-06-09 Deutsche Thomson-Brandt Gmbh Method and apparatus for processing audio signals from a bitstream
WO2004053919A2 (en) * 2002-12-11 2004-06-24 Koninklijke Philips Electronics N.V. X-ray source for generating monochromatic x-rays
US7440810B2 (en) 2002-12-13 2008-10-21 Dell Products L.P. Multi-channel media applications support with channel-to-connector mapping
ATE418254T1 (de) * 2002-12-23 2009-01-15 Alcatel Lucent Überlastkontrolle in einem optischen netzwerk mit burstschaltung
KR101049751B1 (ko) 2003-02-11 2011-07-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 오디오 코딩
US20040177044A1 (en) * 2003-03-03 2004-09-09 General Instrument Corporation Processing of copy control information for digital rights management
US7792194B2 (en) * 2003-04-10 2010-09-07 Lefan Zhong MPEG artifacts post-processed filtering architecture
US7742926B2 (en) 2003-04-18 2010-06-22 Realnetworks, Inc. Digital audio signal compression method and apparatus
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
US7383180B2 (en) 2003-07-18 2008-06-03 Microsoft Corporation Constant bitrate media encoding techniques
SE0302161D0 (sv) * 2003-08-04 2003-08-01 Akzo Nobel Nv Process for the manufacture of a bitumen-aggregate mix suitable for road pavement
US7640157B2 (en) 2003-09-26 2009-12-29 Ittiam Systems (P) Ltd. Systems and methods for low bit rate audio coders
WO2005036529A1 (en) 2003-10-13 2005-04-21 Koninklijke Philips Electronics N.V. Audio encoding
US7519520B2 (en) * 2003-10-13 2009-04-14 Realnetworks, Inc. Compact signal coding method and apparatus
KR20050044085A (ko) * 2003-11-07 2005-05-12 삼성전자주식회사 집적회로 소자의 세정액 및 그 세정액을 이용한 세정방법
US7292902B2 (en) 2003-11-12 2007-11-06 Dolby Laboratories Licensing Corporation Frame-based audio transmission/storage with overlap to facilitate smooth crossfading
JP4765289B2 (ja) * 2003-12-10 2011-09-07 ソニー株式会社 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置
US7809579B2 (en) * 2003-12-19 2010-10-05 Telefonaktiebolaget Lm Ericsson (Publ) Fidelity-optimized variable frame length encoding
SE527670C2 (sv) 2003-12-19 2006-05-09 Ericsson Telefon Ab L M Naturtrogenhetsoptimerad kodning med variabel ramlängd
US7272567B2 (en) * 2004-03-25 2007-09-18 Zoran Fejzo Scalable lossless audio codec and authoring tool
KR100773539B1 (ko) * 2004-07-14 2007-11-05 삼성전자주식회사 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치
US7233174B2 (en) * 2004-07-19 2007-06-19 Texas Instruments Incorporated Dual polarity, high input voltage swing comparator using MOS input transistors
JP4809370B2 (ja) 2005-02-23 2011-11-09 テレフオンアクチーボラゲット エル エム エリクソン(パブル) マルチチャネル音声符号化における適応ビット割り当て
US8032240B2 (en) * 2005-07-11 2011-10-04 Lg Electronics Inc. Apparatus and method of processing an audio signal
US7299902B2 (en) * 2005-10-21 2007-11-27 Jim Thorpe Wheel chock for tandem wheeled vehicles

Also Published As

Publication number Publication date
EP1913794A4 (en) 2010-12-29
WO2007007999A3 (en) 2007-03-22
CN101218628A (zh) 2008-07-09
CN101243496B (zh) 2011-12-07
US20090030701A1 (en) 2009-01-29
CN101243489A (zh) 2008-08-13
US7987008B2 (en) 2011-07-26
US20090037183A1 (en) 2009-02-05
JP2009500682A (ja) 2009-01-08
US20090106032A1 (en) 2009-04-23
JP2009500685A (ja) 2009-01-08
CN101243496A (zh) 2008-08-13
JP2009500689A (ja) 2009-01-08
US8275476B2 (en) 2012-09-25
US20090030675A1 (en) 2009-01-29
CN101218628B (zh) 2011-11-09
US20090030700A1 (en) 2009-01-29
US8149878B2 (en) 2012-04-03
US20090037009A1 (en) 2009-02-05
CN101243493A (zh) 2008-08-13
US20070009032A1 (en) 2007-01-11
WO2007008000A2 (en) 2007-01-18
EP1913588A4 (en) 2011-02-16
WO2007008008A2 (en) 2007-01-18
US8149877B2 (en) 2012-04-03
CN101238509A (zh) 2008-08-06
US8155144B2 (en) 2012-04-10
US8032368B2 (en) 2011-10-04
WO2007008012A3 (en) 2007-03-08
JP2009500688A (ja) 2009-01-08
US8417100B2 (en) 2013-04-09
EP1913794A1 (en) 2008-04-23
US7987009B2 (en) 2011-07-26
WO2007008003A2 (en) 2007-01-18
EP1913579A2 (en) 2008-04-23
US20090037188A1 (en) 2009-02-05
WO2007008004A3 (en) 2007-03-15
EP1908058A2 (en) 2008-04-09
JP2009500686A (ja) 2009-01-08
US8155153B2 (en) 2012-04-10
US8108219B2 (en) 2012-01-31
WO2007008005A1 (en) 2007-01-18
WO2007008009A1 (en) 2007-01-18
EP1913588A2 (en) 2008-04-23
US20070010996A1 (en) 2007-01-11
EP1913581A4 (en) 2011-02-09
US20070011215A1 (en) 2007-01-11
US7930177B2 (en) 2011-04-19
CN101218852A (zh) 2008-07-09
US7411528B2 (en) 2008-08-12
US7835917B2 (en) 2010-11-16
US8155152B2 (en) 2012-04-10
WO2007008003A3 (en) 2007-03-15
US8180631B2 (en) 2012-05-15
US8055507B2 (en) 2011-11-08
WO2007008013A3 (en) 2007-03-22
EP1913582A4 (en) 2010-12-29
CN101243494A (zh) 2008-08-13
US8326132B2 (en) 2012-12-04
EP1913581A2 (en) 2008-04-23
US20070011000A1 (en) 2007-01-11
US20070011013A1 (en) 2007-01-11
CN101243492A (zh) 2008-08-13
EP1913579A4 (en) 2010-12-29
US8510120B2 (en) 2013-08-13
US20090037186A1 (en) 2009-02-05
WO2007008011A3 (en) 2007-03-15
JP2009500687A (ja) 2009-01-08
US8255227B2 (en) 2012-08-28
US20090030702A1 (en) 2009-01-29
US8121836B2 (en) 2012-02-21
US20090037187A1 (en) 2009-02-05
US8032240B2 (en) 2011-10-04
US8065158B2 (en) 2011-11-22
WO2007008004A2 (en) 2007-01-18
EP1913589A4 (en) 2010-12-29
WO2007007999A2 (en) 2007-01-18
US20090037185A1 (en) 2009-02-05
WO2007008002A2 (en) 2007-01-18
EP1913584A2 (en) 2008-04-23
EP1913583A1 (en) 2008-04-23
JP2009500681A (ja) 2009-01-08
US20090037182A1 (en) 2009-02-05
WO2007008011A2 (en) 2007-01-18
CN101243497A (zh) 2008-08-13
US8032386B2 (en) 2011-10-04
US20070014297A1 (en) 2007-01-18
US20090037184A1 (en) 2009-02-05
US7991012B2 (en) 2011-08-02
US7996216B2 (en) 2011-08-09
US20090037167A1 (en) 2009-02-05
US8046092B2 (en) 2011-10-25
CN101243495A (zh) 2008-08-13
EP1913585A1 (en) 2008-04-23
EP1913580A4 (en) 2011-01-05
US8050915B2 (en) 2011-11-01
WO2007008002A3 (en) 2007-03-15
US20090048850A1 (en) 2009-02-19
JP2009500683A (ja) 2009-01-08
WO2007008008A3 (en) 2007-03-15
US20070011004A1 (en) 2007-01-11
EP1913584A4 (en) 2011-02-23
US20070009233A1 (en) 2007-01-11
US7962332B2 (en) 2011-06-14
CN101218630A (zh) 2008-07-09
US20070009033A1 (en) 2007-01-11
EP1911020A2 (en) 2008-04-16
US20070009031A1 (en) 2007-01-11
CN101218630B (zh) 2013-07-17
WO2007008000A3 (en) 2007-04-05
EP1908058A4 (en) 2010-10-27
EP1913582A2 (en) 2008-04-23
US8149876B2 (en) 2012-04-03
US8510119B2 (en) 2013-08-13
US7830921B2 (en) 2010-11-09
CN101218629A (zh) 2008-07-09
US20090037190A1 (en) 2009-02-05
US7991272B2 (en) 2011-08-02
US8010372B2 (en) 2011-08-30
EP1911020A4 (en) 2010-12-29
US20090037192A1 (en) 2009-02-05
US20090037191A1 (en) 2009-02-05
EP1913583A4 (en) 2010-06-30
WO2007008013A2 (en) 2007-01-18
US20070009227A1 (en) 2007-01-11
WO2007008007A1 (en) 2007-01-18
CN101238510A (zh) 2008-08-06
WO2007008010A1 (en) 2007-01-18
JP2009500693A (ja) 2009-01-08
JP2009500692A (ja) 2009-01-08
EP1911021A2 (en) 2008-04-16
WO2007008001A3 (en) 2007-03-22
EP1913587A4 (en) 2010-10-27
JP2009500691A (ja) 2009-01-08
US20090048851A1 (en) 2009-02-19
EP1911021A4 (en) 2010-06-30
US20090037181A1 (en) 2009-02-05
US7949014B2 (en) 2011-05-24
JP2009500684A (ja) 2009-01-08
JP2009510810A (ja) 2009-03-12
US20070010995A1 (en) 2007-01-11
US20090055198A1 (en) 2009-02-26
US20070008193A1 (en) 2007-01-11
JP2009500690A (ja) 2009-01-08
EP1913580A2 (en) 2008-04-23
US7966190B2 (en) 2011-06-21
WO2007008001A2 (en) 2007-01-18
WO2007008012A2 (en) 2007-01-18
EP1913585A4 (en) 2010-12-29
US20090030703A1 (en) 2009-01-29
EP1913589A2 (en) 2008-04-23
US20070009105A1 (en) 2007-01-11
US8554568B2 (en) 2013-10-08
EP1913587A1 (en) 2008-04-23

Similar Documents

Publication Publication Date Title
CN101243496B (zh) 处理音频信号的装置和方法
KR100936498B1 (ko) 스테레오 호환성의 멀티채널 오디오 코딩

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication

Open date: 20080709