CN101218852A - 处理音频信号的装置和方法 - Google Patents
处理音频信号的装置和方法 Download PDFInfo
- Publication number
- CN101218852A CN101218852A CNA200680024866XA CN200680024866A CN101218852A CN 101218852 A CN101218852 A CN 101218852A CN A200680024866X A CNA200680024866X A CN A200680024866XA CN 200680024866 A CN200680024866 A CN 200680024866A CN 101218852 A CN101218852 A CN 101218852A
- Authority
- CN
- China
- Prior art keywords
- sound channel
- information
- audio signal
- piece
- sound
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/008—Multichannel audio signal coding or decoding using interchannel correlation to reduce redundancy, e.g. joint-stereo, intensity-coding or matrixing
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/0017—Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0212—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/022—Blocking, i.e. grouping of samples in time; Choice of analysis windows; Overlap factoring
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/08—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters
- G10L19/12—Determination or coding of the excitation function; Determination or coding of the long-term prediction parameters the excitation function being a code excitation, e.g. in code excited linear prediction [CELP] vocoders
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/167—Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B27/00—Editing; Indexing; Addressing; Timing or synchronising; Monitoring; Measuring tape travel
- G11B27/10—Indexing; Addressing; Timing or synchronising; Measuring tape travel
- G11B27/102—Programmed access in sequence to addressed parts of tracks of operating record carriers
- G11B27/105—Programmed access in sequence to addressed parts of tracks of operating record carriers of operating discs
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04S—STEREOPHONIC SYSTEMS
- H04S1/00—Two-channel systems
- H04S1/007—Two-channel systems in which the audio signals are in digital form
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/005—Correction of errors induced by the transmission channel, if related to the coding algorithm
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/032—Quantisation or dequantisation of spectral components
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/06—Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/04—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
- G10L19/16—Vocoder architecture
- G10L19/18—Vocoders using multiple modes
- G10L19/24—Variable rate codecs, e.g. for generating different qualities using a scalable representation such as hierarchical encoding or layered encoding
-
- G—PHYSICS
- G11—INFORMATION STORAGE
- G11B—INFORMATION STORAGE BASED ON RELATIVE MOVEMENT BETWEEN RECORD CARRIER AND TRANSDUCER
- G11B20/00—Signal processing not specific to the method of recording or reproducing; Circuits therefor
- G11B20/10—Digital recording or reproducing
- G11B20/10527—Audio or video recording; Data buffering arrangements
- G11B2020/10537—Audio or video recording
- G11B2020/10546—Audio or video recording specifically adapted for audio data
Abstract
在一个实施例中,声道映射消息被添加至音频信号的配置信息。所述声道映射消息指示音频信号中的每个声道被映射至再现装置中的哪个扬声器。例如,声道映射信息可包括多个比特,其中每个比特关联于一个扬声器并指示关联的扬声器的音频信号中是否存在声道。
Description
技术领域
本发明涉及一种处理音频信号的方法,更具体地涉及一种编码和解码音频信号的方法和装置。
背景技术
过去曾经以不同方法实现了音频信号的存储和重放。例如,音乐和语音业已通过留声技术(例如唱盘播放机)、磁技术(例如卡式磁带)和数字技术(例如光盘)来记录和保存。随着音频存储技术的发展,需要克服许多难题来优化音频信号的质量和可存储性。
为了音乐信号的存档和宽带传输,无损重建成为比借助诸如MP3或AAC等在MPEG标准中定义的感知编码高效率压缩更为重要的特征。虽然DVD音频和超级CD音频包括专用的无损压缩方案,但是在内容持有者和广播公司当中需要一种开放和综合性的压缩方案。响应于这种需要,一种新的无损编码方案已经成为MPEG-4音频标准的延伸。无损音频编码法由于原始信号的完美重建而实现了没有任何质量损失的数字音频数据压缩。
发明内容
本发明涉及处理音频信号的方法。
在一个实施例中,声道映射信息被加至音频信号的配置信息。该声道映射信息指示音频信号中的每个声道被映射到再现装置中的哪个扬声器。例如,声道映射信息包括多个比特,其中每个比特关联于一个扬声器并指示在关联的扬声器的音频信号中是否存在声道。
在另一实施例中,将指示比特位添加于配置信息以指示配置信息中是否包含声道映射信息。
在又一实施例中,具有配置信息和多个声道的音频信号被接收。声道映射信息被读取自配置信息。声道映射信息指示音频信号中的每个声道被映射至再现装置中的哪个扬声器。基于声道映射信息处理诸个声道。例如,声道映射信息可包括多个比特,每个比特关联于一个扬声器并指示在关联的扬声器的音频信号中是否存在声道。
本发明还涉及编码音频信号的方法和装置以及解码音频信号的方法和装置。
附图说明
包括于此以提供对本发明的进一步理解,并被结合在本申请内且构成其一部分的附图示出本发明的实施例,其与说明书一起用来解释本发明的原理。在附图中:
图1是根据本发明一个实施例的编码器的示例图。
图2是根据本发明一个实施例的解码器的示例图。
图3是根据本发明一个实施例的压缩的M声道文件的比特流结构的示例图。
图4是根据本发明一个实施例的分层块切换方法的理念图的示例图。
图5是块切换例和相应的块切换信息编码的示例图;
图6是根据本发明实施例的多个声道的块切换方法的示例图。
具体实施方式
下面将详细参考本发明的较佳实施例,其具体例子示于附图中。不管在何处,所有附图中相同的参考标号被用来表示相同或相似的部分。
在阐述本发明前,应当注意本发明中公开的多数术语对应于业内公知的通常术语,但某些术语已由申请人根据需要选择并且将在本发明后面的描述中予以公开。因此,基于它们在本发明中的含义理解由申请人定义的术语是较佳的。
在无损音频编码方法中,由于编码进程必须可以完美逆转而没有信息损失,因此编码器和解码器两者的若干部件必须以确定性方式予以实现。
编解码器结构
图1是根据本发明的编码器1的示例图。
分割部件100将输入的音频数据分割成若干帧。在一个帧中,每个声道还可进一步被细分成若干音频采样块以做进一步处理。缓存器110存储由分割部件100分割后的块和/或帧采样。
系数估算部件120估算每个块的最佳的系数值组。系数的数量,即预测器的阶数也可自适应地作出选择。系数估算部件120计算数字音频数据块的一组部分自相关系数(parcor)值。部分自相关系数值指示预测器系数的部分自相关系数表征。量化部件130将该组部分自相关系数值量化。
第一熵编码部件140通过将部分自相关系数值减去偏移值而计算部分自相关系数残数值,并使用由熵参数定义的熵代码对部分自相关系数的残数值进行编码,其中偏移值和熵参数选自最佳表。最佳表选自基于数字音频数据块的采样速率的多个表。分别对于多个采样速率范围预定义多个表以实现发送的数字音频数据的最佳压缩。
系数转换部件150将量化的部分自相关系数转换成线性的预测编码(LPC)系数。预测器160使用线性预测编码系数从存储在缓存器110中的先前原始采样中估算当前预测值。减法器170使用存储在缓存器110中的数字音频数据的原始值和预测器160中估算的预测值计算数字音频数据块的预测残数。
第二熵编码部件180使用不同的熵代码编码预测残数并生成代码索引。所选择的代码索引作为辅助信息被发送。第二熵代码部件180使用具有不同复杂度的两种选择性编码技术编码预测残数。一种编码技术是公知的Golomb-Rice编码(在下文中简称为“Rice码”)方法而另一种是公知的分组Gilbert-Moore码(在下文中简称为“BGMC”)方法。Rice码具有低复杂度但仍然是高效率的。BGMC算法编码方案以相比Rice码复杂度稍高的代价提供更好的压缩。
最后,多路复用部件190将编码的预测残数、代码索引、编码的部分自相关系数残数值和其它附加信息多路复用以形成压缩的比特流。编码器1还提供循环冗余校验(CRC)校验和,它主要被提供给解码器以校验解码的数据。在编码器方面,CRC用来保证压缩的数据能被无损地解码。
其它编码选项包括柔性块切换方案、随机存取和联合声道编码。编码器1可使用这些选项提供若干具有不同复杂度的压缩级别。联合声道编码利用立体声声道或多声道信号之间的相关性。这可通过在某些段中编码两声道之间的差来实现,在这些段中能够比原始声道之一更为有效地编码这种差。这些编码选项将在参数根据本发明的示例性解码器的说明之后更为详细地予以说明。
图2是根据本发明的解码器2的示例图。更详细地说,图2示出由于不必执行任何调整因而复杂度明显低于编码器的无损音频信号解码器。
多路分解部件200接收音频信号并将数字音频数据块的编码的预测残数、代码索引、编码的部分自相关系数残数值和其它附加信息多路分解。第一熵解码部件210使用由熵参数定义的熵代码以解码部分自相关系数残数值并通过将偏移值加上解码的部分自相关系数残数值计算一组部分自相关系数值;其中偏移值和熵参数被选自一个表,该表是由解码器从基于数字音频数据块的采样速率的多个表中选择的。第二熵解码部件220使用代码系数解码多路分解的编码的预测残数。系数转换部件230将熵解码的自相关系数值转换成LPC系数。预测器240使用LPC系数估算数字音频数据块的预测残数。加法器250将解码的预测残数与估算的预测残数相加以获得数字音频数据的原始块。组装部件260将解码的块数据组装成帧数据。
因此,解码器2将编码的预测残数和自相关系数残数解码,将自相关系数残数值转换成LPC系数,并运用逆预估滤波器以计算无损重构信号。解码器2的计算强度取决于由编码器1选择的预测阶数。在多数情形下,实时解码即使在低端系统中也是可行的。
图3是根据本发明的包括多个声道的(例如M声道)压缩音频信号的比特流结构的示例图。
比特流由包括多个声道(例如M声道)的至少一个音频帧构成。比特流配置语法(见下面的表6)中的“channels”字段指示声道数。使用根据本发明的块切换方案将每个声道再分成多个块,这将在后面详细说明。每个再分块具有不同的大小并包括根据图1编码的编码数据。例如,一个再分块中的编码数据包含代码索引、预测阶数K、预测器系数和编码的残数值。如果使用声道对之间的联合编码,则所有声道的块分割是相同的,并且这些块以交织方式被存储。比特流配置语法(表6)中的“js_stereo”字段指示联合立体声(声道差)是开启的还是关闭的,而frame_data语法(见下面的表7)中的“js_switch”字段指示是否选择联合立体声(声道差)。否则,每个声道的块分割是独立的。
下面将详细参照附图和后面的语法详细说明前面提到的块切换、随机存取、预测和熵编码选项。
块切换
本发明的一个方面涉及在使用实际编码方案前将每个声道再分成多个块。下面,根据本发明的块分割(或再分)方法被称为“块切换方法”。
分层块切换
图4是根据本发明的分层块切换方法的理念图的示例图。例如,图4示出将一个声道按分层再分成32个块的方法。当在单个帧中提供多个声道时,每个声道被再分(或分割)成高达32个块,并且每个声道的再分块构成一个帧。因此,根据本发明的块切换方法由图1所示的分割部件100执行。此外,如上所述,预测编码和熵编码执行于再分块单元。
总地来说,传统音频无损编码(ALS)包括相对简单的块切换方案。N个采样的每个声道或者使用一个全长块(NB=N)或者四个长度块NB=N/4(例如1∶4切换)编码,其中相同的块分割应用于所有声道。在某些情形下,该方案具有某些局限性。例如,尽管只有1∶1或1∶4切换是可行的,然而不同的切换(例如1∶2、1∶8及其组合)在某些情形下是更有效的。另外在传统ALS中,对所有声道以相同方式执行切换,尽管不同声道可能得益于不同的切换(如果声道不是相关的则尤为如此)。
因此,根据本发明实施例的块切换方法提供相对灵活的块切换方案,其中一个帧的每个声道按分层被再分成多个块。例如,图4示出能分分层地再分成高达32个块的声道。在根据本实施例的一个声道中,NB=N、N/2、N/4、N/8、N/16和N/32的任意块组合是可行的,只要每个块是通过双倍长度的高层块的再分产生的。例如,如图4中的例子所示,尽管至N/4+N/2+N/4的分割是不可行的,然而至N/4+N/4+N/2的分割是可行的(例如下面在图5(e)和图5中示出的块切换实例)。换句话说,声道被分成多个块以使每个块的长度等于N/(mi)中的一个值,其中i=1,2,……p,在这里N是声道的长度,m是大于或等于2的一个整数,而p代表在再分分层中的层数。
因此,在本发明的实施例中,比特流包括指示块切换层的信息以及指示块切换结果的信息。这里,与块切换相关的信息被包含在用于解码处理的语法中,这将在下面进行描述。
例如,作出设定以使块切换处理后产生的最小块尺寸为NB=N/32。然而,这种设定仅为简化本发明说明的一个实例。因此,根据本发明的设定不局限于这种设定。
更具体地说,当最小块大小为NB=N/32时,这表示块切换处理已按分层进行了5次,故将其称为5层块切换。或者,当最小块大小为NB=N/16时,这表示块切换处理已按分层执行了4次,故将其称为4层块切换。同样,当最小块大小为NB=N/8时,这表示块切换处理已按分层执行了3次,故将其称为3层块切换。而当最小块大小为NB=N/4时,这表示块切换处理已按分层执行了2次,故将其称为2层块切换。.当最小块大小为NB=N/2时,这表示块切换处理已按分层执行了1次,故将其称为1层块切换。最后,当最小块大小为NB=N时,这表示尚未执行块切换处理,故将其称为0层块切换。
在本发明的实施例中,指示块切换层的信息被称为第一块切换信息。例如,第一块切换信息可由表6中的语法中的2比特字段“block_switching”表示,这将在后面的处理中予以说明。更具体地说,“block_switching=00”表示层0,“block_switching=01”表示层1至层3中的任何一个,“block_switching=10”表示层4,而“block_switching=11”表示层5。
另外,指示根据上述块切换层对每个分层执行的块切换结果的信息在这些实施例中被称为第二块切换信息,这里,第二块切换信息可由“bs_info”字段表示,该字段在表7所示的语法中以8比特、16比特和32比特中的任何一个表示。更具体地说,如果“block_switching=01”(表示层1至层3的任何一个),则“bs_info”由8比特表示。如果“block_switching=10”(表示层4),则“bs_info”由16比特表示。换句话说,高达4层的块切换结果可用16比特表示。此外,如果“block_switching=11”(表示层5),则“bs_info”表示为32比特。换句话说,高达5层的块切换结果可用32比特指示。最后,如果“block_switching=00”(表示尚未进行块切换),则不发送“bs_info”。这表示一个声道构成一个块。
分配给第二块切换信息的总比特数是基于第一块切换信息的层值而确定的。这可能会减小最终的比特率。在下面的表1中简述第一块切换信息和第二块切换信息之间的关系。
表1:块切换层
最大层数 | 最小NB | “bs_info”的字节数 |
0(”block_swithing=00”) | N | 0 |
1(”block_swithing=01”) | N/2 | 1(=8比特) |
2(”block_swithing=01”) | N/4 | 1(=8比特) |
3(”blocK_swithing=01”) | N/8 | 1(=8比特) |
4(”block_swithing=10”) | N/16 | 2(=16比特) |
5(”block_swithing=11”) | N/32 | 4(=32比特) |
下面,将详细描述配置(或映射)第二块切换信息(bs_info)中每个比特的的方法的一个实施例。
bs_info字段根据上述实施例可包括高达4个字节。关于层1至层5的比特映射可以是[(0)1223333 44444444 55555555 55555555]。可预留第一比特以指示独立或同步块切换,这将在后面的独立/同步块切换章节更为详细地说明。图5(a)-5(f)示出一个声道的不同块切换实例,其中发生3层块切换。因此,在这些实例中,最小块长度为NB=N/8,并且bs_info由一个字节构成。从最大块长度NB=N开始,如果块被进一步再分,则设定bs_info比特。例如,在图5(a)中,根本不存在再分,因此“bs_info”为(0)000 0000。在图5(b)中,帧被再分((0)1……)而长度为N/2的第二块被进一步分成((0)101……)两个长度块N/4;因此bs_info为(0)1010 0000。在图5(c)中,帧被再分((0)1……),并且只有长度N/2的第一块被进一步分割成((0)110……)长度为N/4的两个块;因此“bs_info”为(0)1100 0000。在图5(d)中,帧被再分((0)1……),长度为N/2的第一块和第二块被进一步分割((0)111……)成长度为N/4的两个块,并且只有长度为N/4的第二块被进一步分割((0)11101……)成长度为N/8的两个块;因此“bs_info”为(0)111 0100。
如上所述,图5(e)和5(f)中的实例表示不允许块切换的情形,这是因为图5(e)中的N/2块和图5(f)中的第一个N/4块无法通过再分前一层的块而获得。
独立/同步块切换
图6(a)-6(c)是根据本发明实施例的块切换的示例图。
更具体地说,图6(a)示出尚未对块1、2和3执行块切换的实例。图6(b)示出一个实例,其中两个声道(声道1和2)构成一个声道对,并且在声道1和声道2中同步地执行块切换。交织也被应用于本例中。图6(c)示出一个实例,其中两个声道(声道1和2)构成一个声道对,并且声道1和声道2的块切换独立地进行。这里,声道对指两个任意的音频声道。关于哪些声道被分组声道对的判决可由编码器自动作出或由用户手动作出(例如L和R声道、Ls和Rs声道)。
在独立块切换中,尽管在所有声道中每个声道的长度可以是相同的,然而可对每个声道独立地执行块切换。即,如图6(c)所示,声道以不同方式被分成两个块。如果一个声道对的两个声道彼此相关并且使用差编码,则声道对的两个声道被同步地块切换。在同步块切换中,声道以相同方式被块切换(即被分成若干个块)。图6(b)示出这样的一个实例,并进一步示出这些块可以被交织。如果声道对的两个声道不彼此相关,则差编码是无益的,因此不需要同步地块切换诸个声道。相反,更适合独立地切换声道。此外,根据本发明的另一实施例,可将所述独立或同步块切换方法应用于声道数大于或等于3的多声道组。例如,如果多声道组的所有声道彼此相关,则可以同步切换多声道组的所有声道。另一方面,如果多声道组的所有声道不彼此相关,则可以独立切换多声道组的每个声道。
此外,“bs_info”字段被用作指示块切换结果的信息。另外,“bs_info”字段也被用作指示对构成声道对的每个声道是否已独立执行或同步执行块切换的信息。在这种情形下,如上所述,可使用“bs_info”字段中的特定比特(例如第一比特)。例如,如果声道对的两个声道彼此独立,则“bs_info”字段的第一比特被置为“1”。另一方面,如果声道对的两个声道彼此同步,则“bs-info”字段的第一比特被置为“0”。
下面,将详细说明图6(a)、6(b)和6(c)。
参照图6(a),由于没有声道执行块切换,因此不产生关联的“bs_info”。
参照图6(b),声道1和2构成一个声道对,其中两个声道彼此同步并且同步执行块切换。例如,在图6(b)中,声道1和声道2被分割成长度为N/4的若干块,这些块都具有相同的bs_info“bs_info=(0)101 0000”。因此,对每个声道对发送一个“bs_info”,这导致比特率降低。此外,如果声道对是同步的,则声道对中的每个块需要彼此交织。这种交织是有益的(或有利的)。例如,一个声道对中的一个声道的块(例如图6(b)中的块1.2)依赖于来自两声道的之前的块(例如图6(b)中的块1.1和2.1),并因此这些之前的块可在当前块之前获得。
参照图6(c),声道1和2构成一个声道对。然而,在本例中,块切换是独立执行的。更具体地说,声道1被分割成大小(或长度)高达N/4的块并具有“bs_info=(1)101 0000”的bs_info。声道2被分割成大小高达N/2的块并具有“bs_info=(1)100 0000”的bs_info。在图6(c)所示例子中,在每个声道间独立地进行块切换,并因此不执行块之间的交织处理。换句话说,对于具有独立切换的块的声道,可独立地配置声道数据。
联合声道编码
联合声道编码——也被称为联合立体声——利用立体声信号的两声道之间或多声道信号的任何两个声道之间的相关性。尽管是独立地直接处理两声道x1(n)和x2(n),然而利用声道之间相关性的简单方法是编码差信号:
d(n)=x2(n)-x1(n)
每个块中的x1(n)、x2(n)和d(n)之间的切换可通过比较各信号根据哪两个信号能被最有效率地编码来实现,而不是x1(n)或x2(n)。这种用切换的差编码实现的预测在两个声道彼此非常相似的情形下是有利的。在多声道材料的情形下,可通过编码器重新配置声道以分配适当的声道对。
除了简单的差编码,无损音频编解码也支持更为复杂的方案以利用多声道信号的任意声道之间的声道间冗余。
随机存取
本发明涉及音频无损编码并能够支持随机存取。随机存取支持对已编码的音频信号任何部分的快速存取而不浪费地解码之前的部分。这是采用压缩数据的查找、编辑或流传送的场合下的一个重要特征。为了实现随机存取,在随机存取单元中,编码器需要插入一个帧,该帧能被解码而无需解码之前的帧。插入帧被称为“随机存取帧”。在该随机存取帧中,没有来自之前的帧的采样被用于预测。
下面,将详细说明根据本发明的随机存取的信息。参照配置语法(图6所示),关联于随机存取的信息作为配置信息被发送。例如,“random_access”字段被用作指示是否允许随机存取的信息,它由8比特表示。此外,如果允许随机存取,则8比特“random_access”字段指定构成随机存取单元的帧数。例如,当“random_access=0000 0000”时,不支持随机存取。换句话说,当“random_access>0”时,则支持随机存取。更具体地说,当“random_access=0000 0001”时,这指示构成随机存取单元的帧数为1。这表示在所有的帧单元中均允许随机存取。此外,当“random_access=1111 1111”时,这指示构成随机存取单元的帧数为255。因此,“random_access”信息对应于当前随机存取单元中的随机存取帧和下一随机存取单元中的随机存取帧之间的距离。这里,所述距离由帧数表达。
32比特的“ra_unit_size”字段被包含在比特流中并被发送。这里,“ra_unit_size”字段表示以字节为单位的随机存取单元的大小,并因此表示以字节为单位的从当前随机存取帧至下一随机存取帧的距离。“ra_unit_size”字段或者包含在配置语法(表6)中或者包含在帧-数据语法(表7)中。配置语法(表6)还包括指示比特流中存储“ra_unit_size”信息的位置的信息。该信息被表示为2比特的“ra_flag”字段。更具体地说,例如,当“ra_flag=00”时,这表示“ra_unit_size”信息不被存储在比特流中。当“ra_flag=01”时,这表示“ra_unit_size”信息被存储在比特流的帧数据语法(表7)中。此外,当“ra_flag=10”时,“ra_unit_size”信息被存储在比特流的配置语法(表6)。如果“ra_unit_size”信息被包含在配置语法中,这表示“ra_unit_size”信息只在比特流上发送一次并且被均等地作用于所有随机存取单元。或者,如果帧数据语法中包含“ra_unit_size”信息,这表示当前随机存取单元中的随机存取帧和下一随机存取单元中的随机存取帧内之间的距离。因此,由于距离可以改变,对比特流中的每个随机存取单元发送“ra_unit_size”信息。
因此,配置语法(表6)中的“random_access”字段也被称为第一通用消息。另外,“ra_flag”字段也被称为第二通用消息。在本发明的这个方面中,音频信号包括配置信息和多个随机存取单元,每个随机存取单元包括一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧,其中配置信息包括:指示诸帧中的两相邻随机存取帧之间的距离的第一通用信息;以及指示哪里存储每个随机存取单元的随机存取单元大小信息的第二通用信息。随机存取单元大小信息以字节表示两相邻随机存取单元之间的距离。
或者,在本发明的这个方面,一种解码音频信号的方法包括:接收具有配置信息和多个随机存取单元的音频信号,每个随机存取单元包含一个或多个音频数据帧,所述音频数据帧中的一个是随机存取帧;从配置信息读取第一通用信息,所述第一通用信息指示诸帧中两相邻随机存取帧之间的距离;并从配置信息读取第二通用信息,所述第二通用信息指示每个随机存取单元的随机存取大小信息被存储在哪里,而随机存取单元大小信息以字节表示两相邻随机存取帧之间的距离。解码器随后访问随机存取单元大小信息并使用该信息以及第一和第二全局信息以执行对音频信号中的音频数据的随机存取。
声道配置
如图3所示,音频信号包括根据本发明的多声道信息。例如,每个声道可与音频扬声器的位置形成一一对应的映射。配置语法(下面的表6)包括声道配置信息,它被表示为16比特的“chan_config_info”字段和16比特的“channels”字段。“chan_config_info”字段包括将声道映射到扬声器位置的信息而16比特的“channels”字段包括指示声道总数的信息。例如,当“channels”字段等于“0”时,这表示声道对应于单声道。当“channels”字段等于“1”时,这表示声道对应于立体声声道中的一个。另外,当“channels”字段等于或大于“2”时,这表示声道对应于多声道中的一个。
下面的表2示出构成“chan_config_info”字段的每个比特以及与之对应的每个声道的实例。更具体地说,当发送的比特流中存在相应声道的情形下,“chan_config_info”字段中的相应比特被置为“1”。或者,当发送的比特流中不存在相应声道时,“chan_config_info”字段中的相应比特被置为“0”。本发明还包括指示配置语法(表6)中是否存在“chan_config_info”字段的信息。该信息被表示为1比特的“chan_config”标志。更具体地说,“chan_config=0”指示“chan_config_info”字段不存在。而“chan_config=1”指示“chan_config_info”字段存在。因此,当“chan_config=0”时,这表示在配置语法(表6)中最近没有定义“chan_config_info”字段。
表2
扬声器位置 | 缩写 | chan_config_info中的比特位置 |
左 | L | 1 |
右 | R | 2 |
左后 | Lr | 3 |
右后 | Rr | 4 |
左侧 | Ls | 5 |
右侧 | Rs | 6 |
中央 | C | 7 |
中央后方/环绕 | S | 8 |
低频效果 | LFE | 9 |
左向下混频 | L0 | 10 |
右向下混频 | R0 | 11 |
单声混频 | M | 12 |
(预留) | 13-16 |
此外,声道配置会使相互关联的声道在音频数据的结构中或音频信号中不彼此毗邻。因此,重置声道数据以使相互关联的声道毗邻是有利的。重置声道的方法可在配置信息(表6)的chan_pos字段中给出。此外,配置信息(表6)可包括指示chan_pos字段的声道重置信息是否存在的chan_sort字段。
基于读取上述的各种声道信息,解码器处理音频信号以使正确的声道被送至正确的扬声器。
帧长度
如图3所示,根据本发明的音频信号包括多个声道或多声道。因此,当执行编码时,关于构成一个帧的多声道的数目的信息以及关于每个声道的采样数的信息被插入到比特流中并被发送。参照配置语法(表6),32比特的“samples”字段被用作指示构成每个声道的音频数据采样总数的信息。此外,16比特的“frame_length”(帧长度)字段被用作指示相应帧中的每个声道的采样数的信息。
此外,“frame_length”字段的16比特的值是通过由编码器使用的值确定的,并且被称为用户定义值。换句话说,用户定义值不是固定值,而是在编码处理时任意确定的值。例如,该值可由编码处理的用户设定。
因此,在解码处理中,当通过图2所示的多路分解部件200接收比特流时,应首先获得每个声道的帧数。该值是根据下面所示的算法得到的。
frame=samples/frame_length;
rest=samples%frame_length;
if(rest)
{
frame++;
frlen_last=rest;
}
else
frlen_last=frame_length;
更具体地说,每个声道的总帧数是通过将经由比特流发送的“samples”字段确定的每个声道的采样总数除以由“frame_length”字段确定的每个声道的一个帧中的采样数而计算得到的。例如,当由“samples”字段确定的采样总数恰好为由“frame_length”字段确定的每个帧中的采样数的倍数时,则该倍数值成为帧总数。然而,如果由“samples”字段确定的采样总数不恰好是由“frame_length”字段确定的采样数的倍数并且存在余数(或剩余数),则总帧数比倍数值增加“1”。此外,最末帧(frlen_last)的采样数被确定为余数(或剩余数)。这表示仅最末帧的采样数与其之前帧不同。通过如上所述地定义编码器和解码器之间标准化的规则,编码器可自由地确定并发送每个声道的采样总数(“samples”字段)以及每个声道的一个帧中的采样数(“frame_length”字段)。此外,解码器可通过使用发送信息上的上述算法准确地确定用于解码的每个声道的帧数。
线性预测
在本发明中,线性预测被应用于无损音频编码。图1所示的预测器160包括至少一个或多个滤波器系数以从之前的采样值预测当前的采样值。随后,第二熵编码部件180在对应于预测值和原始值之间的差的残数值上执行熵编码。另外,作用于预测器160的每个块的预测器系数值被选为来自系数估算部件120的最佳值。此外,预测器系数值被第一熵编码部件140熵编码。由第一熵编码部件和第二熵编码部件180编码的数据作为比特流的一部分由多路复用部件190插入并随后被发送。
下面将详细说明根据本发明的执行线性预测的方法。
用FIR滤波器的预测
线性预测适用于语音和音频信号处理的许多场合。在下文中基于有限脉冲响应(FIR)滤波器描述预测器160的示例性操作。然而,本例明显不构成对本发明范围的限制。
时间离散信号x(n)的当前采样可从之前的采样x(n-k)大致地预测出。本说明是通过下式给出的。
其中K是预测器的阶数。如果预测的采样接近原始采样,则残数如下所示:
它具有比x(n)本身更小的方差,因此能更有效地编码e(n)。
从输入采样的段开始在对段进行滤波前估算预测器系数的程序被成为前向自适应。在这种情形下,应当发送系数。另一方面,如果从之前处理的段或采样(例如从残数)估算系数,则参照向后自适应。向后自适应程序的优点在于:由于估算系数所需的数据是解码器可得的,因而不需要系数发送。
10阶左右的前向自适应预测方法被广泛地用于语音编码,并且同样适用于无损音频编码。大多数前向自适应无损预测方案的最大阶数仍然相当小,例如K=32。一种例外是超级音频CD的专门的1比特无损编解码,它使用高达128的预测阶数。
另一方面,具有几百个系数的向后自适应FIR滤波器通用于许多领域,例如声道均衡和回声对消。多数这些系统是基于LMS算法或其变化形式的,这些算法也被推荐用于无损音频编码。由于不一定要将预测器系数作为辅助信息发送,这类具有高阶数的基于LMS的编码方案在实践中是可行的,因此它们的数目不对数据速率产生影响。然而,向后自适应的编解码器的缺点在于:必须在编码器和解码器两者中作出适应,这使解码器明显比前向自适应情形下的解码器更为复杂。
前向自适应预测
作为本发明的示例性实施例,前向自适应预测作为一个实例被给出于本文的描述中。在前向自适应线性预测中,一般使用自相关方法或协方差方法通过系数估算部件120估算每个块的最佳预测器参数hk(根据残数的最小方差)。使用传统的Levinson-Durbin算法的自相关方法的额外优点是提供一种迭代地适应预测器阶数的简单方法。此外,该算法本身也计算相应的部分自相关系数。
前向自适应预测的另一方面是确定合适的预测阶数。阶数增加使预测误差的方差减少,这导致残数的较小比特率Re。另一方面,预测器系数的比特率Rc随着要被发送的系数的数目而提高。因此,其任务是找到使总比特率最小的最佳阶数。这可通过相对预测阶数K使下式最小来表达:
Rtotal(K)=Re(K)+Rc(K),
由于预测增益随着更高的阶数单调上升,因此Re随着K值下降。另一方面,由于要发送数量递增的系数,因此Rc单调地随着K值上升。
最佳阶数的搜索可通过系数估算部件120被高效率地执行,所述系数估算部件120用递增的阶数递归地确定所有预测器。对于每个阶数计算预测器系数的完整组。另外,可推导出相应残数的方差σe 2变化,这导致残数的可望比特率的估算。可在每次重复过程中——例如对于每个预测阶数——确定总比特率连同诸个系数的比特率。最佳阶数被发现于总比特率不再减少的那个点上。
尽管从上式可以清楚知道系数比特率对总比特率具有直接的影响,然而Rc较慢的增加还使Rtotal的最小值偏移至较高的阶(其中Re同样较小),这实现更好的压缩。因此,预测器系数的高效并且仍旧准确的量化在实现最大压缩过程中扮演一个重要的角色。
预测阶数
在本发明中确定预测阶数K,所述预测阶数K确定线性预测的预测器系数的数目。预测阶数K还通过系数估算部件120予以确定。这里,关于确定的预测阶数的信息被包含在比特流中并随后被发送。
配置语法(表6)包括关联于预测阶数K的信息。例如,1比特至10比特的“max_order”字段对应于指示最大阶数值的信息。1比特至10比特的“max_order”字段的最高值是K=1023(例如10比特)。作为关联于预测阶数K的另一消息,配置语法(表6)包括1比特的“adapt_order”字段,它指示每个块是否存在最佳阶数。例如,当“adapt_order=1”时,可以给每个块提供最佳阶数。在block_data语法(表8)中,最佳阶数被提供为1比特至10比特的“opt_order”字段。此外,当“adapt_order=0”时,则不对每个块提供单独的最佳阶数。在这种情形下,“max_order”字段成为被作用于所有块的最末阶数。
最佳阶数(opt_order)基于max_order字段值和相应块的大小(NB)得以确定。更具体地说,例如当max_order被确定为Kmax=10并且“adapt_order=1”时,则考虑相应块的大小即可确定每个块的opt_order。在某些情形下,opt_order值可能会大于max_order(Kmax=10)。
尤其,本发明涉及更高的预测阶数。根据本发明的实施例,在没有分层块切换的情形下,在长块长度和短块长度之间可以存在4的倍数(例如4096&1024或8192&2048)。另一方面,在采用分层块切换的实施例中,该倍数可以增加(例如高达32),从而实现更大的范围(例如对于16384下至512或甚至高采样速率的32768-1024)。
在执行分层块切换的实施例中,为了更好地使用非常长的块,可采用更高的最大预测阶数。最大阶数可以是Kmax=1023。在本实施例中,Kmax可由块长度NB限定,例如Kmax<NB/8(例如当NB=2048时,Kmax=255)。因此,使用Kmax=1023需要至少NB=8192的块长度。在本实施例中,配置语法(表6)中的“max_order”字段可高达10比特而block_data语法(表8)中的“opt_order”字段同样可高达10比特。具体块中的实际比特数取决于一个块所允许的最大阶数。如果该块是短块,本地预测阶数可小于全局预测阶数。这里,本地预测阶数是通过考虑相应块长度NB确定的,而全局预测阶数是通过配置语法中的“max_order”Kmax确定的。例如,如果Kmax=1023,但NB=2048,由于本地预测阶数为255,“opt_order”字段被确定为8比特(而不是10比特)。
更具体地说,可基于下式确定opt_order:
opt_order=min(全局预测阶数,本地预测阶数);
另外,全局和本地预测阶数可通过下式确定:
全局预测阶数=ceil(log2(最大预测阶数+1))
本地预测阶数=max(ceil(log2((Nb>>3)-1)),1)
在本实施例中,预测来自一个声道的再分块的数据采样。使用之前块的最末K个采样预测当前块的第一采样。K值是基于从上述等式推导出的opt_order确定的。
如果当前块是声道的第一个块,则没有来自之前块的采样以供使用。在这种情形下,采用具有渐进阶数(progressive order)的预测。例如,假设相应块的opt_order值为K=5,则块中的第一采样不执行预测。块的第二采样使用块的第一采样以执行预测(如同k=1),块的第三采样使用块的第一采样和第二采样以执行预测(如同k=2)等。因此,从第六采样开始的以及在这之后的采样,根据k=5的opt_order执行预测。如上所述,预测阶数从k=1至k=5渐进地增加。
当用于随机存取帧时,上述渐进阶数型预测是非常有利的。由于随机存取帧对应于随机存取单元的基准帧,随机存取帧不通过使用之前的帧采样执行预测。即,该渐进预测技术可应用于随机存取帧的开头。
预测器系数的量化
上述预测器系数在图1的量化部件130中被量化。由于非常小的量化误差也会导致最佳预测滤波器的要求频谱特性的很大的偏差,因此预测系数hk的直接量化对发送而言不是非常有效的。为此,预测器系数的量化基于通过系数估算部件120计算得到的部分自相关(反映)系数rk。如上所述,例如系数估算部件120是使用传统Levinson-Durbin算法处理的。
开头的两个部分自相关系数(对应γ1和γ2)通过使用下面的函数被量化:
而其余系数是使用简单的7比特的均匀量化器量化的:
αk=64γk; (k>2).
在所有情形下,结果量化值αk被约束在范围[-64,63]内。
熵编码
如同1所示,两种类型的熵编码被用于本发明。更具体地说,第一熵编码部件140用于编码上述预测器系数。另外,第二熵编码部件180用来编码上述音频原始采样和音频残数采样。在下文中将详细说明这两种熵编码。
预测器系数的第一熵编码
相关技术的Rice码被用作根据本发明的第一熵编码方法。例如,量化系数ak的发送是通过生成残数值执行的:
δk=ak-offsetk
它是通过使用第一熵编码部件140编码的,例如Rice码方法。用于该处理的Rice码的相应偏移和参数可从下述表3、4和5所示的诸组中的一个全局地进行选择。表索引(即2比特的“coef_table”)在配置语法中给出(表6)。如果“coef_table=11”,这表示不采用熵编码,并且量化的系数每次7比特地发送。在这种情形下,偏移一直为-64以获得局限于[0,127]的无符号值δk=ak+64。相反,如果“coeff_table=00”,则选择下面的表3,并且如果“coeff_table=01”,则选择下面的表4。最后,如果“coeff_table=10”,则选择表5。
当接收到图2的解码器中的经量化系数时,第一熵解码部件220通过使用将残数值δk与偏移组合以生成部分自相关系数ak的量化索引的处理来重构预测器系数:
ak=δk+offsetk
此后,使用下面的等式执行开头的两个系数(γ1和γ2)的重构:
其中2Q表示重构的系数的整数表示所需的常数(Q=20)缩放因数,而Γ(.)是根据经验确定的映射表(未示出为映射表是因为会根据场合而变化)。
因此,根据采样频率提供用于第一熵编码的这三种系数表。例如,采样频率可被分成48kHz、96kHz和192kHz。这里,三个表3、4、5被分别提供给每个采样频率。
作为使用一个表的代替,可对整个文件选择三个不同表中的一个。一般根据采样速率选择表。对于44.1kHz的材料,本发明的申请人推荐使用48kHz表。然而,总地来说,也可通过其它标准选择表。
表3:用于编码量化系数(48kHz)的Rice码参数
系数# | 偏移 | Rice参数 |
1 | -52 | 4 |
2 | -29 | 5 |
3 | -31 | 4 |
4 | 19 | 4 |
5 | -16 | 4 |
6 | 12 | 3 |
7 | -7 | 3 |
8 | 9 | 3 |
9 | -5 | 3 |
10 | 6 | 3 |
11 | -4 | 3 |
12 | 3 | 3 |
13 | -3 | 2 |
14 | 3 | 2 |
15 | -2 | 2 |
16 | 3 | 2 |
17 | -1 | 2 |
18 | 2 | 2 |
19 | -1 | 2 |
20 | 2 | 2 |
2k-1,k>10 | 0 | 2 |
2k,k>10 | 1 | 2 |
表4:用于编码量化系数(96kHz)的Rice码参数
系数# | 偏移 | Rice参数 |
1 | -58 | 3 |
2 | -42 | 4 |
3 | -46 | 4 |
4 | 37 | 5 |
5 | -36 | 4 |
6 | 29 | 4 |
7 | -29 | 4 |
8 | 25 | 4 |
9 | -23 | 4 |
10 | 20 | 4 |
11 | -17 | 4 |
12 | 16 | 4 |
13 | -12 | 4 |
14 | 12 | 3 |
15 | -10 | 4 |
16 | 7 | 3 |
17 | -4 | 4 |
18 | 3 | 3 |
19 | -1 | 3 |
20 | 1 | 3 |
2k-1,k>10 | 0 | 2 |
2k,k>10 | 1 | 2 |
表5;用于编码量化系数(192kHz)的Rice码参数
系数# | 偏移 | Rice参数 |
1 | -59 | 3 |
2 | -45 | 5 |
3 | -50 | 4 |
4 | 38 | 4 |
5 | -39 | 4 |
6 | 32 | 4 |
7 | -30 | 4 |
8 | 25 | 3 |
9 | -23 | 3 |
10 | 20 | 3 |
11 | -20 | 3 |
12 | 16 | 3 |
13 | -13 | 3 |
14 | 10 | 3 |
15 | -7 | 3 |
16 | 3 | 3 |
17 | 0 | 3 |
18 | -1 | 3 |
19 | 2 | 3 |
20 | -1 | 2 |
2k-1,k>10 | 0 | 2 |
2k,k>10 | 1 | 2 |
残数的第二熵编码
本发明包含适用于图1的第二熵编码部件180的编码方法的两种不同的模式,这将在下面予以详细说明。
在简单模式中,使用Rice码对残数值e(n)进行熵编码。对于每个块,或者使用相同的Rice码编码所有的值,或者将块进一步分成四个部分,每个部分用不同的Rice码编码。如图1所示那样发送这种应用的代码索引。由于存在不同的方法以确定所给出的数据组的最佳Rice码,因此编码器根据残数的统计选择合适的代码。
或者,编码器可使用基于BGMC模式的更为复杂和高效的编码方案。在BGMC模式中,残数的编码是通过将分布曲线划分成两种类型实现的。这两种类型包括属于分布的中心区域的残数|e(n)|<emax,以及属于其尾端的残数。尾端的残数可简单地仅重定中心(即对于e(n)>emax,则提供et(n)=e(n)-emax)并使用如上所述的Rice码编码。然而,为了编码处于分布曲线中心的残数,BGMC首先将残数分成LSB和MSB部分,随后BGMC使用分组Gilbert_Moore(算术)码编码MSB。最后,BGMC使用固定长度的直接代码发送LSB。可选择直接发送的LSB的参数emax和数目以使它们仅略微地影响这种方案的编码效率,同时使编码的复杂度明显降低。
根据本发明的配置语法(表6)和block_data语法(表8)包括关联于Rice码和BGMC码的编码的信息。现在对这种信息进行详细说明。
配置语法(表6)首先包括1比特的“bgmc_mode”字段。例如,“bgmc_mode”=0表示Rice码。配置语法(表6)还包括1比特的“sb_part”字段。“sb_part”字段对应于与将块分割成子块并对分割的子块编码的方法相关的信息。这里,“sb_part”的意义根据“bgmc_mode”字段值而改变。
例如,当“bgmc_mode=0”时,也就是当采用Rice码时,“sb_part=0”表示块不被分割成子块。另外,“sb_part=1”表示以1∶4子块分割比分割块。另外,当“bgmc_mode=1”时,也就是当采用BGMC码时,“sb_part=0”表示以1∶4子块分割比分割块。或者,“sb_part=1”表示以1∶2∶4∶8子块分割比分割块。
与包含在配置语法(表6)中的信息对应的每个块的Block_data语法(表8)包括0比特至2比特的可变“ec_sub”字段。更具体地说,“ec_sub”字段表示存在于实际相应块中的子块的数目。这里,“ec_sub”字段的意义根据配置语法(表6)中的“bgmc_mode”字段+“sb_part”字段的值而变化。
例如,“bgmc_mode+sb_part=0”表示Rice码不配置子块。这里,“ec_sub”字段是0比特字段,这表示不包含任何信息。
另外,“bgmc_mode+sb_part=1”表示Rice码或BGMC码用来以1∶4的比例将块分割成若干子块。这里,只有1比特被分配给“ec_sub”字段。例如,“ec_sub=0”表示一个子块(即该块不被分割成若干子块),而“ec_sub=1”指示以配置4个子块。
此外,“bgmc_mode+sb_part=2”表示BGMC码被用来以1∶2∶4∶8的比例将块分割成若干子块。这里,2比特被分配给“ec_sub”字段。例如,“ec_sub=0”表示一个子块(即该块不被分割成若干子块),而“ec_sub=01”指示2个子块。另外,“ec_sub=10”指示4个子块,而“ec_sub=11”指示8个子块。
如上所述定义在每个块中的子块使用不同的编码方法由第二熵编码部件180编码。下面描述使用Rice码的一个实例。对于残数值的每个块,或者使用同样的Rice码编码所有值,或者如果设定配置语法中的“sb_part”字段则块被分割成四个子块,每个编码的子块具有不同的Rice码。在后一种情形下,块数据语法(表8)中的“ec_sub”字段表示是使用一个块还是四个块。
尽管第一子块的参数s[i=0]或者用4比特(分辨率≤16比特)或者用5比特(分辨率>16比特)被直接发送,然而仅发送下列参数s[i>0]的差(s[i]-s[i-1])。使用适当选择的Rice码再次编码这些差。在这种情形下,用作差的Rice码参数具有值“0”。
语法
根据本发明的实施例,包含在音频比特流中的各种信息的语法示出于下表中。表6示出音频无损编码的配置语法。这种配置语法可形成分周期地处于比特流中的帧头,可形成每个帧的帧头等。表7示出一种帧-数据语法,而表8示出一种块-数据语法。
表6:配置语法
语法 | 比特 |
ALSSpecificConfig(){samp_freq;samples;channels;file_type;resolution;floating;msb_first;frame_length;random_access;ra_flag;adapt_order;coef_table;long_term_prediction;max_order;block_switching;bgmc_mode;sb_part;joint_stereo;mc_coding ;chan_config;chan_sort;crc_enabled;RLSLMS(reserved)if(chan_config){chan_config_info;}if(chan_sort){for(c=0;c<channels;c++)chan_pos[c];}header_size ;trailer_size;orig_header[]; | 323216331116821211021111111161681616header_size*8 |
orig_trailer[];if(crc_enabled){crc;}if((ra_flag==2)&&(random_access>0)){for(f=0;f<(samples-1/frame_length)+1;f++){ra_unit_size}}} | trailer_size*83232 |
表7:Frame_data语法
语法 | 比特 |
frame_data(){if((ra_flag==1)&&(frame_id%random_access==0)) {ra_unit_size}if(mc_coding&&joint_stereo){js_switch;byte_align;}if(!mc_coding||js_switch){for(c=0;c<channels;c++){if(block_switching){bs_info;}if(independent_bs){for(b=0;b<blocks;b++){block_data(c);}}else{for(b=0;b<blocks;b++){block_data(c);block_data(c+1);}c++;}}else{ | 3218,16,32 |
if(block_switching){bs_info;}for(b=0;b<blocks;b++){for(c=0;c<channels;c++){block_data(c);channel_data(c);}}}if(floating){num_bytes_diff_float;diff_float_data();}} | 8,16,3232 |
表8:Block_data语法
语法 | 比特 |
block_data(){block_type;if(block_type==0){const_block;js_block;(reserved)if(const_block==1){{if(resolution==8){const_val;}else if(resolution==16){const_val;}else if(resolution==24){const_val;}else{const_val;}}}else{js_block ;if((bgmc_mode==0)&&(sb_part==0){sub_blocks=1; | 111581624321 |
}else if((bgmc_mode==1)&&(sb_part==1){ec_sub;sub_blocks=1<<ec_sub;}else{ec_sub;sub_blocks=(ec_sub==1)?4:1;}if(bgmc_mcde==0){for(k=0;k<sub_blocks,k++){s[k];}}else{for(k=0;k<sub_blocks;k++){s[k],sx[k];}}sb_length=block_length/sub_blocks;shift_lsbs;if(shift_lsbs==1){shift_pos;}if(!RLSLMS){if(adapt_order==1){opt_order;}for(p=0;p<opt_order;p++){quant_cof[p];}} | 21variesvaries141...10varies |
压缩结果
下面,将无损音频编解码与两种最流行的无损音频压缩程序——即开放源代码编解码FLAC和Money式音频(MAC 3.97)作比较。这里,开放源代码编解码FLAC使用前向自适应预测,而Monkey式音频(MAC3.97)是作为压缩方面的当前技术发展水平的向后自适应编解码。两种编解码方案均涉及提供最大的压缩的选项(即flac-8和mac-c4000)。编码器的结果确定中等压缩水平(其预测阶数限制于K_60)以及最大压缩水平(K_1023),两者均具有500ms的随机存取。测试执行于1024MB内存的1.7GHz奔腾-M系统。测试包括具有48、96和192kHz的采样速率和16、24比特分辨率的将近1GB的立体声波形数据。
压缩比
下面,压缩比被定义为:
C=[(压缩的文件大小)/(原始文件大小)]*100%
其中更小的值代表更好的压缩。检测的音频格式的结果示出于表9(FLAC编解码不支持192kHz的资料)。
表9:不同音频格式的平均压缩比的比较(kHz/比特)
格式 | FLAC | MAC | ALS平均 | ALS最大 |
48/16 | 48.6 | 45.3 | 45.5 | 44.7 |
48/24 | 68.4 | 63.2 | 63.3 | 62.7 |
96/24 | 56.7 | 48.1 | 46.5 | 46.2 |
192/24 | - | 39.1 | 37.7 | 37.6 |
总共 | - | 48.9 | 48.3 | 47.8 |
该结果表示最高水平的ALS胜过所有格式的FLAC和Monkey式音频,但尤其适用于高分辨率资料(例如96kHz/24比特及以上)。即使在中等水平,ALS也提供最好的总压缩性。
复杂度
不同编解码的复杂度强烈地取决于实际应用,尤其是编码器的应用。如前面提到的那样,本发明的音频信号编码器正处于发展中。因此,我们将我们的分析局限于解码器、简单的C语言代码实现而不作进一步的优化。压缩的数据是通过当前最佳的编码器实现产生的。图10中示出以不同复杂程度编码的用于各种音频格式实时解码的平均CPU负载。即使是最大复杂度,解码器的CPU负载仅在20-25%左右,这表示基于文件的解码比实时解码快至少4-5倍。
表10:平均CPU负载(在1.7GHz奔腾-M上的百分比),取决于音频格式(kHz/比特)和ALS编码器复杂度。
格式 | ALS低 | ALS平均 | ALS最大 |
48/16 | 1.6 | 4.9 | 18.7 |
48/24 | 1.8 | 5.8 | 19.6 |
96/24 | 3.6 | 12.0 | 23.8 |
192/24 | 6.7 | 22.8 | 26.7 |
编解码器被设计成提供大范围的复杂程度。尽管最大复杂程度以最低的编码和解码速度的代价实现最高的压缩,然而更快的中等复杂程度仅略微地损害压缩性,但对于最大程度而言(即48kHz资料的将近5%的CPU负载),解码的复杂度明显降低。适用低复杂度水平(即K_15,Rice编码)相比中等程度仅使压缩性降低1-1.5%,但是解码复杂性进一步降低3倍(即对48kHz资料而言小于2%CPU负载)。因此,音频数据即使在计算能力很低的硬件上也能被解码。
尽管编码器复杂度可能因为更高的最大阶数和更精良的块切换算法而增加(根据实施例),然而解码器更容易受到较高的平均预测阶数的影响。
前面的实施例(例如分层块切换)和优点仅为示例性的并且不被解释为对所附权利要求书构成限制。上述原理可应用于其它装置和方法,并为业内技术人员所理解。许多选择、修改和变化对本领域内技术人员而言是明显的。
工业应用
本领域内技术人员可以理解可对本发明作出各种修改和变化而不脱离本发明的精神或范围。例如,本发明的诸方面和实施例可轻易地适用于另一音频信号编解码器,例如无损音频信号编解码器。因此,本发明旨在覆盖本发明所有这些修改和变化。
Claims (16)
1.一种处理音频信号的方法,所述方法包括:
将声道映射信息添加至音频信号的配置信息,所述声道映射信息指示音频信号中的每个声道被映射至再现装置中的哪个扬声器。
2.如权利要求1所述的方法,其特征在于,所述声道映射信息包括多个比特,而每个比特与扬声器关联并指示是否有声道存在于已关联的扬声器的音频信号中。
3.如权利要求2所述的方法,其特征在于,所述多个比特为16比特。
4.如权利要求1所述的方法,其特征在于,还包括:
将指示符添加于配置信息,所述指示符指示配置信息中是否包含声道映射信息。
5.如权利要求1所述的方法,其特征在于,还包括:
如果声道的音频数据被重置,则将声道重置信息添加于配置信息,所述声道重置信息指示声道的音频数据的重置。
6.如权利要求5所述的方法,其特征在于,还包括:
将指示符添加至配置信息,所述指示符指示配置信息中是否包含声道重置信息。
7.如权利要求1所述的方法,其特征在于,还包括:
将声道信息添加至配置信息,所述声道信息指示音频信号中的声道数。
8.一种处理音频信号的方法,所述方法包括:
接收具有配置信息和多个声道的音频信号;
从配置信息读取声道映射信息,所述声道映射信息指示音频信号中的每个声道被映射至再现装置中的哪个扬声器;以及
基于声道映射信息处理多个声道。
9.如权利要求8所述的方法,其特征在于,所述声道映射信息包括多个比特,每个比特与扬声器关联并指示已关联的扬声器的音频信号中是否存在声道。
10.如权利要求9所述的方法,其特征在于,所述多个比特为16比特。
11.如权利要求8所述的方法,其特征在于,还包括:
从配置信息读取一指示符,所述指示符指示在配置信息中是否包含声道映射信息;以及
基于指示符执行读取声道映射信息的步骤。
12.如权利要求8所述的方法,其特征在于,还包括:
从配置信息读取声道重置信息,所述声道重置信息指示多个声道的音频数据的重置;并且其中
处理声道的步骤基于声道映射信息和声道重置信息处理声道。
13.如权利要求12所述的方法,其特征在于,还包括:
从配置信息读取指示符,所述指示符指示配置信息中是否包含声道重置信息;以及
基于指示符执行读取声道重置信息的步骤。
14.如权利要求8所述的方法,其特征在于,还包括:
从配置信息读取声道信息,所述声道信息指示音频信号中的声道数;并且其中
处理声道的步骤基于声道映射信息和声道信息处理声道。
15.一种处理音频信号的装置,包括:
编码器,所述编码器被配置成将声道映射信息添加至音频信号的配置信息,所述声道映射信息指示音频信号中的每个声道被映射至再现装置中的哪个扬声器。
16.一种处理音频信号的装置,包括:
解码器,被配置成接收具有配置信息和多个声道的音频信号,并从配置信息读取声道映射消息,所述声道映射消息指示音频信号中的每个声道被映射到再现装置中的哪个扬声器;以及
解码器,被配置成基于声道映射信息处理诸声道。
Applications Claiming Priority (17)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US69755105P | 2005-07-11 | 2005-07-11 | |
US60/697,551 | 2005-07-11 | ||
PCT/KR2005/002290 WO2007011078A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002292 WO2007011080A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
PCT/KR2005/002291 WO2007011079A1 (en) | 2005-07-16 | 2005-07-16 | Apparatus and method of encoding and decoding audio signal |
KRPCT/KR2005/002292 | 2005-07-16 | ||
KRPCT/KR2005/002291 | 2005-07-16 | ||
KRPCT/KR2005/002290 | 2005-07-16 | ||
KRPCT/KR2005/002308 | 2005-07-18 | ||
PCT/KR2005/002308 WO2007011085A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
KRPCT/KR2005/002307 | 2005-07-18 | ||
PCT/KR2005/002307 WO2007011084A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
KRPCT/KR2005/002306 | 2005-07-18 | ||
PCT/KR2005/002306 WO2007011083A1 (en) | 2005-07-18 | 2005-07-18 | Apparatus and method of encoding and decoding audio signal |
US70057005P | 2005-07-19 | 2005-07-19 | |
US60/700,570 | 2005-07-19 | ||
PCT/KR2006/002688 WO2007008010A1 (en) | 2005-07-11 | 2006-07-10 | Apparatus and method of processing an audio signal |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101218852A true CN101218852A (zh) | 2008-07-09 |
Family
ID=37637332
Family Applications (14)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200680028892XA Pending CN101238509A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CN2006800252699A Expired - Fee Related CN101218630B (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800305412A Pending CN101243497A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800305111A Pending CN101243494A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CN2006800294070A Expired - Fee Related CN101243496B (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800304693A Pending CN101243492A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800305499A Pending CN101243495A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800251376A Pending CN101218631A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA200680024866XA Pending CN101218852A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800294174A Pending CN101243489A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800289829A Pending CN101238510A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800251395A Pending CN101218629A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CN2006800251380A Expired - Fee Related CN101218628B (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800304797A Pending CN101243493A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
Family Applications Before (8)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA200680028892XA Pending CN101238509A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CN2006800252699A Expired - Fee Related CN101218630B (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800305412A Pending CN101243497A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800305111A Pending CN101243494A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CN2006800294070A Expired - Fee Related CN101243496B (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800304693A Pending CN101243492A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800305499A Pending CN101243495A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800251376A Pending CN101218631A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
Family Applications After (5)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2006800294174A Pending CN101243489A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800289829A Pending CN101238510A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CNA2006800251395A Pending CN101218629A (zh) | 2005-07-11 | 2006-07-10 | 处理音频信号的装置和方法 |
CN2006800251380A Expired - Fee Related CN101218628B (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
CNA2006800304797A Pending CN101243493A (zh) | 2005-07-11 | 2006-07-10 | 编码和解码音频信号的装置和方法 |
Country Status (5)
Country | Link |
---|---|
US (36) | US8032240B2 (zh) |
EP (14) | EP1913585A4 (zh) |
JP (14) | JP2009500681A (zh) |
CN (14) | CN101238509A (zh) |
WO (14) | WO2007008008A2 (zh) |
Families Citing this family (74)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7182738B2 (en) | 2003-04-23 | 2007-02-27 | Marctec, Llc | Patient monitoring apparatus and method for orthosis and other devices |
WO2005083684A1 (en) * | 2004-02-19 | 2005-09-09 | Koninklijke Philips Electronics N.V. | Decoding scheme for variable block length signals |
US7930184B2 (en) | 2004-08-04 | 2011-04-19 | Dts, Inc. | Multi-channel audio coding/decoding of random access points and transients |
US8433581B2 (en) * | 2005-04-28 | 2013-04-30 | Panasonic Corporation | Audio encoding device and audio encoding method |
CN101185123B (zh) * | 2005-05-31 | 2011-07-13 | 松下电器产业株式会社 | 可扩展编码装置及可扩展编码方法 |
US8032240B2 (en) * | 2005-07-11 | 2011-10-04 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
WO2007049881A1 (en) * | 2005-10-26 | 2007-05-03 | Lg Electronics Inc. | Method for encoding and decoding multi-channel audio signal and apparatus thereof |
JP4193865B2 (ja) * | 2006-04-27 | 2008-12-10 | ソニー株式会社 | デジタル信号切換え装置及びその切換え方法 |
JP4769665B2 (ja) * | 2006-08-29 | 2011-09-07 | パナソニック株式会社 | 音楽再生装置および音楽再生端末 |
US9053753B2 (en) * | 2006-11-09 | 2015-06-09 | Broadcom Corporation | Method and system for a flexible multiplexer and mixer |
US20080114478A1 (en) * | 2006-11-09 | 2008-05-15 | David Wu | Method and System for Multi-Channel PCM Audio Grouping in Hardware |
US8521540B2 (en) * | 2007-08-17 | 2013-08-27 | Qualcomm Incorporated | Encoding and/or decoding digital signals using a permutation value |
KR101385956B1 (ko) * | 2007-08-31 | 2014-04-17 | 삼성전자주식회사 | 미디어 신호 인코딩/디코딩 방법 및 장치 |
WO2009072685A1 (en) * | 2007-12-06 | 2009-06-11 | Lg Electronics Inc. | A method and an apparatus for processing an audio signal |
US8972247B2 (en) * | 2007-12-26 | 2015-03-03 | Marvell World Trade Ltd. | Selection of speech encoding scheme in wireless communication terminals |
ES2739667T3 (es) * | 2008-03-10 | 2020-02-03 | Fraunhofer Ges Forschung | Dispositivo y método para manipular una señal de audio que tiene un evento transitorio |
US20090268678A1 (en) * | 2008-04-24 | 2009-10-29 | Fujitsu Limited | Method and apparatus for automatic gain control in a mobile orthogonal frequency division multiple access (ofdma) network |
EP2144231A1 (en) * | 2008-07-11 | 2010-01-13 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Low bitrate audio encoding/decoding scheme with common preprocessing |
JP5253518B2 (ja) * | 2008-12-22 | 2013-07-31 | 日本電信電話株式会社 | 符号化方法、復号方法、それらの装置、プログラム及び記録媒体 |
US8576910B2 (en) * | 2009-01-23 | 2013-11-05 | Nippon Telegraph And Telephone Corporation | Parameter selection method, parameter selection apparatus, program, and recording medium |
KR101622950B1 (ko) * | 2009-01-28 | 2016-05-23 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 그 장치 |
AR075199A1 (es) * | 2009-01-28 | 2011-03-16 | Fraunhofer Ges Forschung | Codificador de audio decodificador de audio informacion de audio codificada metodos para la codificacion y decodificacion de una senal de audio y programa de computadora |
CN101609680B (zh) * | 2009-06-01 | 2012-01-04 | 华为技术有限公司 | 压缩编码和解码的方法、编码器和解码器以及编码装置 |
JP5355690B2 (ja) * | 2009-06-01 | 2013-11-27 | 三菱電機株式会社 | 信号処理装置 |
US20100324913A1 (en) * | 2009-06-18 | 2010-12-23 | Jacek Piotr Stachurski | Method and System for Block Adaptive Fractional-Bit Per Sample Encoding |
TWI413110B (zh) * | 2009-10-06 | 2013-10-21 | Dolby Int Ab | 以選擇性通道解碼的有效多通道信號處理 |
US8207875B2 (en) * | 2009-10-28 | 2012-06-26 | Motorola Mobility, Inc. | Encoder that optimizes bit allocation for information sub-parts |
CA2803269A1 (en) * | 2010-07-05 | 2012-01-12 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, device, program, and recording medium |
JP5337305B2 (ja) * | 2010-07-05 | 2013-11-06 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体 |
CN103270553B (zh) | 2010-08-12 | 2015-08-12 | 弗兰霍菲尔运输应用研究公司 | 对正交镜像滤波器式音频编译码器的输出信号的重新取样 |
MY155997A (en) * | 2010-10-06 | 2015-12-31 | Fraunhofer Ges Forschung | Apparatus and method for processing an audio signal and for providing a higher temporal granularity for a combined unified speech and audio codec (usac) |
US8842842B2 (en) * | 2011-02-01 | 2014-09-23 | Apple Inc. | Detection of audio channel configuration |
EP2686848A1 (en) * | 2011-03-18 | 2014-01-22 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frame element positioning in frames of a bitstream representing audio content |
CN102761735B (zh) * | 2011-04-25 | 2014-12-24 | 中国科学院微电子研究所 | 编码方法及装置、图像压缩方法及系统 |
CN102810314B (zh) * | 2011-06-02 | 2014-05-07 | 华为终端有限公司 | 音频编码方法及装置、音频解码方法及装置、编解码系统 |
CN102368385B (zh) * | 2011-09-07 | 2013-08-14 | 中科开元信息技术(北京)有限公司 | 后向块自适应Golomb-Rice编解码方法及装置 |
US9799339B2 (en) * | 2012-05-29 | 2017-10-24 | Nokia Technologies Oy | Stereo audio signal encoder |
US9865269B2 (en) * | 2012-07-19 | 2018-01-09 | Nokia Technologies Oy | Stereo audio signal encoder |
US10346784B1 (en) | 2012-07-27 | 2019-07-09 | Google Llc | Near-term delivery system performance simulation |
KR102049602B1 (ko) * | 2012-11-20 | 2019-11-27 | 한국전자통신연구원 | 멀티미디어 데이터 생성 장치 및 방법, 멀티미디어 데이터 재생 장치 및 방법 |
US10178489B2 (en) * | 2013-02-08 | 2019-01-08 | Qualcomm Incorporated | Signaling audio rendering information in a bitstream |
JP6377730B2 (ja) * | 2013-06-05 | 2018-08-22 | ドルビー・インターナショナル・アーベー | オーディオ信号を符号化する方法及び装置並びにオーディオ信号を復号する方法及び装置 |
EP2830058A1 (en) | 2013-07-22 | 2015-01-28 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Frequency-domain audio coding supporting transform length switching |
EP2838086A1 (en) | 2013-07-22 | 2015-02-18 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | In an reduction of comb filter artifacts in multi-channel downmix with adaptive phase alignment |
EP2830332A3 (en) | 2013-07-22 | 2015-03-11 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method, signal processing unit, and computer program for mapping a plurality of input channels of an input channel configuration to output channels of an output channel configuration |
EP2830061A1 (en) * | 2013-07-22 | 2015-01-28 | Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping |
US10075266B2 (en) * | 2013-10-09 | 2018-09-11 | Qualcomm Incorporated | Data transmission scheme with unequal code block sizes |
EP2866227A1 (en) | 2013-10-22 | 2015-04-29 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Method for decoding and encoding a downmix matrix, method for presenting audio content, encoder and decoder for a downmix matrix, audio encoder and audio decoder |
ES2770407T3 (es) * | 2014-01-24 | 2020-07-01 | Nippon Telegraph & Telephone | Aparato, método, programa y soporte de registro de análisis predictivo lineal |
KR101850529B1 (ko) * | 2014-01-24 | 2018-04-19 | 니폰 덴신 덴와 가부시끼가이샤 | 선형 예측 분석 장치, 방법, 프로그램 및 기록 매체 |
CN106409300B (zh) | 2014-03-19 | 2019-12-24 | 华为技术有限公司 | 用于信号处理的方法和装置 |
WO2015200498A1 (en) * | 2014-06-24 | 2015-12-30 | Hotel Trader LLC | Reservation exchange server system |
CA2956957C (en) * | 2014-08-07 | 2019-02-12 | ONE Media, LLC | Dynamic configuration of a flexible orthogonal frequency division multiplexing phy transport data frame |
CA2955611C (en) | 2014-08-07 | 2022-03-22 | Coherent Logix, Incorporated | Multi-partition radio frames |
CN105632503B (zh) * | 2014-10-28 | 2019-09-03 | 南宁富桂精密工业有限公司 | 信息隐藏方法及系统 |
CN104392725A (zh) * | 2014-12-02 | 2015-03-04 | 中科开元信息技术(北京)有限公司 | 多声道无损音频混合编解码方法及装置 |
CN106033671B (zh) * | 2015-03-09 | 2020-11-06 | 华为技术有限公司 | 确定声道间时间差参数的方法和装置 |
US10500739B2 (en) * | 2015-11-13 | 2019-12-10 | Ethicon Llc | Robotic surgical system |
CN106131550B (zh) * | 2016-07-25 | 2020-02-14 | 合一网络技术(北京)有限公司 | 播放多媒体文件的方法及装置 |
CN107221334B (zh) * | 2016-11-01 | 2020-12-29 | 武汉大学深圳研究院 | 一种音频带宽扩展的方法及扩展装置 |
EP3324407A1 (en) * | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a ratio as a separation characteristic |
EP3324406A1 (en) | 2016-11-17 | 2018-05-23 | Fraunhofer Gesellschaft zur Förderung der Angewand | Apparatus and method for decomposing an audio signal using a variable threshold |
EP3382700A1 (en) * | 2017-03-31 | 2018-10-03 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Apparatus and method for post-processing an audio signal using a transient location detection |
CN109389984B (zh) | 2017-08-10 | 2021-09-14 | 华为技术有限公司 | 时域立体声编解码方法和相关产品 |
CN109389987B (zh) * | 2017-08-10 | 2022-05-10 | 华为技术有限公司 | 音频编解码模式确定方法和相关产品 |
CN109859766B (zh) | 2017-11-30 | 2021-08-20 | 华为技术有限公司 | 音频编解码方法和相关产品 |
KR20210021968A (ko) | 2018-06-25 | 2021-03-02 | 소니 세미컨덕터 솔루션즈 가부시키가이샤 | 정보 처리 장치, 정보 처리 시스템, 프로그램 및 정보 처리 방법 |
US11545165B2 (en) * | 2018-07-03 | 2023-01-03 | Panasonic Intellectual Property Corporation Of America | Encoding device and encoding method using a determined prediction parameter based on an energy difference between channels |
PH12019000380A1 (en) * | 2018-12-17 | 2020-09-28 | Nokia Technologies Oy | An apparatus, a method and a computer program for video coding and decoding |
WO2020164752A1 (en) * | 2019-02-13 | 2020-08-20 | Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. | Audio transmitter processor, audio receiver processor and related methods and computer programs |
TW202102010A (zh) | 2019-05-24 | 2021-01-01 | 瑞典商赫爾桑茲股份有限公司 | 用於無損資料壓縮和解壓縮的方法、裝置、和電腦程式產品 |
US11271678B2 (en) * | 2020-01-21 | 2022-03-08 | Realtek Semiconductor Corp. | Encoding method, related transmitter apparatus and related receiver apparatus for wireless local area network |
CN111341330B (zh) * | 2020-02-10 | 2023-07-25 | 科大讯飞股份有限公司 | 音频编解码方法、存取方法及其相关设备及存储装置 |
US11769478B1 (en) | 2021-07-15 | 2023-09-26 | Dialog Semiconductor B.V. | Digital signal processing system |
Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1427252A1 (en) * | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
Family Cites Families (140)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US247035A (en) * | 1881-09-13 | Drill-chuck | ||
US78687A (en) * | 1868-06-09 | Daniel e | ||
US216262A (en) * | 1879-06-10 | Improvement in thill-coupling jacks | ||
US138157A (en) * | 1873-04-22 | Improvement in breech-loading fire-arms | ||
US63368A (en) * | 1867-04-02 | davids | ||
US13405A (en) * | 1855-08-07 | Self-adjusting tongue-ihon | ||
US117044A (en) * | 1871-07-18 | Improvement in ladies work-stands | ||
US80829A (en) * | 1868-08-11 | Patkick lennox | ||
US75153A (en) * | 1868-03-03 | Egbert d | ||
US152557A (en) * | 1874-06-30 | Improvement in devices for coiling wire | ||
US76333A (en) * | 1868-04-07 | To all whom it may concern | ||
US37461A (en) * | 1863-01-20 | Improved car for carrying petroleum | ||
US254281A (en) * | 1882-02-28 | Corn-sheller | ||
US149322A (en) * | 1874-04-07 | Improvement in parasol-handles | ||
US115051A (en) * | 1871-05-23 | Improvement in the manufacture of glucose sirups -and sugars | ||
US2006A (en) * | 1841-03-16 | Clamp for crimping leather | ||
US251330A (en) * | 1881-12-20 | Dust-collector for flour-mills | ||
US125933A (en) * | 1872-04-23 | Improvement in compounds for the cure of colic and botts in horses | ||
US4110571A (en) | 1977-11-25 | 1978-08-29 | Jimmy's Radio & Television Corporation | Test unit for stereophonic speaker systems |
US4922537A (en) * | 1987-06-02 | 1990-05-01 | Frederiksen & Shu Laboratories, Inc. | Method and apparatus employing audio frequency offset extraction and floating-point conversion for digitally encoding and decoding high-fidelity audio signals |
US5243686A (en) | 1988-12-09 | 1993-09-07 | Oki Electric Industry Co., Ltd. | Multi-stage linear predictive analysis method for feature extraction from acoustic signals |
FR2646978B1 (fr) | 1989-05-11 | 1991-08-23 | France Etat | Procede et installation a codage de signaux sonores |
NL9000338A (nl) | 1989-06-02 | 1991-01-02 | Koninkl Philips Electronics Nv | Digitaal transmissiesysteem, zender en ontvanger te gebruiken in het transmissiesysteem en registratiedrager verkregen met de zender in de vorm van een optekeninrichting. |
EP0405591B1 (en) | 1989-06-30 | 1997-10-01 | Nec Corporation | Varaible length block coding with changing characteristics of input samples |
JPH03224130A (ja) | 1990-01-30 | 1991-10-03 | Konica Corp | ディスク状磁気記録媒体 |
CN1062963C (zh) | 1990-04-12 | 2001-03-07 | 多尔拜实验特许公司 | 用于产生高质量声音信号的解码器和编码器 |
US5283780A (en) | 1990-10-18 | 1994-02-01 | Stanford Telecommunications, Inc. | Digital audio broadcasting system |
US5165686A (en) * | 1990-12-18 | 1992-11-24 | Morgan Edward H | Wooden baseball bat |
CA2077662C (en) | 1991-01-08 | 2001-04-17 | Mark Franklin Davis | Encoder/decoder for multidimensional sound fields |
US5751773A (en) | 1992-03-12 | 1998-05-12 | Ntp Incorporated | System for wireless serial transmission of encoded information |
US5495552A (en) | 1992-04-20 | 1996-02-27 | Mitsubishi Denki Kabushiki Kaisha | Methods of efficiently recording an audio signal in semiconductor memory |
US5828784A (en) * | 1992-07-13 | 1998-10-27 | Hitachi Denshi Kabushiki Kaisha | Data coding method and apparatus using a plurality of blocks of different length |
US6161122A (en) * | 1992-12-10 | 2000-12-12 | Hawkes; Calvert T. | Method and apparatus for interactively providing information at multiple sites |
KR100287494B1 (ko) * | 1993-06-30 | 2001-04-16 | 이데이 노부유끼 | 디지탈신호의부호화방법및장치,복호화방법및장치와부호화시킨신호의기록매체 |
JP3175446B2 (ja) | 1993-11-29 | 2001-06-11 | ソニー株式会社 | 情報圧縮方法及び装置、圧縮情報伸張方法及び装置、圧縮情報記録/伝送装置、圧縮情報再生装置、圧縮情報受信装置、並びに記録媒体 |
JP3125543B2 (ja) | 1993-11-29 | 2001-01-22 | ソニー株式会社 | 信号符号化方法及び装置、信号復号化方法及び装置、並びに記録媒体 |
DE4401227C2 (de) * | 1994-01-18 | 1999-03-18 | Ernst Peter Prof Dr M Strecker | In den Körper eines Patienten perkutan implantierbare Endoprothese |
JPH0831096A (ja) | 1994-07-12 | 1996-02-02 | Matsushita Electric Ind Co Ltd | オーディオデータ符号化記録装置及びオーディオデータ復号再生装置 |
US6549666B1 (en) | 1994-09-21 | 2003-04-15 | Ricoh Company, Ltd | Reversible embedded wavelet system implementation |
US5751903A (en) | 1994-12-19 | 1998-05-12 | Hughes Electronics | Low rate multi-mode CELP codec that encodes line SPECTRAL frequencies utilizing an offset |
DE727780T1 (de) | 1995-02-16 | 1997-02-13 | Toshiba Kawasaki Kk | Ausgabesteuerungssystem für umschaltbare Torkanäle |
US5956674A (en) | 1995-12-01 | 1999-09-21 | Digital Theater Systems, Inc. | Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels |
JP3705305B2 (ja) * | 1996-05-16 | 2005-10-12 | カシオ計算機株式会社 | 音声記憶再生装置 |
JP3364825B2 (ja) | 1996-05-29 | 2003-01-08 | 三菱電機株式会社 | 音声符号化装置および音声符号化復号化装置 |
US6154549A (en) * | 1996-06-18 | 2000-11-28 | Extreme Audio Reality, Inc. | Method and apparatus for providing sound in a spatial environment |
GB2318029B (en) * | 1996-10-01 | 2000-11-08 | Nokia Mobile Phones Ltd | Audio coding method and apparatus |
DE69723959T2 (de) * | 1996-11-11 | 2004-06-17 | Koninklijke Philips Electronics N.V. | Datenkompression und -dekompression durch rice-kodierer/-dekodierer |
TW447193B (en) | 1996-12-09 | 2001-07-21 | Matsushita Electric Ind Co Ltd | Signal processing device |
EP1359755B1 (en) | 1996-12-20 | 2005-11-09 | Koninklijke Philips Electronics N.V. | A coded information signal |
EP0880246A3 (en) | 1997-05-15 | 1999-12-01 | Matsushita Electric Industrial Co., Ltd. | Compressed code decoding device and audio decoding device |
US6124895A (en) * | 1997-10-17 | 2000-09-26 | Dolby Laboratories Licensing Corporation | Frame-based audio coding with video/audio data synchronization by dynamic audio frame alignment |
US6069947A (en) | 1997-12-16 | 2000-05-30 | Nortel Networks Corporation | Communication system architecture and operating protocol therefor |
JP3802219B2 (ja) | 1998-02-18 | 2006-07-26 | 富士通株式会社 | 音声符号化装置 |
US6831914B1 (en) * | 1998-03-27 | 2004-12-14 | Verizon Services Corp. | Services control point selection in an advanced intelligent network |
DE69826529T2 (de) | 1998-04-15 | 2005-09-22 | Stmicroelectronics Asia Pacific (Pte) Ltd. | Schnelle datenrahmen-optimierung in einem audio-kodierer |
US6298900B1 (en) * | 1998-07-06 | 2001-10-09 | Ford Global Technologies, Inc. | Method of integrating wear plates into a spray formed rapid tool |
US6480822B2 (en) | 1998-08-24 | 2002-11-12 | Conexant Systems, Inc. | Low complexity random codebook structure |
US6420980B1 (en) * | 1998-10-06 | 2002-07-16 | Matsushita Electric Industrial Co., Ltd. | Lossless compression encoding method and device, and lossless compression decoding method and device |
JP4610680B2 (ja) * | 1998-11-02 | 2011-01-12 | ソニー株式会社 | 信号処理装置および方法、記録装置、再生装置、記録再生装置、ならびに、映像信号記録再生装置 |
US6816491B1 (en) | 1998-11-04 | 2004-11-09 | Hitachi, Ltd. | Multiplexed audio data decoding apparatus and receiver apparatus |
US6300888B1 (en) | 1998-12-14 | 2001-10-09 | Microsoft Corporation | Entrophy code mode switching for frequency-domain audio coding |
US6628714B1 (en) | 1998-12-18 | 2003-09-30 | Zenith Electronics Corporation | Down converting MPEG encoded high definition sequences to lower resolution with reduced memory in decoder loop |
US6276608B1 (en) * | 1998-12-29 | 2001-08-21 | Daimlerchrysler Ag | Data storage and communication system |
CZ300954B6 (cs) | 1999-01-07 | 2009-09-23 | Koninklijke Philips Electronics N. V. | Zarízení a zpusob pro kódování digitálního informacního signálu, zarízení pro dekódování a nosic záznamu |
US6226608B1 (en) | 1999-01-28 | 2001-05-01 | Dolby Laboratories Licensing Corporation | Data framing for adaptive-block-length coding system |
US7051351B2 (en) * | 1999-03-08 | 2006-05-23 | Microsoft Corporation | System and method of inserting advertisements into an information retrieval system display |
DE60017825T2 (de) | 1999-03-23 | 2006-01-12 | Nippon Telegraph And Telephone Corp. | Verfahren und Vorrichtung zur Kodierung und Dekodierung von Audiosignalen und Aufzeichnungsträger mit Programmen dafür |
EP1054575A3 (en) | 1999-05-17 | 2002-09-18 | Bose Corporation | Directional decoding |
US6691082B1 (en) | 1999-08-03 | 2004-02-10 | Lucent Technologies Inc | Method and system for sub-band hybrid coding |
JP3762579B2 (ja) | 1999-08-05 | 2006-04-05 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
US7096481B1 (en) | 2000-01-04 | 2006-08-22 | Emc Corporation | Preparation of metadata for splicing of encoded MPEG video and audio |
US6678332B1 (en) * | 2000-01-04 | 2004-01-13 | Emc Corporation | Seamless splicing of encoded MPEG video and audio |
US6810502B2 (en) * | 2000-01-28 | 2004-10-26 | Conexant Systems, Inc. | Iteractive decoder employing multiple external code error checks to lower the error floor |
US6675748B2 (en) * | 2000-02-11 | 2004-01-13 | Westport Research Inc. | Method and apparatus for fuel injection into an internal combustion engine |
US7266501B2 (en) | 2000-03-02 | 2007-09-04 | Akiba Electronics Institute Llc | Method and apparatus for accommodating primary content audio and secondary content remaining audio capability in the digital audio production process |
US7323299B2 (en) * | 2000-03-21 | 2008-01-29 | Neugenesis Corporation | Methods for in vivo diversification of single genes |
US6448890B1 (en) * | 2000-05-01 | 2002-09-10 | Breed Automotive Technology, Inc. | Air bag system with biomechanical gray zones |
SE522261C2 (sv) * | 2000-05-10 | 2004-01-27 | Global Ip Sound Ab | Kodning och avkodning av en digital signal |
WO2001097476A2 (en) | 2000-06-12 | 2001-12-20 | Time Domain Corporation | A method for specifying non-temporal pulse characteristics |
JP4538908B2 (ja) * | 2000-06-14 | 2010-09-08 | ソニー株式会社 | データ変換装置及び方法 |
US6609947B1 (en) * | 2000-08-30 | 2003-08-26 | Micron Technology, Inc. | Planarizing machines and control systems for mechanical and/or chemical-mechanical planarization of micro electronic substrates |
US20020049586A1 (en) | 2000-09-11 | 2002-04-25 | Kousuke Nishio | Audio encoder, audio decoder, and broadcasting system |
US6775254B1 (en) * | 2000-11-09 | 2004-08-10 | Qualcomm Incorporated | Method and apparatus for multiplexing high-speed packet data transmission with voice/data transmission |
SE0004163D0 (sv) * | 2000-11-14 | 2000-11-14 | Coding Technologies Sweden Ab | Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering |
JP3639212B2 (ja) * | 2000-12-11 | 2005-04-20 | 株式会社オプトウエア | 光情報記録方法 |
US6675148B2 (en) | 2001-01-05 | 2004-01-06 | Digital Voice Systems, Inc. | Lossless audio coder |
US7930170B2 (en) * | 2001-01-11 | 2011-04-19 | Sasken Communication Technologies Limited | Computationally efficient audio coder |
US6871043B2 (en) * | 2001-02-02 | 2005-03-22 | Ecollege.Com | Variable types of sensory interaction for an on-line educational system |
US6696993B2 (en) * | 2001-03-23 | 2004-02-24 | Nokia Corporation | Variable length coding |
JP4867076B2 (ja) | 2001-03-28 | 2012-02-01 | 日本電気株式会社 | 音声合成用圧縮素片作成装置、音声規則合成装置及びそれらに用いる方法 |
FI118067B (fi) * | 2001-05-04 | 2007-06-15 | Nokia Corp | Menetelmä audiosignaalin pakkauksen purkamisessa, pakkauksen purkulaite, ja elektroniikkalaite |
JP3601473B2 (ja) | 2001-05-11 | 2004-12-15 | ヤマハ株式会社 | ディジタルオーディオ圧縮回路および伸長回路 |
ATE311727T1 (de) | 2001-08-03 | 2005-12-15 | Koninkl Philips Electronics Nv | Datenschutzsystem und -verfahren für audio-video übertragung |
GB2379977B (en) * | 2001-09-25 | 2005-04-06 | Kidde Plc | High sensitivity particle detection |
US20030078687A1 (en) | 2001-10-15 | 2003-04-24 | Du Breuil Thomas Lemaigre | Method and system for automatically configuring an audio environment |
DE20117292U1 (de) * | 2001-10-22 | 2002-01-17 | Reitter & Schefenacker Gmbh | Innenleuchte für Fahrzeuge, vorzugsweise für Kraftfahrzeuge |
EP1308931A1 (de) * | 2001-10-23 | 2003-05-07 | Deutsche Thomson-Brandt Gmbh | Decodierung eines codierten digitalen Audio-Signals welches in Header enthaltende Rahmen angeordnet ist |
US7085401B2 (en) * | 2001-10-31 | 2006-08-01 | Infowrap Systems Ltd. | Automatic object extraction |
SE521600C2 (sv) | 2001-12-04 | 2003-11-18 | Global Ip Sound Ab | Lågbittaktskodek |
US20030018183A1 (en) * | 2001-12-06 | 2003-01-23 | Genentech, Inc. | Secreted and transmembrane polypeptides and nucleic acids encoding the same |
US6934677B2 (en) | 2001-12-14 | 2005-08-23 | Microsoft Corporation | Quantization matrices based on critical band pattern information for digital audio wherein quantization bands differ from critical bands |
US6690307B2 (en) * | 2002-01-22 | 2004-02-10 | Nokia Corporation | Adaptive variable length coding of digital video |
BRPI0308691A2 (pt) | 2002-04-10 | 2016-11-16 | Koninkl Philips Electronics Nv | métodos para codificar um sinal de canal múltiplo e para decodificar informação de sinal de canal múltiplo, arranjos para codificar e decodificar um sinal de canal múltiplo, sinal de dados, meio legível por computador, e, dispositivo para comunicar um sinal de canal múltiplo. |
ES2300567T3 (es) | 2002-04-22 | 2008-06-16 | Koninklijke Philips Electronics N.V. | Representacion parametrica de audio espacial. |
RU2313174C2 (ru) | 2002-04-26 | 2007-12-20 | Нокиа Корпорейшн | Адаптивный способ и система для отображения значений параметров в индексы кодовых слов |
JP4296753B2 (ja) | 2002-05-20 | 2009-07-15 | ソニー株式会社 | 音響信号符号化方法及び装置、音響信号復号方法及び装置、並びにプログラム及び記録媒体 |
US6691028B2 (en) * | 2002-06-07 | 2004-02-10 | Motorola, Inc. | Server-based navigation system and method of operating same |
US20040015259A1 (en) * | 2002-07-18 | 2004-01-22 | A-Po Tsai | NC machining program having easily selectable modes |
JP4055122B2 (ja) | 2002-07-24 | 2008-03-05 | 日本ビクター株式会社 | 音響信号符号化方法及び音響信号符号化装置 |
US6807732B2 (en) * | 2002-07-24 | 2004-10-26 | Agilent Technologies, Inc. | Methods for modifying inner-layer circuit features of printed circuit boards |
JP2004072345A (ja) * | 2002-08-05 | 2004-03-04 | Pioneer Electronic Corp | 情報記録媒体、情報記録装置及び方法、情報再生装置及び方法、情報記録再生装置及び方法、コンピュータプログラム、並びにデータ構造 |
JP4022111B2 (ja) | 2002-08-23 | 2007-12-12 | 株式会社エヌ・ティ・ティ・ドコモ | 信号符号化装置及び信号符号化方法 |
US7502743B2 (en) * | 2002-09-04 | 2009-03-10 | Microsoft Corporation | Multi-channel audio encoding and decoding with multi-channel transform selection |
CA2501368C (en) | 2002-10-11 | 2013-06-25 | Nokia Corporation | Methods and devices for source controlled variable bit-rate wideband speech coding |
US20040076333A1 (en) | 2002-10-22 | 2004-04-22 | Huipin Zhang | Adaptive interpolation filter system for motion compensated predictive video coding |
AU2003302114A1 (en) | 2002-11-21 | 2004-06-15 | Nippon Telegraph And Telephone Corporation | Digital signal processing method, processor thereof, program thereof, and recording medium containing the program |
WO2004053919A2 (en) * | 2002-12-11 | 2004-06-24 | Koninklijke Philips Electronics N.V. | X-ray source for generating monochromatic x-rays |
US7440810B2 (en) | 2002-12-13 | 2008-10-21 | Dell Products L.P. | Multi-channel media applications support with channel-to-connector mapping |
ATE418254T1 (de) * | 2002-12-23 | 2009-01-15 | Alcatel Lucent | Überlastkontrolle in einem optischen netzwerk mit burstschaltung |
KR101049751B1 (ko) | 2003-02-11 | 2011-07-19 | 코닌클리케 필립스 일렉트로닉스 엔.브이. | 오디오 코딩 |
US20040177044A1 (en) * | 2003-03-03 | 2004-09-09 | General Instrument Corporation | Processing of copy control information for digital rights management |
US7792194B2 (en) * | 2003-04-10 | 2010-09-07 | Lefan Zhong | MPEG artifacts post-processed filtering architecture |
US7742926B2 (en) | 2003-04-18 | 2010-06-22 | Realnetworks, Inc. | Digital audio signal compression method and apparatus |
HUP0301368A3 (en) * | 2003-05-20 | 2005-09-28 | Amt Advanced Multimedia Techno | Method and equipment for compressing motion picture data |
US7383180B2 (en) | 2003-07-18 | 2008-06-03 | Microsoft Corporation | Constant bitrate media encoding techniques |
SE0302161D0 (sv) * | 2003-08-04 | 2003-08-01 | Akzo Nobel Nv | Process for the manufacture of a bitumen-aggregate mix suitable for road pavement |
US7640157B2 (en) | 2003-09-26 | 2009-12-29 | Ittiam Systems (P) Ltd. | Systems and methods for low bit rate audio coders |
WO2005036529A1 (en) | 2003-10-13 | 2005-04-21 | Koninklijke Philips Electronics N.V. | Audio encoding |
US7519520B2 (en) * | 2003-10-13 | 2009-04-14 | Realnetworks, Inc. | Compact signal coding method and apparatus |
KR20050044085A (ko) * | 2003-11-07 | 2005-05-12 | 삼성전자주식회사 | 집적회로 소자의 세정액 및 그 세정액을 이용한 세정방법 |
US7292902B2 (en) | 2003-11-12 | 2007-11-06 | Dolby Laboratories Licensing Corporation | Frame-based audio transmission/storage with overlap to facilitate smooth crossfading |
JP4765289B2 (ja) * | 2003-12-10 | 2011-09-07 | ソニー株式会社 | 音響システムにおけるスピーカ装置の配置関係検出方法、音響システム、サーバ装置およびスピーカ装置 |
US7809579B2 (en) * | 2003-12-19 | 2010-10-05 | Telefonaktiebolaget Lm Ericsson (Publ) | Fidelity-optimized variable frame length encoding |
SE527670C2 (sv) | 2003-12-19 | 2006-05-09 | Ericsson Telefon Ab L M | Naturtrogenhetsoptimerad kodning med variabel ramlängd |
US7272567B2 (en) * | 2004-03-25 | 2007-09-18 | Zoran Fejzo | Scalable lossless audio codec and authoring tool |
KR100773539B1 (ko) * | 2004-07-14 | 2007-11-05 | 삼성전자주식회사 | 멀티채널 오디오 데이터 부호화/복호화 방법 및 장치 |
US7233174B2 (en) * | 2004-07-19 | 2007-06-19 | Texas Instruments Incorporated | Dual polarity, high input voltage swing comparator using MOS input transistors |
JP4809370B2 (ja) | 2005-02-23 | 2011-11-09 | テレフオンアクチーボラゲット エル エム エリクソン(パブル) | マルチチャネル音声符号化における適応ビット割り当て |
US8032240B2 (en) * | 2005-07-11 | 2011-10-04 | Lg Electronics Inc. | Apparatus and method of processing an audio signal |
US7299902B2 (en) * | 2005-10-21 | 2007-11-27 | Jim Thorpe | Wheel chock for tandem wheeled vehicles |
-
2006
- 2006-07-07 US US11/481,932 patent/US8032240B2/en active Active
- 2006-07-07 US US11/481,942 patent/US7830921B2/en active Active
- 2006-07-07 US US11/481,933 patent/US7966190B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,929 patent/US7991012B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,930 patent/US8032368B2/en active Active
- 2006-07-07 US US11/481,940 patent/US8180631B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,927 patent/US7835917B2/en active Active
- 2006-07-07 US US11/481,915 patent/US7996216B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,926 patent/US7949014B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,939 patent/US8121836B2/en active Active
- 2006-07-07 US US11/481,917 patent/US7991272B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,931 patent/US7411528B2/en active Active
- 2006-07-07 US US11/481,941 patent/US8050915B2/en not_active Expired - Fee Related
- 2006-07-07 US US11/481,916 patent/US8108219B2/en not_active Expired - Fee Related
- 2006-07-10 CN CNA200680028892XA patent/CN101238509A/zh active Pending
- 2006-07-10 JP JP2008521305A patent/JP2009500681A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002686 patent/WO2007008008A2/en active Application Filing
- 2006-07-10 EP EP06769220A patent/EP1913585A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521316A patent/JP2009510810A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002685 patent/WO2007008007A1/en active Application Filing
- 2006-07-10 WO PCT/KR2006/002691 patent/WO2007008013A2/en active Application Filing
- 2006-07-10 CN CN2006800252699A patent/CN101218630B/zh not_active Expired - Fee Related
- 2006-07-10 CN CNA2006800305412A patent/CN101243497A/zh active Pending
- 2006-07-10 CN CNA2006800305111A patent/CN101243494A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002688 patent/WO2007008010A1/en active Application Filing
- 2006-07-10 CN CN2006800294070A patent/CN101243496B/zh not_active Expired - Fee Related
- 2006-07-10 WO PCT/KR2006/002687 patent/WO2007008009A1/en active Application Filing
- 2006-07-10 JP JP2008521306A patent/JP2009500682A/ja active Pending
- 2006-07-10 JP JP2008521314A patent/JP2009500689A/ja active Pending
- 2006-07-10 EP EP06757768A patent/EP1913583A4/en not_active Withdrawn
- 2006-07-10 EP EP06769219A patent/EP1913584A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002690 patent/WO2007008012A2/en active Application Filing
- 2006-07-10 EP EP06757764A patent/EP1913579A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002682 patent/WO2007008004A2/en active Application Filing
- 2006-07-10 CN CNA2006800304693A patent/CN101243492A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002677 patent/WO2007007999A2/en active Application Filing
- 2006-07-10 EP EP06769226A patent/EP1913588A4/en not_active Withdrawn
- 2006-07-10 CN CNA2006800305499A patent/CN101243495A/zh active Pending
- 2006-07-10 JP JP2008521317A patent/JP2009500691A/ja active Pending
- 2006-07-10 JP JP2008521309A patent/JP2009500685A/ja active Pending
- 2006-07-10 EP EP06757766A patent/EP1913581A4/en not_active Withdrawn
- 2006-07-10 EP EP06769225A patent/EP1911021A4/en not_active Withdrawn
- 2006-07-10 CN CNA2006800251376A patent/CN101218631A/zh active Pending
- 2006-07-10 CN CNA200680024866XA patent/CN101218852A/zh active Pending
- 2006-07-10 JP JP2008521313A patent/JP2009500688A/ja active Pending
- 2006-07-10 CN CNA2006800294174A patent/CN101243489A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002683 patent/WO2007008005A1/en active Application Filing
- 2006-07-10 EP EP06769227A patent/EP1911020A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521319A patent/JP2009500693A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002679 patent/WO2007008001A2/en active Application Filing
- 2006-07-10 EP EP06757765A patent/EP1913580A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521308A patent/JP2009500684A/ja active Pending
- 2006-07-10 CN CNA2006800289829A patent/CN101238510A/zh active Pending
- 2006-07-10 WO PCT/KR2006/002689 patent/WO2007008011A2/en active Application Filing
- 2006-07-10 EP EP06769224A patent/EP1913794A4/en not_active Withdrawn
- 2006-07-10 EP EP06757767A patent/EP1913582A4/en not_active Withdrawn
- 2006-07-10 CN CNA2006800251395A patent/CN101218629A/zh active Pending
- 2006-07-10 EP EP06769222A patent/EP1908058A4/en not_active Withdrawn
- 2006-07-10 WO PCT/KR2006/002678 patent/WO2007008000A2/en active Application Filing
- 2006-07-10 JP JP2008521311A patent/JP2009500687A/ja active Pending
- 2006-07-10 CN CN2006800251380A patent/CN101218628B/zh not_active Expired - Fee Related
- 2006-07-10 JP JP2008521307A patent/JP2009500683A/ja active Pending
- 2006-07-10 CN CNA2006800304797A patent/CN101243493A/zh active Pending
- 2006-07-10 JP JP2008521310A patent/JP2009500686A/ja active Pending
- 2006-07-10 EP EP06769218A patent/EP1913589A4/en not_active Withdrawn
- 2006-07-10 EP EP06769223A patent/EP1913587A4/en not_active Withdrawn
- 2006-07-10 JP JP2008521315A patent/JP2009500690A/ja active Pending
- 2006-07-10 WO PCT/KR2006/002680 patent/WO2007008002A2/en active Application Filing
- 2006-07-10 WO PCT/KR2006/002681 patent/WO2007008003A2/en active Application Filing
- 2006-07-10 JP JP2008521318A patent/JP2009500692A/ja active Pending
-
2008
- 2008-09-18 US US12/232,526 patent/US8010372B2/en not_active Expired - Fee Related
- 2008-09-18 US US12/232,527 patent/US7962332B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,593 patent/US8326132B2/en active Active
- 2008-09-19 US US12/232,595 patent/US8417100B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,590 patent/US8055507B2/en not_active Expired - Fee Related
- 2008-09-19 US US12/232,591 patent/US8255227B2/en active Active
- 2008-09-22 US US12/232,658 patent/US8510119B2/en not_active Expired - Fee Related
- 2008-09-22 US US12/232,662 patent/US8510120B2/en not_active Expired - Fee Related
- 2008-09-22 US US12/232,659 patent/US8554568B2/en active Active
- 2008-09-23 US US12/232,741 patent/US8149877B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,744 patent/US8032386B2/en active Active
- 2008-09-23 US US12/232,739 patent/US8155152B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,740 patent/US8149876B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,747 patent/US8149878B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,748 patent/US8155153B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,743 patent/US7987008B2/en not_active Expired - Fee Related
- 2008-09-23 US US12/232,734 patent/US8155144B2/en not_active Expired - Fee Related
- 2008-09-24 US US12/232,782 patent/US8046092B2/en active Active
- 2008-09-24 US US12/232,781 patent/US7930177B2/en not_active Expired - Fee Related
- 2008-09-24 US US12/232,783 patent/US8275476B2/en active Active
- 2008-09-24 US US12/232,784 patent/US7987009B2/en not_active Expired - Fee Related
- 2008-12-18 US US12/314,891 patent/US8065158B2/en not_active Expired - Fee Related
Patent Citations (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
EP1427252A1 (en) * | 2002-12-02 | 2004-06-09 | Deutsche Thomson-Brandt Gmbh | Method and apparatus for processing audio signals from a bitstream |
Non-Patent Citations (1)
Title |
---|
ITU STUDY GROUP 16-VIDEO CODING EXPERTS GROUP: "《ISO/IEC JTC1/SC29/WG11/M12018, Proposed Study on ISO/IEC 14496-3:2001/FPDAM 4, Audio Lossless Coding (ALS), new audio profiles and BSAC extensions》", 30 April 2005 * |
Also Published As
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101218630B (zh) | 处理音频信号的装置和方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C02 | Deemed withdrawal of patent application after publication (patent law 2001) | ||
WD01 | Invention patent application deemed withdrawn after publication |
Application publication date: 20080709 |