CN1484756A - 编码设备,解码设备以及音频数据分配系统 - Google Patents
编码设备,解码设备以及音频数据分配系统 Download PDFInfo
- Publication number
- CN1484756A CN1484756A CNA02803421XA CN02803421A CN1484756A CN 1484756 A CN1484756 A CN 1484756A CN A02803421X A CNA02803421X A CN A02803421XA CN 02803421 A CN02803421 A CN 02803421A CN 1484756 A CN1484756 A CN 1484756A
- Authority
- CN
- China
- Prior art keywords
- frequency band
- data
- unit
- frequency spectrum
- spectrum data
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000001228 spectrum Methods 0.000 claims abstract description 494
- 238000005070 sampling Methods 0.000 claims abstract description 148
- 238000013139 quantization Methods 0.000 claims abstract description 127
- 230000014509 gene expression Effects 0.000 claims description 39
- 241001269238 Data Species 0.000 claims description 32
- 230000009466 transformation Effects 0.000 claims description 22
- 238000011002 quantification Methods 0.000 claims description 19
- 230000005540 biological transmission Effects 0.000 claims description 15
- 238000010606 normalization Methods 0.000 claims description 13
- 238000003860 storage Methods 0.000 claims description 11
- 238000009826 distribution Methods 0.000 claims description 8
- 230000000694 effects Effects 0.000 claims description 8
- 239000000284 extract Substances 0.000 claims description 7
- 238000012163 sequencing technique Methods 0.000 claims description 7
- 230000003595 spectral effect Effects 0.000 claims description 7
- 238000006243 chemical reaction Methods 0.000 abstract description 9
- 238000000926 separation method Methods 0.000 abstract description 4
- 238000000034 method Methods 0.000 description 106
- 238000012545 processing Methods 0.000 description 42
- 230000008929 regeneration Effects 0.000 description 28
- 238000011069 regeneration method Methods 0.000 description 28
- 230000008569 process Effects 0.000 description 27
- 230000005236 sound signal Effects 0.000 description 27
- 238000010586 diagram Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 7
- 230000001172 regenerating effect Effects 0.000 description 7
- 230000010354 integration Effects 0.000 description 6
- 238000007689 inspection Methods 0.000 description 5
- 230000008859 change Effects 0.000 description 4
- 238000012423 maintenance Methods 0.000 description 4
- 238000005516 engineering process Methods 0.000 description 3
- 238000004611 spectroscopical analysis Methods 0.000 description 3
- 238000012546 transfer Methods 0.000 description 3
- 238000013459 approach Methods 0.000 description 2
- 238000004364 calculation method Methods 0.000 description 2
- 230000006835 compression Effects 0.000 description 2
- 238000007906 compression Methods 0.000 description 2
- 230000006866 deterioration Effects 0.000 description 2
- 230000008676 import Effects 0.000 description 2
- 238000004519 manufacturing process Methods 0.000 description 2
- 238000012986 modification Methods 0.000 description 2
- 230000004048 modification Effects 0.000 description 2
- 230000008901 benefit Effects 0.000 description 1
- 230000000052 comparative effect Effects 0.000 description 1
- 229910052738 indium Inorganic materials 0.000 description 1
- 239000002184 metal Substances 0.000 description 1
- 238000000465 moulding Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 239000000843 powder Substances 0.000 description 1
- 230000010076 replication Effects 0.000 description 1
- 230000004044 response Effects 0.000 description 1
- 238000005096 rolling process Methods 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 238000004088 simulation Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L21/00—Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
- G10L21/02—Speech enhancement, e.g. noise reduction or echo cancellation
- G10L21/038—Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
-
- G—PHYSICS
- G10—MUSICAL INSTRUMENTS; ACOUSTICS
- G10L—SPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
- G10L19/00—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
- G10L19/02—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
- G10L19/0204—Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
- G10L19/0208—Subband vocoders
Abstract
一种编码设备(300)的音频数据输入单元(310)将一个音频数据串分离成连续的音频数据的4096个取样,一个变换单元(320)将分离的音频数据变换成频率域的频谱数据。一个数据划分单元(330)将频谱数据以11.025kHz为边界分成低频带和高频带。低频带内的频谱数据按照通常的方式被第一量化单元(340)和编码单元(350)量化和编码。第二量化单元(345)产生表示高频带的频谱数据特性的子信息,并且第二编码单元(355)对该子信息进行编码。一个流输出单元(390)集成第一和第二编码单元(350),(355)获得的码,并将集成的编码输出。这里,f1是产生音频数据串的采样频率f2的一半或者更小。
Description
技术领域
本发明涉及一种压缩/编码和扩展/解码音频信号从而再生高质量的声音的技术。
背景技术
近年来,出现了多种音频信号的压缩/编码和扩展/解码的方法。MPEG-2高级音频编码(以后被称为“MPEG-2 AAC”或“AAC”)就是一种这样的技术。(参看“IS13818-7”(MPEG-2高级音频编码,AAC)作者M.Bosi等,1997年4月)。
附图1是一个方框图,表明根据传统的AAC方法的编码设备和解码设备的功能结构。
编码设备1000是一个根据AAC编码方法压缩和编码输入音频信号的设备,该设备包括一个A/D转换器1050,一个音频信号输入单元1100,一个变换单元1200,一个量化单元1400,一个编码单元以及一个流输出单元1900。
A/D转换器1050以例如22.05kHz的采样频率对输入信号进行采样,并将模拟音频信号转换成一个数字音频数据串。每当音频输入单元1100读取了输入信号的音频数据串的1024个取样的时候(这些1024个取样以后被称为一“帧”),它将音频数据串分离成2048个数据取样,这些取样数据具有两组各一半的取样,用于在该帧被覆盖前后所获得的帧(512)。
变换单元1200对在时间域由音频数据输入单元1100分离的2048个数据取样执行改进离散余弦变换(MDCT),将其变换成频率域的频谱数据。频谱数据的1024个取样,即变换获得的频谱数据的一半,表示11.025kHz或者更小的再生带宽,并且被分为多个组。每个组都被设定从而包括一个或者多个频谱数据取样。而且,每个组模拟人类听觉的临界带宽,其被称为一个“比例因子频带(scale factorband)”。
量化单元1400在比例因子频带内量化变换单元1200所产生的频谱数据,在每一个比例因子频带内利用一个标准化因子将其量化为预定数目比特。该标准化因子被称为一个“比例因子”。而且,利用每一个比例因子对每个频谱数据进行量化的结果被称为一个“量化值”。编码单元1500根据霍夫曼编码编码量化单元1400量化的数据,就是每一个比例因子,以及使用该比例因子量化的频谱数据。
流输出单元1900将产生于编码单元1500的编码信号变换成一个AAC比特流格式,并将其输出。从编码设备1000输出的比特流通过传输介质或者记录介质被传送到编码设备2000。
解码设备2000是一个解码编码设备1000编码的比特流的设备,该设备包括一个流输入单元2100,一个解码单元2200,一个解量化单元2300,一个逆变换单元2800,一个音频数据输出单元2900以及一个D/A转换器2950。
流输入单元2100通过传输介质或者通过记录介质接收编码设备1000编码的比特流,并且从接收的比特流中读取编码信号。解码单元200然后解码霍夫曼编码的信号从而产生量化数据。
解量化单元2300利用比例因子对解码单元2200解码的量化数据进行解量化。逆变换单元2800对解量化单元2300产生的频率域的频谱数据的1024个取样执行逆改进离散余弦变换(IMDCT),将其变换成时间域的1024个取样的音频数据。音频数据输出单元2900顺序合并逆变换单元2800产生的时间域的1024个取样的音频数据,并且以时间顺序逐个输出这组1024个取样的音频数据。D/A转换器2950以22.05kHz的采样频率将数字音频数据转换成模拟音频数据。
在上述的根据传统AAC标准的编码设备1000以及解码设备2000中,每一个取样数据能够被压缩为1比特或者更小。此外,由于在低频带内的1024个频谱数据取样被编码,这些取样具有较高的听觉优先级,所以音频数据能够以相对较高的质量被再生,低频带表示为11.025kHz或者更小的再生带宽,其为采样频率的一半。
但是,在根据传统的AAC方法(现有技术1)的编码设备1000和解码设备2000中,由于采样频率是22.05kHz,将被编码的频谱数据中没有在11.025kHz以上带宽内的数据。因此就存在着一个问题,期望听到包括在11.025kHz以上带宽内的更高质量的声音的要求就无法被满足。
为了解决这一问题,考虑将图1中的应用于编码设备1000中的A/D转换器1050以及解码设备2000的D/A转换器2950的采样频率提高到22.05kHz的一倍,就是44.1kHz(现有技术2)。
但是,如果采样频率为44.1kHz,位于高于11.025kHz以上的较高频带宽内的512个频谱数据取样能够被编码,同时保持一个压缩比例,但是在低频带内的具有听觉较高优先级的频谱数据就会降低为一半,就是512个取样。换句话说,采样频率与低频带内的频谱数据的数目是呈交替变换(trade-off)的关系的,二者无法同时被提高。因此就产生了另一个问题就是整体的声音质量被劣化了。
这种问题在根据其它方法(例如MP3.AC3等)的编码设备和解码设备中都会出现。
本发明被设计用于解决上述的问题,并且本发明的目的是提供一种能够实现高质量的声音再生同时不增加编码后的数据量的编码设备和解码设备。
发明内容
为了实现上述目的,根据本发明的编码设备是一种能够编码音频数据的编码设备,包括:一个分离单元,用于将音频数据流分离成一个固定数目的连续音频数据;一个变换单元,用于将分离的音频数据变换成频率域的频谱数据;一个划分单元,用于将变换单元获得的频谱数据划分成在频率f1Hz或者更低的低频带的频谱数据以及在高于f1Hz的高频带宽内的频谱数据;一个低频带编码单元用于量化低频带内划分的频谱数据并且编码该量化数据;一个子信息产生单元,用于产生表明来自于高频带内的划分的频谱数据的高频带的频谱特性;一个高频带编码单元,用于编码产生的子信息;以及一个输出单元,用于集成(integrate)低频带编码单元产生的编码以及高频带编码单元产生的编码,并且输出集成码,其中f1是采样频率f2的一半或者更小,在频率f2处产生音频数据串。
在根据本发明的编码设备中,变换单元输出分离单元所分离的音频数据中的在f1或者更低的低频带内的频谱数据,同时,输出高于f1的高频带内的频谱数据。被划分单元划分的低频带内的频谱数据被量化和编码,高频带内的频谱数据被编码成表示高频带的特性的子信息。高频带编码单元编码产生的子信息。因此,高频带内的音频信号能够被编码从而再生高质量的声音,此外低频带宽内的音频信号能够以与向下采样(down-sampling)同样的方式被编码,而基本上不增加数据的总量。
这里,f1是f2/4,并且变换单元能够将音频数据变换成0~2×f1Hz,划分单元能够将0~2×f1Hz的频谱数据划分成在频率f1Hz或者更低的低频带的频谱数据以及在f1Hz以上直至2×f1Hz的高频带内的频谱数据。或者,在频率f1Hz或者更低的低频带的频谱数据包括n个频谱数据取样,分离单元能够将音频数据串分离成用于产生2×n个频谱数据取样所需数目的音频数据,变换单元能够将划分的音频数据变换成2×n个频谱数据取样,划分单元能够将2×n个频谱数据取样划分成低频带内的n个频谱数据取样以及高频带内的n个频谱数据取样。或者,分离单元能够将音频数据串分离成2×n个频谱数据取样,这些频谱数据取样包括与作为一个编码单元的一帧相对应的n个音频数据取样以及在该帧之前和之后的邻近的两帧中的两组n/2个音频数据取样,变换单元对分离的2×n个音频数据取样执行MDCT,将其变换成包括2×n个频谱数据取样的0~2×f1Hz的频谱。
而且,根据本发明的解码设备是一个能够解码经记录介质或者传输介质输入的编码数据的设备,包括:一个抽取单元,用于抽取包含在编码数据中的低频带的编码数据以及高频带的编码数据;一个低频带解量化单元,用于解码和解量化由抽取单元抽取的低频带的编码数据,从而输出在频率f1Hz或者更低的低频带的频谱数据;一个子信息解码单元,用于解码由抽取单元抽取的高频带的编码数据,从而产生表明高频带的频谱数据特性的子信息;一个高频带解量化单元,用于基于子信息解码单元产生的子信息,输出高频带内的频谱数据;一个集成单元,用于集成低频带解量化单元输出的低频带的频谱数据和高频带解量化单元输出的高频带的频谱数据;一个逆变换单元,用于将集成单元集成的频谱数据逆变换成时间域的音频数据;一个音频数据输出单元,用于基于时间顺序输出逆变换单元逆变换的音频数据。
在根据本发明的解码设备中,抽取单元从输入的编码数据中抽取低频带编码数据和高频带编码数据,低频带解量化单元输出频率f1Hz或者更低的低频带的频谱数据。子信息解码单元解码子信息,并且高频带解量化单元输出基于子信息的高频带的频谱数据。这样,能够利用与传统方法几乎相同数量的较少的数据来解码远远大于传统方法的数据,同时音频信号能够被解码从而再生高质量的声音。
应当注意,本发明当然能够作为一种包括上述的编码设备和解码设备的通信系统来实现,也能够作为包括在上述的编码设备,解码设备以及通信系统的特征单元中所执行的步骤的一种编码方法,一种解码方法和通信方法来实现,作为一种令CPU用作为上述的编码设备,解码设备和通信系统的特征单元或者其中的步骤的编码程序和解码程序来实现,或者作为一种其上记录着这些程序的计算机可读记录介质来实现。
附图说明
本发明的这些以及其它的目的,优点和特点将从随后与附图共同说明中变得清楚,这些附图表明了本发明的一个特定实施例。其中:
附图1是一个表明根据传统的AAC方法的编码设备和解码设备的功能结构的方框图。
附图2是一个表明根据本发明的广播系统的功能结构的方框图。
附图3A和3B是表明在附图2所示的编码设备中所处理的音频信号的状态变化的示意图。
附图4是表明图2所示的第一量化单元所执行的比例因子确定处理中的一操作流程图。
附图5是表明图2所示的第一量化单元所执行的比例因子确定处理中的另一个操作流程图。
附图6是表明附图2所示的第二量化单元所产生的子信息(比例因子)的具体实施例的频谱波形图。
附图7是表明图2所示的第二量化单元所执行的子信息(比例因子)计算处理的操作流程图。
附图8A~8C是表明图2所示的流输出单元存储的子信息的比特流区域的图。
附图9A和9B表明图2所示的流输出单元存储的子信息的比特流区域的其它实施例的图。
附图10A和10B表明图2所示的编码设备与现有技术1的编码设备的处理过程的比较。
附图11A和11B表明图2所示的编码设备与现有技术2的编码设备的处理过程的比较。
附图12表明图2所示的编码设备与现有技术1和2的编码设备的频谱数据和特性的比较。
附图13是表明图2所示的第二解量化单元将低频率带宽内的1024个频谱数据以前向方向复制到高频带的处理过程流程图。
附图14是表明图2所示的第二解量化单元将低频率带宽内的1024个频谱数据以与频率轴相反的方向复制到高频带的处理过程流程图。
附图15是表明图2所示的第二量化单元产生的另一个子信息(量化值)的实施例的频谱波形图。
附图16是表明图2所示的第二量化单元所执行的另一个子信息(量化值)计算处理的操作流程图。
附图17是表明图2所示的第二量化单元所产生的另一个子信息(位置信息)的实施例的频谱波形图。
附图18是表明图2所示的第二量化单元所执行的另一个子信息(位置信息)计算处理的操作流程图。
附图19是表明图2所示的第二量化单元所产生的另一个子信息(符号信息)的实施例的频谱波形图。
附图20是表明图2所示的第二量化单元所执行的另一个子信息(符号信息)计算处理的操作流程图。
附图21A和21B是表明如何产生图2所示的第二量化单元所产生的另一个子信息(复制信息)的实施例的频谱波形图。
附图22是表明图2所示的第二量化单元所执行的另一个子信息(复制信息)计算处理的操作流程图。
附图23是表明如何产生图2所示的第二量化单元所产生的另一个子信息(复制信息)的实施例的频谱波形图。
附图24是表明图2所示的第二量化单元所执行的另一个子信息(复制信息)计算处理的操作流程图。
具体实施方式
下面将参照附图描述本发明被应用于作为音频数据分配系统的一种广播系统的实施例的情况。
附图2是表明根据本发明的广播系统的功能结构的方框图。
根据本实施例的广播系统1,如图2所示,被放置在一个广播站中,该系统包括一个编码输入音频信号的编码设备300,以及一个解码编码设备300编码的音频信号比特流的解码设备400。
(编码设备300)
编码设备300当接收一个音频信号的时候,编码该音频信号,该编码设备300包括一个A/D转换器305,一个音频数据输入单元310,一个变换单元320,一个数据划分单元330,一个第一和第二量化单元340,345,一个第一和第二编码单元350,355,以及一个流输出单元390。
A/D转换器305以44.1kHz的采样频率(该频率是现有技术1的采样频率的两倍)对输入音频信号进行采样,将模拟音频信号转换成数字音频信号(例如16比特),并且产生了时间域中的音频数据串。
音频数据输入单元310,以接收A/D转换器305所产生的2048个取样的音频数据串(2帧)的采样频率(大约45.4msec),就是通常的低采样频率的两倍,分离音频数据串,将其分为具有连续的2048个取样的每个音频数据串,具有被覆盖的1024个取样前后所获得的两组1024个取样,就是,通常的取样数目的两倍(4096个取样)。音频数据输入单元310包括一个计数器311,用于检测每接收2048个取样的分离定时,以及一个FIF0缓存器,用于暂时存储4096个取样的音频数据串。
变换单元320将音频数据输入单元310所分离的时间域的两帧4096个取样的音频采样数据变换成频率域的频谱数据。变换单元320包括一个MDCT321,用于将时间域的4096个取样的音频数据变换成频率域的4096个取样的频谱数据,以及一个分组单元322,用于分组用于每一个比例因子频带的频谱数据。
详细的说,MDCT321将时间域中的4096个取样组成的采样数据变换成包括4096个取样的频谱数据(16比特)。该频谱数据的这些取样被对称的排列,因此它们当中只有一半的取样(即,2048个取样)被编码,而另外的一半被忽略。
如上所述,如果将编码设备300中的A/D转换器305,音频数据输入单元310以及变换单元320的结构与现有技术1的编码设备1000中的相应单元进行比较,本实施例与现有技术1的本质区别在于A/D转换器305中的采样频率是加倍的(44.1kHz),音频数据输入单元310的分离长度是加倍的(4096个取样),以及变换单元320的MDCT321中的编码单元是加倍的(4096个取样)。
而且,如果本实施例与现有技术2相比较,前者与后者的本质区别在于在音频数据输入单元310中的分离长度是加倍的(4096个取样)以及变换单元320中的MDCT321中的编码单元是加倍的(4096个取样),尽管A/D转换器中的采样频率是相同的。
结果是,变换单元320输出属于11.025kHz或者更小的低频带内的频谱数据的1024个取样(以后被称为“低频带的频谱数据”),以及属于高于11.025kHz的高频带内的频谱数据的1024个取样(以后被称为“高频带内的频谱数据”),就是总共2048个频谱数据取样。
变换单元320的分组单元322将待被编码的频谱数据的2048个取样分组为多个比例因子频带,每一个都包括至少由一个取样构成的频谱数据(或者,实际的说,取样的总共的数目是4的倍数)。
根据AAC,包含在每个比例因子频带内的频谱数据的取样的数目根据其频率而被定义。低频带的比例因子频带通过较少的频谱数据被确定得较窄,高频带的比例因子频带通过较多的频谱数据被确定得较宽。在AAC中,与一帧的频谱数据相应的比例因子频带的数目也可以根据采样频率来定义。例如当采样频率为例如44.1kHz的时候,每一帧包括49个比例因子频带,并且49个比例因子频带包括1024个取样的频谱数据。另一方面,其没有在AAC中被具体定义,比例因子频带将在这些比例因子频带中被传送,而起根据传输信道的传输速率选择的最期望的比例因子频带将被传送。当传输速率例如为96kbps的时候,在一帧中的低频带内仅有40个比例因子频带(640个取样)将被有选择的传送。
另一方面,在本实施例中,在两帧中的频谱数据(分别在低频带和高频带内的1024个频谱数据)以两倍于传统方法中的采样频率(大约45.4msec)从MDCT321中输出。这样,当传输信道的传输速率为96kbps的时候,即使如果在两帧之中的低频带内的所有比例因子频带(1024个取样)都被传送,在传输信道内仍然存在着剩余的足够的容量,这是与相应于传统的AAC的两帧(640×2=1280取样)的传输相比较而言。因此,本实施例将假定分组单元332将变换的频谱数据分组为其确定和数目是被唯一确定的比例因子频带而进行解释。
数据划分单元330将变换单元320输出的2048个频谱数据取样分为低频带内的1024个频谱数据以及高频带内的1024个频谱数据。数据划分单元330分别将低频带内划分的1024个频谱数据输出到第一量化单元340,将高频带内的1024个频谱数据输出到第二量化单元345。
第一量化单元340为低频带内的每一个比例因子频带确定一个用于自数据划分单元330所传送的频谱数据的比例因子,利用该确定的比例因子量化该比例因子频带内的频谱,并将作为量化结果的量化值,确定的第一比例因子,以及第一和每个接下来的比例因子之间的差输出给第一编码单元350。第一量化单元340包括一个比例因子计算单元341。比例因子计算单元341计算一个标准化因子(比例因子,8比特)从而使得在每一个比例因子内的频谱数据都在一个预定数目的比特以内,利用该计算的比例因子量化比例因子频带内的每一个频谱,然后计算该比例因子与第一个比例因子之间的差。
第一编码单元350将第一个量化单元340所量化的数据,用于每一个比例因子频带的比例因子等,编码成一个预定的流格式,并且包括一个用于进一步压缩每一个量化数据,每一个比例因子等的霍夫曼编码表351。尤其是,第一编码单元350利用霍夫曼表351编码每一个量化的数据,每一个比例因子等,从而能够以低比特率而被传输。
第二量化单元345在没有被第一量化单元340量化的带宽内,就是高于11.025kHz的高频带内,根据数据划分单元330输出的频谱数据计算子信息,并将其输出。第二量化单元345包括一个子信息产生单元346,用于产生子信息。
子信息是一个根据高频带内的频谱数据计算的简化信息,并且简明的表明了具有较少数量信息的高频带内的频谱数据的特性。换句话说,它是表明高频带的频谱数据特性的信息,其中这些特性是通过变换在一个特定的时间长度内接收的音频数据而获得的。特别是,子信息是用于获得绝对值最大的频谱数据(绝对值为最大的频谱数据)的量化值“1”的高频带内的每一个比例因子频带的比例因子,以及其量化值。
第二编码单元355将第二量化单元345输出的子信息编码为预定的流格式,并且输出编码的信息作为第二编码信息。第二编码单元355包括一个用于编码子信息的霍夫曼编码表356。
流输出单元390在上述的第一编码单元350输出的第一编码信号中加入报头(header)信息和其他必要的子信息,并将其变换成一个MPEG-2 ACC比特流。流输出单元390也将第二编码单元355所输出的第二编码信号记录在上述的被传统的解码设备所忽略的或者其操作没有被定义的比特流的区域。特别是,流输出单元390将第二编码单元355输出的编码信号存储在MPEG-2 ACC编码比特流的填充部分(FillElement),数据流部分(Data Stream Element,等)。
对于存储在报头信息中的表明比特流的采样频率的信息,音频数据的采样频率的一半的值被存储。换句话说,当音频数据的采样频率为44.1kHz的时候,22.05kHz的信息,即实际值的一半被存储。并且表明44.1kHz的实际采样频率的信息被存储在上述的子信息被存储的区域或者类似的区域。
编码设备300输出的比特流通过传输介质利用无线电波,光缆,闪光,金属线等,诸如互联网被传送到解码设备400。
如上所述,当在频率域量化和编码由变换单元320所获得的频谱数据的时候,编码设备300将其划分成低频带内的频谱数据(1024个取样)和高频带内的频谱数据(1024个取样),以传统的方法量化和编码低频带内的频谱数据,利用不同的方法量化和编码高频带内的频谱数据(产生子信息并编码子信息),将高频带内的编码比特流合成到低频带内,并将其输出。编码设备300与传统的编码设备1000的本质区别在于编码设备1000整体上采样同样的方法量化和编码频谱数据。
结果是,音频数据能够被编码从而再生高质量的声音,同时不会增加信息总量。
而且,由于表明22.05kHz的采样频率的信息被存储在报头当中,产生的效果是本实施例中的编码设备300所产生的比特流也能够利用传统的解码设备2000来解码。
(解码设备400)
本实施例中的解码设备400是一种能够通过以与编码设备300近似相反的方式对编码单元300所输出的比特流执行处理从而能够在时间域再生音频信号的设备(再生频率为22.05kHz或者更小)。解码设备400包括一个流输入单元410,第一和第二解码单元420,425,第一和第二解量化单元430,435,一个解量化数据集成单元440,一个逆变换单元480,一个音频数据输出单元490,以及一个D/A转换器495。
当通过传输介质接收到编码设备300编码的比特流的时候,流输入单元410选择一个存储在由传统的解码设备所使用的区域中的第一编码信号和一个存储在被传统的解码设备所忽略或者其操作没有被定义的区域中的第二编码信号,并分别将其输出给第一解码单元420和第二解码单元425。
第一解码单元420接收流输入单元410输出的第一编码信号,然后将其解码从而再生为量化数据,该单元还包括一个霍夫曼解码表421。
第一解量化单元430解量化第一解码单元420解码的量化数据并输出频谱数据,该单元还包括一个处理单元431,用于根据公式对量化的数据进行解量化。这里,第一解量化单元430所输出的频谱数据的取样数目是1024个,它们表示11.025kHz或者更小的再生带宽。
第二解码单元425接收流输入单元410所输出的第二编码信号并且解码子信息,该单元还包括一个霍夫曼解码表426。
第二解量化单元435在高频带内产生频谱数据,该单元还包括一个频谱数据产生单元436。这里,第二解量化单元435所输出的频谱数据的取样数目是1024个,它们表示高于11.025kHz的再生带宽。
频谱数据产生单元436根据预定的处理程序,基于第一解量化单元430所输出的频谱数据产生噪声,根据第二解码单元425所输出的子信息对噪声进行定形,并且输出高频带内的频谱数据。这一噪声包括白噪声,粉噪声(pink noise)以及低频带内的部分或者全部频谱数据的复制。
特别是,频谱数据产生单元436预先复制第一解量化单元430所输出的低频带内的频谱数据,将其复制到高频带内,然后通过将该比例因子频带内的每个频谱数据乘以作为一个系数的比值而在高频带内重建频谱数据,这个比值是在高频带内的每个带内复制的频谱数据的绝对最大值与对利用与子信息中描述的带相应的比例因子值来对量化的值“1”进行解量化所得到的值之间的比。
解量化数据集成单元440将第一解量化单元430所输出的频谱数据与第二解量化单元435所输出的频谱数据进行集成。这里,解量化数据集成单元440所输出的频谱数据的取样数目是2048个,它们表示0~22.05kHz的再生带宽。
如上所述,解码设备400将编码设备300所编码的比特流分成分别存储在传统的解码设备所使用的区域内的第一编码信号(在低频带内)以及存储在被传统的解码设备所忽略或者其操作没有被定义的区域内的第二编码信号(在高频带内),利用与传统方法同样的方法仅对第一编码信号(低频带内)解码和解量化,利用与传统的方法不同的方法对第二编码信号(高频带内)解码和解量化,集成在高频带和低频带内的频谱数据,并且输出集成的数据。在这一点上,解码设备400与现有技术1,2中的解码设备2000的本质区别在于解码设备2000以同样的方法对全部带宽内的比特流进行解码和解量化。
结果是,用与传统的方法近似相同的较少数量的信息能够解码远远大于传统方法的信息量,这样音频信号能够被解码从而再生高质量的声音。
逆变换单元480对解量化数据集成单元440所输出的频率域的频谱数据执行IMDCT,将其变换成时间域内的2048个取样(2帧)的音频数据。
音频数据输出单元490将逆变换单元480获得的时间域的若干组2048个取样的音频数据相互合并,并以时间顺序将其逐个输出。
D/A转换器495利用44.1kHz的采样频率将数字音频数据转换成模拟音频信号。
如上所述,解码设备400与现有技术1中的解码设备2000的本质区别在于在逆变换单元480中的逆变换单元是加倍的(2048个取样),音频数据输出单元490中的帧长度是加倍的(2048个取样)以及D/A转换器495中的采样频率是加倍的(44.1kHz)。
结果是,根据11.024kHz或者更低的低频带内的频谱数据(1024个取样)以及高频带内的频谱数据(1024个取样),音频信号被输出从而在高频带内(0~22.05kHz)再生高质量的声音。
如上所述,根据本发明的功能结构,音频数据能够被解码从而再生高质量的声音,这是基于与传统的方法几乎相同的信息数量,通过以传统的方法解码低频带内的数据以及利用非常少的信息量解码高频带的频谱数据来实现的。
而且,在本实施例的编码设备300和解码设备400中,数据划分单元330,第二量化单元345以及第二编码单元355是被加到传统的编码设备1000中的,第二解码单元425,第二解量化单元435以及解量化数据集成单元440被加到了传统的解码设备2000。这样就产生了一个效果就是本实施例中的编码设备300和解码设备400能够在完全不改变传统的编码设备1000和解码设备2000的情况下而实现。
也存在了另一个效果就是本实施例中的编码设备300所产生的比特流能够由传统的解码设备2000来解码。
接下来,将详细的描述广播系统1中的编码设备300中的每一个单元所执行的编码处理。
附图3A和附图3B是表明图2所示的编码设备300的音频数据输入单元310和变换单元320所处理的音频信号的状态变化的图。尤其是,附图3A表明图2所示的音频数据输入单元310所分离的时间域的2048个取样数据的波形,附图3B表明在时间域的取样数据被图2所示的变换单元320中的MDCT321变换以后在频率域所产生的频谱数据的波形。应当注意在附图3A和3B中绘出的取样数据和频谱数据都图示为模拟的波形,尽管实际上它们都是数字信号。在接来的表明波形的图中它们是真实的。
音频数据输入单元310接收在44.1kHz的采样频率采样的音频数据。根据该数字音频信号,音频数据输入单元310将音频数据分离成具有在2048个取样被覆盖前后获得的两组1024个取样的每个连续的2048个取样,然后这些取样被输出到变换单元320。
变换单元320对总共4096个取样数据执行MDCT。根据MDCT所产生的频谱数据的波形被对称排列,因此仅有与2048个取样相对应的一半的频谱数据被输出,如图3B所示。
在附图3B中,垂直轴表示频率频谱数据的值,就是在相应于取样数目的2048个点,在附图3A中所示的表示2048个取样的电压值表示的音频数据的频率分量的数量(大小)。由于输入到编码设备300的音频信号是以44.1kHz的采样频率进行A/D转换的,因此频谱数据的再生带宽是22.05kHz。而且,由于MDCT321所产生的频谱具有如图3B所示的负值,当编码频谱的时候,MDCT321所产生的频谱的正负符号也需要被编码。在下面的解释当中,表示频谱数据的正负符号的信息被称为“符号信息”。
变换单元320所输出的频谱数据和符号信息被数据划分单元330划分成0~11.025kHz的低频带的数据和信息以及高于11.025kHz的高频带内的数据和信息,低频带内的频谱数据和符号信息被输出到第一量化单元340,高频带内的数据和信息被输出到第二量化单元345。
附图4是表明图2所示的第一量化单元340所执行的比例因子确定处理的操作流程图。
第一量化单元340首先确定一个对每一个比例因子而言是共同的比例因子作为比例因子的初始值(S91),利用预定的比例因子量化低频带内的将作为一帧音频数据(1024个取样)而被传送的所有频谱数据,计算在计算的比例因子之前和之后的比例因子之间的差,对差、第一比例因子和频谱数据的量化值进行霍夫曼编码(S92)。应当注意这里的量化和编码仅是为了计数比特数目而被执行的。因此,仅有数据被量化和编码,为了简化处理诸如报头的信息没有被加入。
接下来,第一量化单元340判断霍夫曼编码数据的比特数目是否超过了一个预定的比特数目(S93),如果超出了,减小比例因子的初始值(S101)。然后,第一量化单元340利用减小的比例因子值再次量化和霍夫曼编码低频带内的同样的频谱数据(S92),判断低频带内的用于一帧的霍夫曼编码的数据的比特数目是否超出了预定的比特数目(S93),并且重复这一过程直至其成为预定数目的比特或者更少。
当低频带内的编码数据的比特数目没有超出预定的值,第一量化单元340对每一个比例因子频带重复下述的处理过程,并确定了每个比例因子频带的比例因子(S94)。首先,对比例因子频带内的每一个量化的值解量化(S95),计算解量化的值与相应的原始频谱数据值之间的绝对值的差,并将其相加(S96)。接下来,判断计算的差的总和是否在可以接受的限度以内(S97),如果其在可接受的限度以内,在下一比例因子频带重复上述的处理过程(S94~S98)。
另一方面,它超出了可接收的限度,第一量化单元340增加比例因子值,量化该比例因子频带内的频谱数据(S100),接下来解量化量化的值(S95)并将解量化的值的绝对值和相应的频谱数据值之间的差相加(S96)。接下来,第一量化单元340判断差的总和是否在可接收的限度以内(S97),如果它超出了限度(S100),就增加比例因子值直至它成为一个位于限度内的值(S100),并重复上述的处理过程(S95~S97和S100)。
当第一量化单元340判断对于所有的比例因子频带,在以比例因子对量化的数据进行解量化得到的数据值和相应的原始频谱数据值之间的绝对值的差的总和在可接受的限度以内(S98),它使用确定的比例因子再次对一帧的在低频带内的频谱数据进行量化,对每一个比例因子的差,第一个比例因子及该频谱数据的量化值进行霍夫曼编码,并且判断低频带内的编码数据的比特数目是否超出了一个预定的比特数(S99)。如果低频带内的编码数据的比特数超出了预定的值,第一量化单元340减小比例因子的初始值,直至它变成预定的数目或者更小(S101),然后在每一个比例因子频带内重复确定比例因子的处理过程(S94~S98)。如果低频带内的编码数据的比特数没有超出预定的值(S99),那么就确定当时的每一个比例因子的值为用于每个比例因子频带的比例因子。
第一量化单元340利用上面确定的比例因子量化低频带内的频谱数据,并将量化的值,第一比例因子,确定的第一比例因子和接下来的比例因子之间的差,以及数据划分单元330所接收的符号信息输出给第一编码单元350。
应当注意在比例因子频带内对量化的数据进行解量化得到的数据值和相应的原始频谱数据值之间的绝对值的差的总和是否在可接受的限度以内是根据心里声学模式等的数据进行被判断的。
而且,在上述的情况中,一个相对较大的值被设定作为比例因子的初始值,当低频带内的霍夫曼编码的比特数目超出一个预定的比特数目的时候,比例因子的初始值就被减小从而来确定比例因子,但是比例因子并不是经常需要以这种方式被确定的。例如,一个较低的值可以被预先设定为比例因子的初始值,并且初始值能够逐渐的增加。并且每一个比例因子频带内的比例因子可以利用比例因子的初始值被确定,该比例因子初始值是在低频带内的编码数据的总共比特数首次超出一个预定的比特数目之前被设定的。
而且,在本实施例中,每一个比例因子频带的比例因子都被确定使得低频带内的一帧的编码数据的总共的比特数不超过预定的数目,但是比例因子并不是总是需要以这种方式被确定。例如,比例因子能够被确定从而使得在每一个比例因子频带内,在比例因子频带内的每一个量化的值都不超出预定的比特数目。下面将参照附图5解释在这一处理过程中第一量化单元340的操作过程。
附图5是表明图2所示的第一量化单元340的另一个比例因子确定处理的操作流程图。
第一量化单元340对于所有的比例因子频带,计算将要根据下面的处理过程而被编码的低频带内的比例因子(S1)。而且,第一量化单元340根据下面的处理过程计算用于每一个比例因子频带内的所有的频谱数据的比例因子(S2)。
首先,第一量化单元340根据公式利用一个预定的比例因子值量化频谱数据(S3),并且判断量化的值是否超过用于表明量化值的给定的预定比特数目,例如4比特(S4)。
当量化的值超出4比特作为判断结果的时候,第一量化单元340就调整比例因子的值(S8),并且利用调整的比例因子值量化同样的频谱数据(S3)。第一量化单元340判断获得的量化值是否超出4比特(S4),并且重复比例因子的调整(S8)以及调整的比例因子的量化(S3)直至频谱数据的量化值为4比特或者更少。
当量化的值是4比特或者更少作为判断结果的时候,它将利用预定的比例因子值量化下一个频谱数据。
当一个比例因子频带内的所有频谱数据的量化的值为4比特或者更少的时候(S5),第一量化单元340就确定当时的比例因子为用于比例因子频带的比例因子(S6)。
当确定了所有比例因子频带的比例因子以后(S7),第一量化单元340就结束该处理。
根据上面的处理,对于所有的将被编码的低频带内的比例因子频带,每个比例因子都被确定。第一量化单元340利用以上述的方式确定的比例因子来量化低频带内的频谱数据,并且将作为量化结果的4比特的量化值,8比特的第一比例因子,第一比例因子和后面的比例因子之间的差,还有从数据划分单元330接收的符号信息输出到第一编码单元132。
量化的值,比例因子和第一编码单元350输出的其它值是霍夫曼编码的,并且如在向下取样的情况中,作为第一编码信号被输出到流输出单元390。
另一方面,第二量化单元345根据高频带中的频谱数据等产生子信息。
附图6是表明附图2所示的第二量化单元345所产生的子信息(比例因子)的实施例的频谱波形图。附图7是表明图2所示的第二量化单元345所执行的子信息(比例因子)计算处理的操作流程图。
在图6中,在低频带的频率轴上标出的界符(delimiter)表明在本实施例中确定的比例因子频带的比例因子。而且,在高频带内的频率轴上用虚线标出的界符表明在本实施例中确定的高频带内的比例因子频带的比例因子。在接下来的波形图中这些是真实的。
在变换单元320输出的频谱数据中,11.025kHz或者更小的低频带内的再生带宽,在附图6中以实线波形表示,被输出到第一量化单元340,并如通常一样对其进行量化。另一方面,在高于11.025kHz~22.05kHz的高频带内的再生带宽,在图6中用虚线表示,由第二量化单元345所计算的子信息(比例因子)所代表。
下面将参照附图7的流程图,利用附图6所示的实施例来解释第二量化单元345中的子信息(比例因子)计算过程。
根据下面的处理(S11),第二量化单元345计算用于在具有再生带宽大于11.025kHz直到22.05kHz的高频带内的每一个比例因子频带的每一个比例因子频带内导出绝对值最大的频谱数据的量化值“1”的最佳比例因子。
第二量化单元345指定在具有大于11.025kHz的再生带宽的高频带内的第一比例因子频带的绝对最大频谱数据(峰值)(S12)。在图6所示的实施例中,①表示在第一比例因子频带内指定的峰值,峰值的值为“256”。
根据与图5中所示的流程图相同的处理过程,第二量化单元345计算用于导出通过在公式中赋予峰值“256”和比例因子的初始值而得到的量化值“1”的比例因子值“sf”(S13)。在这种情况下,例如,计算出的“sf”=24(“sf”是用于导出峰值“256”的量化值“1”的比例因子)。
当为第一比例因子频带计算出用于导出量化的峰值“1”的比例因子“sf”=24的时候(S14),第二量化单元345指定下一个比例因子频带内的频谱数据的峰值(S12),如果指定的峰值位置是②并且值为“312”,就计算用于导出峰值“312”的量化值“1”的比例因子的值,例如,“sf”=32(S13)。
以同样的方式,第二量化单元345分别计算高频带内的用于导出峰值③“288”的量化值为“1”的第三比例因子频带的比例因子值,“sf”=26,以及用于导出峰值④”203”的量化值为“1”的第四比例因子频带的比例因子值,例如“sf”=18。
当以这种方式计算出了高频带内的每一个比例因子频带的用于导出峰值的量化值为“1”的比例因子的时候(S14),第二量化单元345将计算所得的每一个比例因子频带的比例因子输出给第二量化单元355作为高频带内的子信息,然后结束处理。
子信息(比例因子)是通过第二量化单元345产生的,如上所述。如果对于在高频带内的每一比例因子频带(在这种情况下,为4个频带),以频谱数据的1024个取样表示的子信息(比例因子)是以0到256的数字值表示的,那么它能够用8比特来表示。而且,如果对应比例因子的差是霍夫曼编码的,很可能数据量会进一步降低。另一方面,如果高频带内的频谱数据的1024个取样被以传统的低频带内的处理方式被量化和霍夫曼编码,预测的数据量至少为300比特。因此,该子信息仅是表示了高频带内的各比例因子频带的一个比例因子,很明显,与传统方法中高频带的量化相比较,数据量明显的减少了。
而且,比例因子表示了每一个比例因子频带内的与峰值(绝对值)近似成比例的值,因此可以说高频带内为固定值的1024个取样的频谱数据或者通过将低频带内的部分或者全部频谱数据的拷贝与比例因子相乘所获得的频谱数据大致的重建了根据输入音频信号所获得的频谱数据。而且,对于每一个比例因子频带,频谱数据能够通过将频带内的每一个频谱数据乘以作为一个系数的比值来更为精确的重建,该比值是带该频带复制的频谱数据的绝对最大值与利用与该频带相对应的比例因子值对量化值“1”进行解量化所得到的值之比。而且,高频带内的波形的差异没有低频带内的差异明显,因此上述获得的子信息足够用作表示高频带内的波形的信息。
在本实施例中,比例因子被计算从而使得高频带内的每一个比例因子频带内的频谱数据的量化值为“1”,但是它并不需要总为“1”,可以为其它的值。
第二量化单元345产生的子信息被第二编码单元355霍夫曼编码,并被流输出单元390作为第二编码信号存储在传统的解码设备所忽略的或者其操作没有被定义的比特流的区域中。
附图8A~8C是表明图2所示的流输出单元390存储的子信息的比特流的区域的图。在这些图中,表示高频带内的频谱的子信息被编码,然后作为第二编码信号被存储在比特流中没有被识别为第二音频编码信号的区域。
在附图8A中,阴影部分是被称为填充部分(fill element)的一区域,它被填入”0”从而一致化比特流的数据长度。即使表示高频带内的频谱的子信息,就是第二编码信号,被存储在该区域,在传统的解码设备2000中,它不会被识别为将被解码的编码信号而被忽略。
在附图8B中,例如阴影部分是被称为数据流部分(DSE)的区域。该区域在MPEG-2 AAC的未来扩展的预期中被提供,并且只有其物理结构在MPEG-2 AAC中被定义。如在填充部分中,即使表示高频带内的频谱的子信息被存储在该区域,传统的解码设备2000将其忽略,或者由于应由传统的解码设备2000执行的操作没有被定义,其不会响应于读取信息而执行任何操作。
在上面的描述中,包含在MPEG-2 AAC比特流中的第二编码信号被存储在一个被传统的解码设备2000所忽略的区域中。但是,第二编码信号可以被集成到报头信息的一个预定的区域内,或者第一编码信号的预定区域内,或者报头和第一编码信号二者的区域中。为了在比特流中存储第二编码信号不需要保证报头信息和第一编码信号的连续区域。例如,第二编码信号可以直接集成到报头信息和第一编码信息之间,如图8C所示。
附图9A和9B表明图2所示的流输出单元390存储的子信息的比特流的区域的其它实施例的图。附图9A表明一个流1,在该流中,在每一帧内仅有第一编码信号被连续存储。附图9B表明一个流2,在该流中在每一帧中仅有第二编码信号,就是编码的子信息被连续存储与流1相对应。
流输出单元390可以存储流2中的第二编码信号,流2与其中存储着第一编码信号的流1完全不同。例如,流1和流2是通过不同的信道传送的比特流。
如上所述,由于表示输入音频信号的基本信息的低频带通过在完全不同的比特流中传送第一和第二编码信号而被预先传送或者存储,就产生了一个效果,如果必须的话,可以在后面加上高频带的信息。
在附图8A和8B以及附图9A和9B所示的格式中,表明是实际采样频率一半的22.05kHz的信息被存储在表明将被存储在报头中的比特流的采样频率的信息当中。因此,即使现有技术1中的解码设备2000在向下采样的情况下也能够解码频率在0~11.025kHz的频带内的比特流并能够将其再生。
本实施例的编码设备300的方法和现有技术1的编码设备1000的方法的区别将参照附图10A和10B进行解释。附图10A和10B示出了本实施例与现有技术1的方法之间的比较。特别是,附图10A表明了本实施例中的方法,附图10B表明了现有技术1中的方法。
根据本实施例的方法,在44.1kHz的采样频率每隔22.7μ秒获得一串音频数据串,总共4096个取样数据,就是,包含在将被编码的一帧中的2048个取样和该帧前后的两组1024个取样,这些数据被分离并被执行MDCT,然后就获得了频谱数据的2048个取样。该频谱数据的再生带宽表示22.05kHz。频谱数据的这些2048个取样以11.025kHz为界限被划分成低频带内的频谱数据(1024个取样)和高频带内的频谱数据(1024个取样)。低频带内的频谱数据(1024个取样)以通常的方式被量化和编码,这样就获得了如向下取样的具有较高质量的以及低比特率的第一编码信号。并且高频带的1024个取样的频谱数据也被得到。如果这些数据被以通常的方式量化和编码,就无法实现低比特率。因此,在本实施例的方法中,根据高频带内的频谱数据的1024个取样产生一个子信息,通过仅对该子信息进行编码获得了第二编码信号。因此一个音频信号能够被编码从而再生高质量的声音,同时基本上不会增加信息总量。
另一方面,在现有技术1的向下采样的方法中,在22.05kHz的采样频率每隔45μ秒获得一串音频数据串,总共2048个取样数据,就是包含在将被编码的一帧中的1024个取样以及在该帧前后的两组512个取样,这些数据被分离并被执行MDCT,然后就获得了频谱数据的1024个取样。该频谱数据的再生带宽表示11.025kHz。频谱数据的1024个取样以通常的方式被量化和编码。这样,就能够获得在11.025kHz或者更小的带宽内的高质量的编码信号,但是无法获得高于11.025kHz的高频带内的编码信号,因为在高频带内没有频谱数据。
接下来,将参照附图11A和11B描述本实施例的编码设备300的方法和现有技术2的编码设备的方法之间的区别。
附图11A和11B表明了本实施利与现有技术2的方法之间的比较。特别是,附图11A表明本实施例中的方法,附图11B表明现有技术2的方法。由于本实施例中的方法已经在上面解释过了,这里将省略有关的描述。
在现有技术2的采样方法中,以在44.1kHz的采样频率每隔22.7μ秒获得一串音频数据串,总共2048个取样数据,就是包含在将被编码的一帧中的1024个取样以及在该帧前后的两组512个取样,这些数据被分离并被执行MDCT,然后就获得了频谱数据的1024个取样。该频谱数据的再生带宽表示22.05kHz。频谱数据的1024个取样以通常的方式被量化和编码。换句话说,每隔本实施例中的时间长度(22.7msec)的一半的时间获得了频谱数据的1024个取样(11.025kHz或者更低的低频带内的512个取样和高于11.025kHz的高频带内的512个取样)。
这里,假设在现有技术2的编码设备1000中,如同本发明的实施例中的情况一样,自高于11.025到22.05kHz的高频带内的频谱数据产生子信息。在这种情况下,当能够在每隔22.7msec进行的量化中使用的比特数目是“n”并且能够被用作子信息的比特数目为“m1”的时候,低频带(0-11.025kHz)内的512个取样需要利用(n-m1)个比特来量化。另一方面,在本实施例中,当能够在每隔45.4msec进行的量化中使用的比特数目是“2xn”并且能够被用作子信息的比特数目是“m2”的时候,低频带(0~11.025kHz)内的1024个取样可用(2xn-m2)个比特来量化。
顺便提一下,如众所周知的,根据AAC,如果不能获得一定数目或者更多的取样,就无法实现高的编码效率。现有技术2中的512个取样没有达到门限值,而本实施例中的1024个取样却大大的超出了该门限值。
因此,根据本实施例,如果1024个取样被利用(2xn-m2)个比特来量化,而不是像现有技术2那样利用(n-m1)个取样对512个取样进行量化,就能够实现更高的编码效率。而且,由于在本实施例中实现了更高的编码效率,“m2”可以更大(m2>2×x1),因此高频带内的声音质量能够被改善。
附图12表明了本实施例与现有技术1和2的编码方法中的频谱数据和特性的比较。
在本实施例中,采样频率是44.1kHz,帧长度为2048个取样。因此,就能够获得在0~11.025kHz的低频带内的频谱数据的1024个取样以及基于高频带内的1024个频谱数据的子信息。结果是,带宽与现有技术2中的带宽近乎相同,但是比现有技术1的带宽宽。而且,在0~11.025kHz的低频带内的声音质量与现有技术1的相同,但是就整体而言在高于11.025kHz的高频带内的声音质量更高,因为在本实施例中具有子信息。此外,由于具有子信息,本实施例在高于11.025kHz到22.05kHz的高频带内的声音质量与现有技术2的相同,但是在0~11.025kHz的低频带内的声音质量更高,因为频谱数据的数目被加倍。这样,整体而言,本实施例中的声音质量较高。
另一方面,在现有技术1中,采样频率为22.05kHz,帧长度为1024个取样。频谱数据的1024个取样在0~11.025kHz的低频带内获得。结果是,现有技术1的带宽较窄仅为本实施例的一半。因此,0~11.025kHz的低频带内的声音质量与本实施例中的相同,但是在高于11.025kHz到22.05kHz的高频带内的声音质量低于本实施例,因为现有技术1中在高频带内没有频谱数据。因此,就整体而言,现有技术1的声音质量较低。
而且,在现有技术2中,采样频率为44.1kHz,帧长度为1024个取样。频谱数据的1024个取样是在0~22.05kHz的整个频带内获得的。结果是,现有技术2的带宽与本实施例相同,但是因为频谱数据的数目被减少为一半,在0~11.025kHz的低频带内的声音质量被劣化,低于本实施例。尽管由于频谱数据被编码,其在高于11.025kHz到22.05kHz的高频带内高于本实施例。但是,就整体而言,现有技术2的声音质量较低。
因此,根据本实施例,通过以通常的方式编码低频带内的数据并且利用非常少量的信息编码高频带内的数据,一个音频信号就能够被编码从而再生高质量的声音,而不会增加信息的总量。
接下来,将详细的描述在广播系统1中的解码设备400的每一个单元的解码处理。
从流输入单元410输出的第一编码信号被第一解码单元420解码成量化数据等,并被第一解量化单元430编码成低频带内的频谱数据。另一方面,流输入单元410输出的第二解码信号被第二解码单元425解码成子信息。第二解量化单元435根据该子信息产生高频带内的频谱数据。接下来将详细描述第二解量化单元435的处理过程。
附图13是一个表明附图2中所示的第二解量化单元435将低频带内的1024个取样的频谱沿前向方向(forward direction)上被复制到高频带的处理过程的流程图。当高频带内的频谱数据产生的时候,低频带内的频谱数据被复制。
在附图13中,inv_spec1[i]表示从第一解量化单元430输出的数据中的第i个频谱的值,inv_spec2[j]表示从第二解量化单元435输入的数据中的第j个频谱的值。
首先,第二解量化单元435设定计数器i和计数器j的初始值为“0”,而计数器计数频谱数据的数目,从而在同一方向上输入从0到第1023个频谱数据(S71)。接下来,第二解量化单元435检查计数器i的值是否小于“1024”(S72)。当计数器i的值小于“1024”的时候,第二解量化单元435输入第一解量化单元430的低频带内的第i个(在这种情况下为第0个)频谱数据的值作为第二解量化单元435的高频带内的第j个(在这种情况下为第0个)频谱数据的值(S73)。然后,第二解量化单元435分别将计算器i和计数器j的值加1(S74),并检查计算器i的值是否小于“1024”(S72)。
当计算器i的值小于“1024”的时候,第二解量化单元435重复上述的过程,当其值成为“1024”或者更大的时候,该处理过程结束。
结果是,作为第一解量化单元430的解量化结果的低频带内的所有的第0~1023个频谱数据被复制成第二解量化单元435的高频带内的频谱数据。
根据第二解码单元425解码的子信息复制的频谱数据的幅度,就是,用于推导出峰值“1”的比例因子的值,被调整,并且被调整的频谱数据被输出作为高频带的频谱数据。幅度是通过将频带内的每一个频谱数据乘以一个比值来调整的,该比值是该频带内的复制频谱数据的绝对最大值与通过使用与该频带相应的比例因子的值对量化值“1”进行解量化而获得的值之间的比,该比值作为每一个比例因子频带的一个系数。这里,第二解量化单元435输出的频谱数据的取样数据的最大数目是1024,它们表示高于11.025kHz的再生带宽。
用于将低带频带内的1024个频谱数据沿频率轴的前向方向复制到高频带内的处理过程在图13中示出,但是它们也可以在相反的方向上被复制,如图14所示。
附图14是一个表示附图2中所示的第二解量化单元435将低频带内的1024个频谱沿频率轴的相反方向复制到高频带内的处理过程的流程图。在附图14中,如同附图13中的情况,inv_spec1[i]表示从第一解量化单元430输出的数据中的第i个频谱数据的值,inv_spec2[j]表示从第二解量化单元435输入的数据中的第j个频谱数据的值。
首先,第二解量化单元435设定计算器i的初始值为“0”,计数器j的初始值为“1023”,其计数频谱数据的数目,从而在相反方向上输入从0到第1023个频谱数据(S81)。接下来,第二解量化单元435检查计数器i的值是否小于“1024”(S82)。当计数器i的值小于“1024”的时候,第二解量化单元435输入第一解量化单元430的低频带内的第i个(在这种情况下为第0个)频谱数据的值作为第二解量化单元435的高频带内的第j个(在这种情况下为第0个)频谱数据的值(S83)。然后,第二解量化单元435将计算器i的值加“1”,计数器j的值减1(S84),并检查计算器i的值是否小于“1024”(S82)。
当计算器i的值小于“1024”的时候,第二解量化单元435重复上述的过程,当其值成为“1024”或者更大的时候,该处理过程结束。
结果是,作为第一解量化单元430的解量化结果的低频带内的所有的第0~1023个频谱数据在相反方向上被复制成第二解量化单元435的高频带内的第0~1023个频谱数据。
与前面相同,根据第二解码单元425解码的子信息复制的频谱数据的幅度,就是,用于推导出峰值“1”的比例因子的值,被调整,并且被调整的频谱数据被输出作为高频带的数据。幅度是通过对于每一个比例因子频带内将频带的每一个频谱数据乘以一个作为系数的比值来调整的,该比值是频带内复制的频谱数据的绝对最大值与通过使用与该频带相应的比例因子的值对量化值“1”进行解量化而获得的值之间的比。这里,第二解量化单元435输出的频谱数据的取样数据的最大数目是1024,它们表示高于11.025kHz的再生带宽。
在本实施例中,第二解量化单元435将低频带内的所有频谱数据复制到高频带内,但是它也可以仅复制其中的一部分。
已经参照附图13和14描述了一次全部复制高频带和低频带的处理过程的例子。但是,它们中的一部分可以根据图13所示的过程复制,另一部分根据图14所示的过程复制。
而且,它们中的部分或者全部可以通过将它们的正负符号倒转而被复制。
这些复制过程可以是预定的,或者可以根据低频带内的数据而改变,或者作为子信息而被传送。
在本实施例中,低频带内的频谱数据被复制作为高频带内的数据,但是本发明并不局限于此,并且高频带内的频谱数据可以仅根据第二编码信息而产生。
在本实施例中,对于在第二解量化单元435中的噪声的产生,描述了主要由第一解量化单元430获得的频谱数据被复制的情况。但是,本发明并不局限于此,频谱数据,白噪声,粉红噪声等在高频带内的每一个比例因子频带内具有特定值的数据都可以以其自己的方式在第二解量化单元435中被产生,或者根据子信息而产生。
从第二解量化单元435输出的频谱数据的1024个取样与解量化数据集成单元440中的第一解量化单元430输出的1024个频谱数据集成,并被执行MDCT,将其变换成时间域的音频数据,然后以44.1kHz的采样频率进行D/A转换,接下来具有0~22.05kHz的再生带宽的音频信号就被再生。
如上所述,根据本发明,2048个取样的频谱数据中的第一个1024个取样以通常的方式使用MDCT和IMDC被编码,具有传统方式两倍的变换长度,后面的一半1024个取样被用比传统方式少量的信息编码,两个频谱数据都被集成从而用于解码。
由于用于编码后面的一半1024个取样的频谱数据所需的信息量可被降低,用于编码前面的一半的1024个取样的频谱数据所需的信息量能够被增加,因此,高于宽带宽的频谱数据能够被编码,同时低频带内的原始信号的再生精度能够被提高。
而且,本实施例中的编码设备所产生的比特流能够被传统的解码设备所解码。
接下来,将解释子信息和其解码的各种变型。
附图15示出了表明图2所示的第二量化单元345所产生的其它子信息(量化值)的实施例的频谱波形。附图16是一个表明在图2中所示的第二量化单元345所执行的其它子信息(量化值)的计算处理的操作流程图。
第二量化单元345预先设定了一个比例因子的值,例如“18”,该比例因子对于具有高于11.025kHz到22.05kHz的再生带宽的高频带内的所有比例因子频带是共同的,使用该比例因子值“18”在每一个比例因子频带内计算绝对最大的频谱数据(峰值)的量化值(S21)。
第二量化单元345指定具有高于11.025kHz的再生带宽的高频带内的第一比例因子频带内的绝对最大频谱数据(峰值)(S22)。在附图15所示的实施例中,①表示在第一个比例因子频带内指定的峰值,在那时的峰值为“256”。
第二量化单元345通过将预定的共同的比例因子值“18”和峰值“256”代入到用于计算量化值的公式中来计算量化的值(S23)。例如,如果峰值“256”利用比例因子值“18”来量化,计算的量化值为“6”。
当为第一比例因子带宽计算出峰值“256”的量化值“6”的时候(S24),第二量化单元345就指定下一个比例因子频带内的频谱数据的峰值(S22)。如果指定的峰值位置是②,并且峰值为“312”,例如,那么利用比例因子值“18”计算峰值“312”的量化值“10”(S23)。
以同样的方式,第二量化单元345利用比例因子值“18”计算高频带的第三个比例因子频带的峰值③“288”的量化值“9”,并且利用比例因子值“18”计算第四比例因子频带的峰值④“203”的量化值“5”。
当利用固定的比例因子值“18”计算了高频带内的所有比例因子频带的峰值的量化值的时候(S24),第二量化单元345将计算所得的每一个比例因子频带的量化值输出给第二编码单元355作为高频带的子信息,然后结束了该处理。
如上所述,第二量化单元345产生了子信息(量化值)。该子信息分别以4比特的量化值表示以频谱数据的1024个取样表示的高频带内的4个比例因子频带,而上述的子信息(比例因子)分别以8比特的频谱数据表示高频带内的4个比例因子频带。因此,在量化值的情况下,高频带内的数据量极大的减少。而且,该量化的值大致的表示了每一个比例因子频带的峰值的幅度(绝对值),也可以说取固定值的高频带内的频谱数据的1024个取样或者仅仅通过将低频带内的部分或全部频谱数据的拷贝乘以量化值所获得的频谱数据大致的重建了根据输入音频信号所获得的频谱数据。而且,对于每一个比例因子频带,频谱数据能够通过将频带内的每一个频谱数据乘以一个作为系数的比值来更加精确的重建,该比值是频带内复制的频谱数据的绝对最大值与解量化与该频带相对应的量化值所获得的值之间的比。
在本实施例中,与将被作为第二编码信息传送的量化值相对应的比例因子值被预先设定,但是最佳的比例因子值可以被计算并被加入到第二编码信息中被传送。例如,如果用于得到量化值的最大值“7”的比例因子被选定,表示量化值的比特数目仅为“3”,因此用于传送量化值所需的信息数量就会极大的降低。
附图17表明了表示图2所示的第二量化单元345所产生的另一个子信息(位置信息)的例子的频谱波形。附图18是一个流程图,表明了图2所示的第二量化单元345所执行的另一个子信息(位置信息)的计算处理的操作过程。
第二量化单元345根据接下来的处理过程在具有高于11.025kHz到22.05kHz的再生带宽的高频带内的每一个比例因子频带内指定绝对值最大的频谱数据的位置(S31)。
第二量化单元345在具有高于11.025kHz的再生带宽的高频带内的第一个比例因子频带内指定的绝对值最大的频谱数据(峰值)(S32)。在附图17所示的实施例中,①表示在第一个比例因子频带内指定的峰值和从该比例因子频带的第一个数据开始的第22个频谱数据。第二量化单元345保持该指定的峰值位置“从该比例因子频带的第一个开始的第22个频谱数据”(S33)。
当对于第一个比例因子频带的峰值位置被指定并被保持的时候(S34),第二量化单元345就指定下一个比例因子频带内的频谱数据的峰值(S32)。例如,指定的峰值被定位在②并且在该频带内从第一个开始的第60个频谱数据(S32)。第二量化单元345保持该指定的峰值位置“从该比例因子频带的第一个开始的第60个频谱数据”(S33)。
以同样的方式,第二量化单元345指定并保持高频带的第三个比例因子频带内的峰值位置③“该比例因子频带的第一个频谱数据”以及指定并保持第四个比例因子频带内的峰值位置④“从该比例因子频带内的第一个开始的第25个频谱数据”。
当高频带内的所有比例因子频带的峰值位置都被指定并保持的时候(S34),第二量化单元345将保持的比例因子频带的峰值位置输出到第二编码单元355作为高频带的子信息,然后该处理过程结束。
如上所述,第二量化单元345产生了子信息(位置信息)。该子信息(位置信息)分别以6个比特的位置信息表示以频谱数据的1024个取样表示的高频带中的4个比例因子频带。
在这种情况下,根据从第二解码单元425输入的子信息(位置信息),解码设备400中的第二解量化单元435复制低频带内的频谱数据的部分或者所有1024个取样,将其作为高频带内的取样数据的1024个取样。低频带的频谱数据可以通过在一个或多个比例因子频带内根据频谱数据的峰值信息从第一解量化单元430输出的频谱数据中抽取相似的数据,然后将其部分或者全部复制的方法而被复制。而且,如果需要的话,第二解量化单元435调整复制的频谱数据的幅度。幅度可以通过将每一个频谱数据乘以一个预定的系数,例如“0.5”来调整。该系数可以是一个固定的值,或者随每一个带宽或比例因子频带而改变,或者随第一解量化单元430所输出的频谱数据而变化。
在本实施例中,使用了一个预定的系数,但是该系数值可以被加到第二编码信息中作为子信息。或者比例因子值可以被加到第二编码信息中作为一个系数,或者比例因子频带内的峰值的量化值可以被加到第二编码信息中作为一个系数。幅度调整方法并不局限于上述的方法,也可以使用其它的方法。
在本实施例中,只有位置信息或者只有位置信息和系数信息被编码,但是本发明并不局限于此。一个比例因子,一个量化值,频谱的符号信息,噪声产生方法等都可以被编码。或者它们中的两个或多个的组合也可以被编码。
此外,在本实施例中,低频带内的频谱数据被复制作为高频带内的频谱数据。但是,本发明并不局限于此,高频带内的频谱数据也可以仅从第二编码信息来产生。
附图19表明了图2所示的第二量化单元345所产生的其它的子信息(符号信息)的例子的频谱波形。附图20是一个流程图,表明图2所示的第二量化单元345所执行的其它的子信息(符号信息)计算处理的操作过程。
第二量化单元345根据下面的处理过程,指定在具有高于11.025kHz到22.05kHz的再生带宽的高频带的每一个比例因子频带的预定位置,例如在中央的频谱数据的符号信息(S41)。
第二量化单元345检查具有高于11.025kHz的再生频带的高频带内的第一个比例因子频带内的中央位置的频谱数据的符号信息(S42),并保持该值。例如,第一个比例因子频带内的中央位置的频谱数据的符号为“+”。第二量化单元345以一个比特“1”的值表示该符号“+”并保持它。当符号为“-”的时候,第二量化单元345用“0”表示并保持。
当第一个比例因子频带内的中央位置的频谱数据的符号信息被保持的时候(S43),第二量化单元345检查下一个比例因子频带内的中央位置的频谱数据的符号(S42)。例如,符号为“+”,第二量化单元345保持“1”并将其作为第二比例因子频带内的中央位置的频谱数据的符号信息。
以相同的方式,第二量化单元345检查高频带内的第三个比例因子频带的中央位置的频谱数据的符号“+”,并保持符号信息“1”。第二量化单元345进一步检查第四个比例因子频带内的中央位置的频谱数据的符号“+”,并保持符号信息为“1”。
当高频带内的所有比例因子频带的中央位置的频谱数据的符号信息都被保持的时候(S43),第二量化单元345将保持的比例因子频带的符号信息输出给第二编码单元355作为高频带的子信息,然后该处理过程结束。
如上所述,第二量化单元345产生了子信息(符号信息)。该子信息(符号信息)分别以一个比特的符号信息表示以频谱数据的1024个取样表示的高频带内的4个比例因子频带,这样,高频带的频谱就能够利用非常短的数据长度来表示。
在这种情况下,解码设备400的第二解量化单元435复制低频带内的1024个取样的频谱数据部分或者全部数据,作为高频带的频谱,然后根据第二解码单元425输入的符号信息,确定在一个预定的位置的频谱数据的符号。
表示高频带内的每一个比例因子频带的中央位置的符号的符号信息被用作子信息(符号信息)。但是,本发明并不局限于比例因子频带的中央位置,每一个峰值位置,每一个比例因子频带的第一个频谱数据或者其它的预定位置都可以被使用。
在本实施例中,与将被传送的符号(符号信息)相应的频谱数据的位置被预定,但是它也可以根据第一解量化单元430的输出而变化,或者表明每一个比例因子频带的符号信息的位置的位置信息也可以被加入到第二编码信息并被传送。
而且,如果需要的话,第二解量化单元435调整复制的频谱数据的幅度。幅度是通过将每一个频谱数据乘以一个预定的系数,例如“0.5”来调整的。
该系数可以是一个固定值,或者可以随每一个带宽或者比例因子频带而变化,或者根据第一解量化单元430输出的频谱数据而变化。幅度调整的方法并不局限于此,其它的方法也可以被使用。
在本实施例中,使用了一个预定的系数,但是该系数值可以被加入到第二编码信息中作为子信息。或者比例因子值可以被加入到第二编码信息中作为一个系数,或者一个量化的值被加入到第二编码信息中作为一个系数。
在本实施例中,仅有符号信息,仅有符号信息和系数信息,或者仅有符号信息和位置信息被编码,但是本发明并不局限于此。一个量化的值,一个比例因子,一个特性频谱的位置信息,一个噪声产生方法等都可以被编码。或者它们中的两个或多个组合都可以被编码。
此外,在本实施例中,低频带的频谱数据被复制为高频带的频谱数据。但是,本发明并不局限于此,高频带的频谱数据也可以仅自第二编码信息产生。
在本实施例中,符号“+”以1比特的值“1”表示,符号“-”以“0”表示。但是,本发明并不局限于子信息中(符号信息)的符号的这种表示,也可以使用其它的值。/
附图21A和21B表明了表示如何产生图2所示的第二量化单元345所产生的其它子信息(复制信息)的例子的频谱波形图。附图21A表明了高频带内的第一个比例因子频带的频谱波形。附图21B表明了被指定的具有子信息(复制信息)的低频带的频谱波形的例子。附图22是一个流程图,表明图2所示的第二量化单元345所执行的其它子信息(复制信息)的计算处理操作过程。
对于具有高于11.025kHz到22.05kHz的再生带宽的高频带内的每一个比例因子频带,第二量化单元345根据下面的处理过程指定低频带内的比例因子频带的数目N(S51)。低频带内的第N个比例因子频带被指定,因为该频带的峰值位置的值最接近高频带的比例因子频带的峰值位置“n”(从比例因子频带的第一个开始的第“n”个数据)。
第二量化单元345在具有高于11.025kHz的再生带宽的高频带的第一个比例因子频带内指定绝对最大频谱数据(峰值)的位置“n”(S52)。如图21A所示,①表示指定的峰值“n”并且在该位置的频谱数据值是n=22。
第二量化单元345指定具有11.025kHz或者更小的再生带宽的低频带中的所有频谱(包括正值和负值的频谱)的峰值位置(S53)。
接下来,对于低频带内指定的每个峰值,第二量化单元345搜索自第一个比例因子频带其峰值位置最靠近“n”的比例因子频带,并指定该比例因子频带的数目N,搜索的方向以及峰值的符号信息(S54)。
特别是,对于低频带内的每一个指定的峰值(包括正负值),第二量化单元345从低频带一侧顺序搜索峰值位置最靠近“n”的第一个比例因子频带。有两个搜索的方向:(1)从低频率方向的峰值搜索以及(2)从高频率方向的峰值搜索。此外,对于低频带的峰值,其正负符号是从高频带反转来的,也存在着两种搜索方向,(3)从低频率方向的峰值搜索,以及(4)从高频率方向的峰值搜索。
在搜索方向为(2)和(4)的情况下,当低频带的频谱波形根据峰值信息被复制的时候,高频带的峰值位置和低频带的峰值位置从一端到另一端被反转(沿频率轴的方向),如图21B所示。因此,需要附加表示搜索方向的信息(前向和反向),例如,(1)和(3)为前向搜索方向,(2)和(4)为反向搜索方向。而且,在搜索方向为(3)和(4)的情况下,高频带的峰值位置和低频带的峰值位置被向上和向下反转(沿垂直轴方向),如图21B所示。因此,需要附加表示高频带和低频带的峰值的正负符号是否被反转的信息。
第二量化单元345在四个方向上进行搜索,就是,如果在低频带内指定的峰值为正的,搜索方向为(1)和(2),如果峰值为负的,搜索方向为(3)和(4),然后指定搜索结果中峰值位置最接近“n”的比例因子频带的数目。在这种情况下,一个特定的值,例如“5”被预定为“n”和实际峰值位置间的容限,第二量化单元345在四种搜索结果中选择峰值位置最接近“n”的比例因子频带,并指定该比例因子频带的数目N。此外,还指定了表明高频带和低频带中的峰值的符号是否被反转的信息以及表明搜索方向(前向或者反向)的信息。
例如,沿搜索方向(1),为低频带的频谱指定与峰值位置的容限为“1”的数目N=3的比例因子频带,如图21B(1)所示。相似的,在搜索方向(2),(3),(4),为低频带内的频谱指定与峰值位置的容限分别为“5”,“4”和“2”的数目N=18,N=12,N=10的比例因子频带。第二量化单元345在这些指定的四个数目的比例因子频带中选择与峰值位置的容限为“1”且峰值位置最接近“n”的比例因子频带的数目N=3。此外,产生了表明低频带内的峰值的符号“+”的符号信息“1”以及表明在低频带内搜索的搜索方向信息“1”。在这种情况下,如果峰值的符号为“-”,符号信息是“0”,以及如果搜索是在高频方向进行的,搜索方向信息为“0”。
当比例因子频带数目N=3的时候,为高频带内的第一个比例因子频带内指定符号信息“1”和搜索方向信息“1”(S55),第二量化单元345以与上述相同的方式指定下一个比例因子频带的数目N,符号信息和搜索方向信息。
以这种方式,低频带内每一个比例因子频带的数目N,符号信息和搜索方向信息被指定,其距离第一个频带的峰值位置最靠近高频带内从该比例因子频带的第一个开始的峰值位置“n”(S55)。然后,第二量化单元345将与高频带的每一个比例因子频带相对应的低频带内的比例因子频带的指定的数目N,符号信息和搜索方向信息输出给第二编码单元355作为高频带的子信息(复制信息),然后处理结束。
在这种情况下,如果第一编码信号根据传统的程序在解码设备400中被解码,低频带侧的1024个取样的频谱数据就能够获得。第二解量化单元435复制与第二解码单元425输出的比例因子频带数目相应的部分或者所有频谱数据作为高频带内的频谱数据。如果需要的话,第二解量化单元435调整复制的频谱数据的幅度。幅度是通过将每一个频谱乘以一个预定的系数,例如“0.5”来调整的。
系数可以是一个固定值,或者对于每一个比例因子频带可被改变,或者随着第一解量化单元430输出的频谱数据可被改变。
在本实施例中,使用了一个预定的系数,但是该系数值可以被加入到第二编码信息作为子信息。或者比例因子值可以被加入到第二编码信息中作为一个系数,或者量化值可以被加入到第二编码信息中作为一个系数。而且,幅度调整方法并不局限于上述的方法,任何其它的方法也可以被使用。
在本实施例中,符号信息和搜索方向信息,以及比例因子频带的数目N被抽取作为高频带的子信息(复制信息)。但是,根据高频带内可传送的信息数量,符号信息和搜索方向信息可以被忽略。而且,当低频带的峰值符号为“+”的时候,符号信息用“1”来表示,以及当符号为“-”的时候,用“0”表示。当搜索是从低频率方向的峰值进行的时候,搜索方向信息用“1”表示,当搜索是从高频带方向的峰值进行的时候,其用“0”表示。但是,在符号信息中的低频带内的峰值的符号以及在搜索方向信息中的搜索方向并不局限于此,它们可以以其它的值表示。
而且,在本实施例中,低频带内的从第一个开始的指定的峰值位置最接近“n”的第一个比例因子频带被搜索。但是,本发明并不局限于此,从低频带内的比例因子频带的第一个频带开始的峰值位置最接近“n”的峰值也可被搜索。
附图23示出了一个表明如何建立图2中所示的第二量化单元345所产生的其它子信息(复制信息)的第二个例子的频谱波形图。附图24是一个流程图,表明了图2所示的第二量化单元345所执行的其他子信息(复制信息)的第二种计算处理的操作过程。
对于具有高于11.025kHz到22.05kHz的再生带宽的高频带内的每一个比例因子频带,第二量化单元345根据下面的处理过程,指定低频带内的比例因子频带的数目N,其为与高频带内的比例因子频带的每一个频谱的差(能量差)为最小的频带(S61)。在这种情况下,低频带内的频谱数据的数目等于高频带内的频谱数据的数目,并且指定的比例因子频带的数目N表示该比例因子频带的第一个的数目。
对于低频带内的所有比例因子频带(S62),第二量化单元345在包括与高频带内的比例因子频带相同数目的频谱数据的频率带宽内,从低频带的比例因子频带内的第一个数据开始,计算高频带的频谱与低频带的频谱的差(S63)。例如,在如图23所示的波形中,如果高频带的第一个比例因子频带包括频谱数据的48个取样,第二量化单元345从低频带内的数目N=1的比例因子频带的第一个数据开始,顺序计算高频带和低频带之间的48个频谱数据的差。
当第二量化单元345计算出了高频带和低频带的频谱数据的差的时候,(S65),它保持该值,然后在包括与高频带内的比例因子频带相同数目的频谱数据的频率带宽内,从低频带的下一个比例因子频带的第一个数据开始,为下一个比例因子频带计算高频带和低频带之间的频谱的差(S64)。例如,当在频谱数据的48个取样的宽度内,从低频带的数目N=1的比例因子频带的第一个数据开始计算出频谱的差的时候,第二量化单元345保持该计算出的差的值,然后进一步在频谱数据的48个取样的宽度内从低频带内的数目N=2的比例因子频带的第一个数据开始计算频谱的差。以同样的方式,对从数目N=3,4,...28(低频带内的最后一个比例因子频带)的低频带内的所有比例因子频带,第二量化单元345通过顺序地将高频带与低频带之间的48个频谱数据的差求和来计算频谱的差。
对于低频带内的所有比例因子频带,第二量化单元345在与高频带相同数目的频谱数据的宽度内,从低频带内的比例因子频带的第一个数据开始,计算高频带与低频带之间的频谱的差(S64)。然后,第二量化单元345指定计算出的差为最小的比例因子频带的数目N(S65)。例如,在图23所示的频谱波形中,低频带内的数目N=8的比例因子频带就被指定。在该图中,已经表明阴影部分的低频带内的频谱数据与阴影部分的高频带内的频谱数据的差为最小,并且频谱之间的能量差也为最小。换句话说,如果从数目N=8的比例因子频带的第一个数据开始的频谱数据的48个取样被复制到高于11.025kHz的高频带内的第一个比例因子频带,它们就变成了在附图23中所示的在高频带内以交替的长短虚线表示的波形,因此,在高频带内的相应的比例因子频带内的能量能够近似地表示至原始的频谱。
当第二量化单元345指定了低频带内的数目为N的比例因子频带,其与高频带内的比例因子频带的频谱的差为最小的时候,其保持指定的数目为N的比例因子频带,然后指定了与高频带内的下一个比例因子频带相应的低频带内的比例因子频带的数目N(S66)。第二量化单元345依序重复该处理过程,并且当指定了低频带内的所有数目N的比例因子频带,其与高频带的频谱的差为最小的时候,将所保持的低频带内的比例因子频带的数目N输出到第二编码单元355作为用于高频带的子信息(复制信息),然后该过程结束。
在本实施例中,在解码设备400中复制低频带内的频谱数据的方法以及调整其幅度的方法与参照附图21和22所述的子信息(复制信息)的情况相同。
在附图24的流程图中,高频带与低频带之间的频谱数据的相同符号的能量差在频率轴的相同方向上被计算。但是,本发明的编码设备并不局限于此,它们可以使用下述的三个方法之一被计算,如参照附图21和22所述:①对于高频带内具有相同符号并在从低频带到高频带的方向上被顺序选择的频谱数据,低频带内相同数目的频谱数据被顺序地选择,选择是从低频带内的比例因子频带的第一个数据开始,沿着从高频带到低频带的方向(频率轴上的相反方向)进行的,并且频谱的差被计算,②低频带内的频谱的符号被反转(乘以负值)并且在频率轴上的相同方向上被计算,③低频带内的频谱的符号被反转(乘以负值),并且在频率轴的相反方向上被计算。或者,当根据所有的四种方法计算了能量的差之后,低频带内包括能量差为最小的频谱的数目N的比例因子频带可以是子信息。在那种情况下,为了将低频带内能量差为最小的频谱精确的复制到高频带,对于每一个比例因子频带,表示高低频带的频谱的符号之间关系的信息以及表示在频率轴上的复制方向的信息被插入到子信息当中。表示高低频带的频谱的符号之间关系的信息以一个比特表示,例如,“1”表示具有相同符号的频谱的差,“0”表示具有相反符号的频谱的差。而且,表示将低频带内的频谱数据复制到高频带的在频率轴上的方向的信息用一个比特来表示,例如,“1”表示前向复制方向,就是,在高低频带内选择频谱数据的前向方向,“0”表示反向复制方向,就是在高低频带内选择频谱数据的反向方向。
如上所述,根据本实施例的音频数据分配系统被应用于广播系统的情况已经被描述。但是,其也可以被应用于通过诸如互联网的传输介质,以比特流的形式,将音频数据从用户服务器分配到终端的音频数据分配系统中。或者,其也可以被应用于这样的音频数据分配系统中,该音频数据分配系统一旦将编码设备300输出的比特流记录在一种诸如包括CD和DVD的光盘,半导体,或者一个硬盘的记录介质上,就通过该记录介质在解码设备400中将其再生。
在本实施例中,处理是利用一个LONG块被执行的,但是其也可以使用一个SHORT块来执行。使用一个SHORT块可以执行与LONG块同样的处理。
在编码处理中,诸如增益控制,TNS(瞬时噪声成型),心里声学模块,M/S立体声,强度立体声和预测,模块尺寸的变化,比特储备等工具都可以被使用。
在本实施例中,子信息是根据高频带内被数据划分单元330所划分的频谱数据而产生的。但是,子信息也可以根据对第一量化单元340的输出进行解量化所得到的值来产生,作为高频带内的频谱数据。
在本实施例中,用于得到在高频带内的每一个比例因子内的频谱数据的量化值“1”的比例因子,量化的值,特征频谱的位置信息,表明频谱的正负符号的符号信息等都被用作子信息。但是,它们中的两个或者多个的组合也可以作为子信息。在这种情况下,如果是比例因子和表示增益,绝对值最大的频谱数据的位置等的系数的组合在子信息中被编码,那么其是非常有效的。而且,在本实施例中,对于每一个比例因子频带,一个子信息可以被编码作为第二编码信号,但是一个子信息也可以被编码用于两个或者多个比例因子频带,或者两个或者多个子信息被编码用于一个比例因子频带。此外,在本实施中,可以为每一个信道编码编码子信息,或者一个子信息被编码用于两个或者多个信道。
在本实施例中,编码设备300包括两个量化单元和两个编码单元。但是,本发明并不局限于此,它也可以分别包括三个或者多个量化单元和编码单元。
在本实施例中,解码设备400包括两个解码单元和两个解量化单元。但是,本发明并不局限于此,它也可以分别包括三个或者多个解码单元和解量化单元。
上面描述的处理过程除了用硬件实现以外还可以用软件来实现,本发明可以被配置成一部分处理利用硬件实现,其它的处理利用软件来实现。
在本实施例中,使用的采样频率是44.1kHz,但是其它的采样频率,例如32kHz或者48kHz都可以被使用。作为数据划分单元330,划分频谱数据的界限的频率可以变成除了11.025kHz以外的其它任何频率。
而且,在本实施例中,处理是依据MPEG-2 AAC被执行的。但是,同样的处理也可以依据其它方法(例如MP3,AC3等)在一个编码设备,一个解码设备,以及其它设备中被执行。
而且,根据本发明的编码设备也可以采用如下的结构。
根据本发明的编码设备是一个编码音频数据的编码设备,包括:一个分离单元用于将一个音频数据串分离成m2个取样,多于所需数目的m1个取样,从产生的音频数据串分离连续的音频数据;一个变换单元,用于将分离单元分离的音频数据变换成频率域的频谱数据;一个划分单元,用于将变换得到的频谱数据的m2取样划分成低频带内的频谱数据的m1个取样和高频带内的频谱数据的(m2-m1)个取样;一个低频带编码单元,用于量化在低频带内划分的频谱数据并编码该量化的数据;一个子信息产生单元, 用于量化高频带内的划分的频谱数据产生表明高频带内的频谱特性的子信息;一个高频带编码单元,用于编码产生的子信息;以及一个输出单元,用于将低频带编码单元获得的码与高频带编码单元所获得的码集成,并输出该集成的符号。
在这种情况下,子信息产生单元可以这样配置从而能够计算一个用于获得一个固定值的标准化因子,并产生计算的标准化因子作为子信息,前述的固定值是一个通过量化用于频率数据高频带内的每一个组中的峰值频谱数据而获得的值,其中频谱数据被分成了多个组。
而且,子信息产生单元可以这样配置从而能够使用对每一个组都共同的标准化因子来量化高频带内的每一个组内的峰值频谱数据并产生量化的值作为子信息,其中频谱数据被分成了多个组。
而且,子信息产生单元可以这样配置从而在高频带内的每一组中产生峰值频谱数据的频率位置作为子信息,其中频谱数据被分成了多个组。
而且,频谱数据是一个MDCT系数,子信息产生单元可以这样配置从而产生一个表示在高频带内的一个预定的频率位置的频谱数据的正负值的符号作为子信息,其中频谱数据被分成了多个组。
更进一步,子信息产生单元可以这样配置从而产生一个指定最接近高频带内的每个组的频谱的低频带内的频谱的信息作为子信息,其中频谱数据被分成了多个组。在这种情况下,子信息产生单元可以这样配置从而指定一个低频带内的频谱,其中在频率轴上从高频带内的组的定界符到该组中的频谱峰值的距离与频率轴上从低频带内的组的定界符到该组中的频谱的峰值的距离为最小。而且,子信息产生单元可以这样配置从而指定低频带中的一个频谱,其与高频带内该组中的频谱具有相同的频率宽度所获得的能量差值为最小。而且,指定低频带内的频谱的信息是一个指定低频带内的指定的频谱的组的数字。
而且,子信息产生单元可以被配置从而能够产生表示高频带内的频谱幅度增益的一个预定的系数作为子信息.
而且,输出单元可以进一步包括一个流输出单元,用于将低频带编码单元编码的数据变换成一个以预定的格式定义的编码音频流,然后将高频带编码单元编码的数据存储在其使用不受编码协议限制的编码音频流的区域中,最后输出该存储的数据。在这种情况下,流输出单元可以被配置从而能够写入表示f1Hz的信息作为采样频率。
更进一步,输出单元可以进一步包括一个第二流输出单元,用于将低频带编码单元编码的数据变换成一个以预定的格式定义的编码音频流,然后将高频带编码单元编码的数据存储在与编码音频流不同的流中,然后输出该存储的数据。
应当注意,本发明当然能够以一种包括上述变型的编码设备和解码设备的通信系统来实现,也能够以包括在上述的编码设备和通信系统的特征单元中所执行的步骤的一种编码方法和通信方法来实现,以一种令一个CPU执行上述的编码设备的特征单元或者步骤的编码程序来实现,或者以一种其上记录着这些程序的计算机可读记录介质来实现。
工业应用
根据本发明的编码设备适于用作一种分配系统用于分配在数据流中或者记录介质中的诸如音乐等内容。
Claims (27)
1.一种用于编码音频数据的编码设备,包括:
一个分离单元,用于将音频数据串分离成一个固定数目的连续音频数据;
一个变换单元,用于将分离的音频数据变换成频率域的频谱数据;
一个划分单元,用于将变换单元获得的频谱数据划分成在频率f1Hz或者更低的低频带内的频谱数据以及在高于f1Hz的高频带内的频谱数据;
一个低频带编码单元,用于量化低频带内的划分的频谱数据并且编码该量化数据;
一个子信息产生单元,用于产生表明来自于高频带内的划分的频谱数据的高频带的频谱特性的子信息;
一个高频带编码单元,用于编码产生的子信息;
以及一个输出单元,用于集成由低频带编码单元获得的码以及由高频带编码单元获得的码,并且输出集成码,
其中f1是采样频率f2的一半或者更小,在频率f2处产生音频数据串。
2.如权利要求1所述的编码设备,
其中f1是f2/4,
变换单元将音频数据变换成0~2×f1Hz的频谱数据,以及
划分单元将0~2×f1Hz的频谱数据划分成在频率f1Hz或者更低的低频带内的频谱数据以及在f1Hz以上直至2×f1Hz的高频带内的频谱数据。
3.如权利要求2所述的编码设备,
其中在频率f1Hz或者更低的低频带内的频谱数据包括n个频谱数据取样,
分离单元能够将音频数据串分离成产生2×n个频谱数据取样所需数目的音频数据,
变换单元将分离的音频数据变换成2×n个频谱数据取样,
划分单元将2×n个频谱数据取样划分成低频带内的n个频谱数据取样以及高频带内的n个频谱数据取样。
4.如权利要求3所述的编码设备,
其中分离单元将音频数据串分离成2×n个频谱数据取样,这些频谱数据取样包括与作为一个编码单元的一帧相对应的n个音频数据取样以及在该帧之前和之后的邻近的两帧内的两组n/2个音频数据取样,
变换单元对分离的2×n个音频数据取样执行MDCT,将其变换成包括2×n个频谱数据取样的0~2×f1Hz的频谱。
5.如权利要求1所述的编码设备,
其中子信息产生单元计算一个用于导出通过量化在高频带内的每一组中的峰值频谱数据而获得的一个固定值的标准化因子,并产生了一个计算所得的标准化因子,作为子信息,其中频谱数据被分成了多个组。
6.如权利要求1所述的编码设备,
其中子信息产生单元利用对所述每一组而言是共同的标准化因子,量化在高频带内的每一组中的峰值频谱数据,并产生量化值作为子信息,其中频谱数据被分成了多个组。
7.如权利要求1所述的编码设备,
其中子信息产生单元产生了在高频带内的每一组内的峰值频谱数据的频率位置作为子信息,频谱数据被分成了多个组。
8.如权利要求1所述的编码设备,
其中频谱数据是一个MDCT系数,
子信息产生单元在高频带内的一个预定的频率位置产生一个表示频谱数据的正负值的符号作为子信息,频谱数据被分成了多个组。
9.如权利要求1所述的编码设备,
其中子信息产生单元产生了一个指定最接近高频带内的每一组中的频谱的低频带内的频谱的信息作为子信息,频谱数据被分成了多个组。
10.如权利要求9所述的编码设备,
其中子信息产生单元指定低频谱带内的频谱,其中(1)在频率域中高频带内的每一组的界符到该组中的频谱峰值的距离与(2)频率域内低频带中的每一组的界符到该组中的频谱峰值的距离之间的差为最小。
11.如权利要求9所述的编码设备,
其中子信息产生单元指定低频带内的频谱,其中在与高频带内该组中的频谱相同的频率带宽内获得的能量值的差为最小。
12.如权利要求9所述的编码设备,
其中指定低频带内的频谱的信息是一个指定在低频带内的指定频率的组的数字。
13.如权利要求1所述的编码设备,
其中子信息产生单元产生了一个预定的系数作为子信息,表明高频带内的频谱的幅度增益。
14.如权利要求1所述的编码设备,
其中输出单元进一步包括一个流输出单元,用于将低频带编码单元编码的数据变换为以预定的格式定义的编码音频流,将高频带编码单元编码的数据存储在其使用在预定格式下不受限制的编码音频流中的一区域,然后将存储的数据输出。
15.如权利要求14所述的编码设备,
其中流输出单元写入表示f/2Hz的信息作为采样频率。
16.如权利要求1所述的编码设备,
其中输出单元还进一步包括一个第二流输出单元,用于将低频带编码单元编码的数据变换为以预定的格式定义的编码音频流,将高频带编码单元编码的数据存储在与编码音频流不同的数据流中,然后将存储的数据输出。
17.一种解码通过一个记录介质或者传输介质输入的编码数据的
解码设备,包括:
一个抽取单元,用于抽取包含在编码数据中的低频带的编码数据以及高频带的编码数据;
一个低频带解量化单元,用于解码和解量化由抽取单元抽取的低频带的编码数据,从而输出在频率f1Hz或者更低的低频带的频谱数据;
一个子信息解码单元,用于解码抽取单元抽取的高频带的编码数据,从而产生表明高频带中的频谱数据特性的子信息;
一个高频带解量化单元,用于根据子信息解码单元产生的子信息,输出高频带内的频谱数据;
一个集成单元,用于集成由低频带解量化单元输出的低频带中的频谱数据和由高频带解量化单元输出的高频带中的频谱数据;
一个逆变换单元,用于将由集成单元集成的频谱数据逆变换成时间域的音频数据;
一个音频数据输出单元,用于基于时间顺序输出由逆变换单元逆变换的音频数据。
18.如权利要求17所述的解码设备,
其中子信息是一个计算的标准化因子,以使量化在高频带内的每一组中的峰值频谱数据所获得的值都是固定值,频谱数据被分成了多个组,并且,
高频带解量化单元利用产生的子信息中的标准化因子解量化一个量化值,该量化值是对于高频带内的所述的每一组是共同的并且与所述的每一组中的预定频率的频谱数据相对应的一个固定值,然后在高频带内产生频谱数据,其峰值是所述的每一组中的解量化的频谱数据。
19.如权利要求17所述的解码设备,
其中子信息是利用对所述的每一组是共同的标准化因子,量化在高频带内的每一组中的峰值频谱数据所获得的一个量化值,频谱数据被分成了多个组,并且,
高频带解量化单元利用对所述的每一组是共同的标准化因子,解量化在产生的子信息中的量化值,并产生高频带内的频谱数据,其峰值是在所述的每一组中的解量化的频谱数据。
20.如权利要求17所述的编码设备,
其中子信息是高频带内的每一组中的峰值频谱数据的频率位置,频谱数据被分成了多个组,并且
高频带解量化单元在高频带内产生频谱数据,其峰值位于所述的每一组中所产生的子信息的频率位置。
21.如权利要求17所述的解码设备,
其中子信息是指示在高频带内的预定的频率位置的频谱数据的正负值的符号,频谱数据被分成了多个组,并且
高频带解量化单元产生在高频带内的预定频率位置的频谱数据,其具有在产生的子信息中的符号。
22.如权利要求17所述的解码设备,
其中子信息是指定最为接近高频带的每一组的频谱的低频带内的频谱的信息,频谱数据被分成了多个组,并且,
高频带解量化单元根据子信息在高频带的所述的每一组中产生一个预定的噪声,还通过将产生的噪声加入到所述的频谱数据来产生高频带内的频谱数据。
23.一种通过记录介质或者传输介质分配以低比特率被压缩和编码成一个比特流的音频数据的音频数据分配系统,该系统包括一个编码设备和一个解码设备:
其中编码设备编码音频数据,并包括:
一个分离单元,用于将音频数据串分离成一个固定数目的连续音频数据;
一个变换单元,用于将分离的音频数据变换成频率域的频谱数据;
一个划分单元,用于将变换单元获得的频谱数据划分成在频率f1Hz或者更低的低频带内的频谱数据以及在高于f1Hz的高频带宽内的频谱数据;
一个低频带编码单元,用于量化低频带内的划分的频谱数据并且编码该量化数据;
一个子信息产生单元,用于产生表明来自于高频带内的划分的频谱数据的高频带的频谱特性的子信息;
一个高频带编码单元,用于编码产生的子信息;
一个输出单元,用于集成由低频带编码单元获得的码以及由高频带编码单元获得的码,并且输出集成码,
其中f1是采样频率f2的一半或者更小,在频率f2处产生音频数据串,以及
解码设备解码通过记录介质或者传输介质输入的编码数据,并包括:
一个抽取单元,用于抽取包含在编码数据中的低频带的编码数据以及高频带的编码数据;
一个低频带解量化单元,用于解码和解量化由抽取单元抽取的低频带编码数据,从而输出在频率f1Hz或者更低的低频带的频谱数据;
一个子信息解码单元,用于解码由抽取单元抽取的高频带编码数据,从而产生表明高频带的频谱数据特性的子信息;
一个高频带解量化单元,用于根据由子信息解码单元产生的子信息,输出高频带内的频谱数据;
一个集成单元,用于集成由低频带解量化单元输出的低频带中的频谱数据和由高频带解量化单元输出的高频带内的频谱数据;
一个逆变换单元,用于将由集成单元集成的频谱数据逆变换成时间域的音频数据;
一个音频数据输出单元,用于基于时间顺序输出逆变换单元逆变换的音频数据。
24.一种用于编码音频数据的编码设备的程序,该程序令计算机实现以下的作用:
一个分离单元,用于将音频数据流分离成一个固定数目的连续音频数据;
一个变换单元,用于将分离的音频数据变换成频率域的频谱数据;
一个划分单元,用于将变换单元获得的频谱数据划分成在频率f1Hz或者更低的低频带的频谱数据以及在高于f1Hz的高频带宽内的频谱数据;
一个低频带编码单元,用于量化低频带内的划分的频谱数据并且编码该量化数据;
一个子信息产生单元,用于产生表明来自于高频带内的划分的频谱数据的高频带的频谱特性的子信息;
一个高频带编码单元,用于编码产生的子信息;
以及一个输出单元,用于集成由低频带编码单元获得的码和由高频带编码单元获得的码,然后输出该集成码。
25.一种用于解码通过记录介质或者传输介质输入的编码数据的解码设备中的程序,该程序令计算机实现如下的作用:
一个抽取单元,用于抽取包含在编码数据中的低频带的编码数据以及高频带的编码数据;
一个低频带解量化单元,用于解码和解量化由抽取单元抽取的低频带的编码数据,从而输出在频率f1Hz或者更低的低频带的频谱数据;
一个子信息解码单元,用于解码抽取单元抽取的高频带的编码数据,从而产生表明高频带的频谱数据特性的子信息;
一个高频带解量化单元,用于根据子信息解码单元产生的子信息,输出高频带内的频谱数据;
一个集成单元,用于集成低频带解量化单元输出的低频带的频谱数据和高频带解量化单元输出的高频带频谱数据;
一个逆变换单元,用于将集成单元集成的频谱数据逆变换成时间域的音频数据;
一个音频数据输出单元,用于基于时间顺序输出逆变换单元逆变
换的音频数据。
26.一种其上记录着程序的计算机可读记录媒体,
其中程序用于编码音频数据的编码设备,该程序令计算机实现如下的作用:
一个分离单元,用于将音频数据流分离成一个固定数目的连续音频数据;
一个变换单元,用于将分离的音频数据变换成频率域的频谱数据;
一个划分单元,用于将变换单元获得的频谱数据划分成在频率f1Hz或者更低的低频带内的频谱数据以及在高于f1Hz的高频带宽内的频谱数据;
一个低频带编码单元,用于量化低频带内的划分的频谱数据并且编码该量化数据;
一个子信息产生单元,用于产生表明来自于高频带内的划分的频谱数据的高频带的频谱特性的子信息;
一个高频带编码单元,用于编码产生的子信息;
以及一个输出单元,用于集成低频带编码单元获得的码和高频带编码单元获得的码,然后输出该集成码。
27.一种其上记录着程序的计算机可读媒体,
其中程序用于解码通过记录介质或者传输介质输入的编码数据的解码设备,该程序令计算机实现如下的作用:
一个抽取单元,用于抽取包含在编码数据中的低频带的编码数据以及高频带的编码数据;
一个低频带解量化单元,用于解码和解量化由抽取单元抽取的低频带编码数据,从而输出在频率f1Hz或者更低的低频带内的频谱数据;
一个子信息解码单元,用于解码由抽取单元抽取的高频带编码数据,从而产生表明高频带的频谱数据特性的子信息;
一个高频带解量化单元,用于根据子信息解码单元产生的子信息,输出高频带内的频谱数据;
一个集成单元,用于集成由低频带解量化单元输出的低频带的频谱数据和由高频带解量化单元输出的高频带频谱数据;
一个逆变换单元,用于将集成单元集成的频谱数据逆变换成时间域的音频数据;
一个音频数据输出单元,用于基于时间顺序输出由逆变换单元逆变换的音频数据。
Applications Claiming Priority (9)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
JP337869/01 | 2001-11-02 | ||
JP2001337869A JP3923783B2 (ja) | 2001-11-02 | 2001-11-02 | 符号化装置及び復号化装置 |
JP337869/2001 | 2001-11-02 | ||
JP367008/2001 | 2001-11-30 | ||
JP367008/01 | 2001-11-30 | ||
JP2001367008 | 2001-11-30 | ||
JP381807/2001 | 2001-12-14 | ||
JP2001381807A JP3984468B2 (ja) | 2001-12-14 | 2001-12-14 | 符号化装置、復号化装置及び符号化方法 |
JP381807/01 | 2001-12-14 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN1484756A true CN1484756A (zh) | 2004-03-24 |
CN1324558C CN1324558C (zh) | 2007-07-04 |
Family
ID=27347778
Family Applications (3)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02809440.9A Expired - Fee Related CN1288622C (zh) | 2001-11-02 | 2002-10-30 | 编码设备和解码设备 |
CN02803419.8A Expired - Fee Related CN1209744C (zh) | 2001-11-02 | 2002-10-30 | 编码装置和解码装置 |
CNB02803421XA Expired - Fee Related CN1324558C (zh) | 2001-11-02 | 2002-10-30 | 编码设备,解码设备以及音频数据分配系统 |
Family Applications Before (2)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN02809440.9A Expired - Fee Related CN1288622C (zh) | 2001-11-02 | 2002-10-30 | 编码设备和解码设备 |
CN02803419.8A Expired - Fee Related CN1209744C (zh) | 2001-11-02 | 2002-10-30 | 编码装置和解码装置 |
Country Status (5)
Country | Link |
---|---|
US (3) | US7392176B2 (zh) |
EP (3) | EP1440433B1 (zh) |
CN (3) | CN1288622C (zh) |
DE (3) | DE60204038T2 (zh) |
WO (3) | WO2003038813A1 (zh) |
Cited By (8)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101185124B (zh) * | 2005-04-01 | 2012-01-11 | 高通股份有限公司 | 用于语音信号的分割频带编码的方法和设备 |
CN102414742A (zh) * | 2009-04-30 | 2012-04-11 | 杜比实验室特许公司 | 低复杂度听觉事件边界检测 |
CN101641733B (zh) * | 2007-03-20 | 2013-04-03 | 三星电子株式会社 | 对音频信号编码和解码的方法和设备 |
WO2014110895A1 (zh) * | 2013-01-15 | 2014-07-24 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
CN104981870A (zh) * | 2013-02-22 | 2015-10-14 | 三菱电机株式会社 | 声音增强装置 |
CN105814629A (zh) * | 2013-12-11 | 2016-07-27 | 高通股份有限公司 | 带宽扩展模式选择 |
CN107112024A (zh) * | 2014-10-24 | 2017-08-29 | 杜比国际公司 | 音频信号的编码和解码 |
CN110111800A (zh) * | 2019-04-04 | 2019-08-09 | 深圳信息职业技术学院 | 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备 |
Families Citing this family (136)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US6946587B1 (en) | 1990-01-22 | 2005-09-20 | Dekalb Genetics Corporation | Method for preparing fertile transgenic corn plants |
US6025545A (en) | 1990-01-22 | 2000-02-15 | Dekalb Genetics Corporation | Methods and compositions for the production of stably transformed, fertile monocot plants and cells thereof |
DE10102154C2 (de) * | 2001-01-18 | 2003-02-13 | Fraunhofer Ges Forschung | Verfahren und Vorrichtung zum Erzeugen eines skalierbaren Datenstroms und Verfahren und Vorrichtung zum Decodieren eines skalierbaren Datenstroms unter Berücksichtigung einer Bitsparkassenfunktion |
SE0202159D0 (sv) | 2001-07-10 | 2002-07-09 | Coding Technologies Sweden Ab | Efficientand scalable parametric stereo coding for low bitrate applications |
US8605911B2 (en) | 2001-07-10 | 2013-12-10 | Dolby International Ab | Efficient and scalable parametric stereo coding for low bitrate audio coding applications |
CN100395817C (zh) | 2001-11-14 | 2008-06-18 | 松下电器产业株式会社 | 编码设备、解码设备和解码方法 |
AU2002343212B2 (en) * | 2001-11-14 | 2006-03-09 | Panasonic Intellectual Property Corporation Of America | Encoding device, decoding device, and system thereof |
JP3870193B2 (ja) * | 2001-11-29 | 2007-01-17 | コーディング テクノロジーズ アクチボラゲット | 高周波再構成に用いる符号器、復号器、方法及びコンピュータプログラム |
WO2003090207A1 (en) * | 2002-04-22 | 2003-10-30 | Koninklijke Philips Electronics N.V. | Parametric multi-channel audio representation |
JP3861770B2 (ja) | 2002-08-21 | 2006-12-20 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
SE0202770D0 (sv) | 2002-09-18 | 2002-09-18 | Coding Technologies Sweden Ab | Method for reduction of aliasing introduces by spectral envelope adjustment in real-valued filterbanks |
US9711153B2 (en) | 2002-09-27 | 2017-07-18 | The Nielsen Company (Us), Llc | Activating functions in processing devices using encoded audio and detecting audio signatures |
US8959016B2 (en) | 2002-09-27 | 2015-02-17 | The Nielsen Company (Us), Llc | Activating functions in processing devices using start codes embedded in audio |
US7460684B2 (en) | 2003-06-13 | 2008-12-02 | Nielsen Media Research, Inc. | Method and apparatus for embedding watermarks |
EP1496500B1 (en) * | 2003-07-09 | 2007-02-28 | Samsung Electronics Co., Ltd. | Bitrate scalable speech coding and decoding apparatus and method |
US7983909B2 (en) * | 2003-09-15 | 2011-07-19 | Intel Corporation | Method and apparatus for encoding audio data |
US7349842B2 (en) * | 2003-09-29 | 2008-03-25 | Sony Corporation | Rate-distortion control scheme in audio encoding |
US7325023B2 (en) * | 2003-09-29 | 2008-01-29 | Sony Corporation | Method of making a window type decision based on MDCT data in audio encoding |
US7426462B2 (en) * | 2003-09-29 | 2008-09-16 | Sony Corporation | Fast codebook selection method in audio encoding |
KR100530377B1 (ko) * | 2003-12-30 | 2005-11-22 | 삼성전자주식회사 | 엠펙 오디오 디코더의 합성필터 및 그 디코딩 방법 |
AU2005207596A1 (en) * | 2004-01-20 | 2005-08-04 | Dolby Laboratories Licensing Corporation | Audio coding based on block grouping |
EP3336843B1 (en) * | 2004-05-14 | 2021-06-23 | Panasonic Intellectual Property Corporation of America | Speech coding method and speech coding apparatus |
NZ552644A (en) * | 2004-07-02 | 2008-09-26 | Nielsen Media Res Inc | Methods and apparatus for mixing compressed digital bit streams |
EP1775718A4 (en) * | 2004-07-22 | 2008-05-07 | Fujitsu Ltd | AUDIOCODING DEVICE AND AUDIOCODING METHOD |
US7788090B2 (en) * | 2004-09-17 | 2010-08-31 | Koninklijke Philips Electronics N.V. | Combined audio coding minimizing perceptual distortion |
BRPI0516201A (pt) * | 2004-09-28 | 2008-08-26 | Matsushita Electric Ind Co Ltd | aparelho de codificação escalonável e método de codificação escalonável |
KR100750115B1 (ko) * | 2004-10-26 | 2007-08-21 | 삼성전자주식회사 | 오디오 신호 부호화 및 복호화 방법 및 그 장치 |
US8769135B2 (en) * | 2004-11-04 | 2014-07-01 | Hewlett-Packard Development Company, L.P. | Data set integrity assurance with reduced traffic |
KR20070084002A (ko) * | 2004-11-05 | 2007-08-24 | 마츠시타 덴끼 산교 가부시키가이샤 | 스케일러블 복호화 장치 및 스케일러블 부호화 장치 |
US7769584B2 (en) | 2004-11-05 | 2010-08-03 | Panasonic Corporation | Encoder, decoder, encoding method, and decoding method |
KR100707173B1 (ko) * | 2004-12-21 | 2007-04-13 | 삼성전자주식회사 | 저비트율 부호화/복호화방법 및 장치 |
JP2006301134A (ja) * | 2005-04-19 | 2006-11-02 | Hitachi Ltd | 音楽検出装置、音楽検出方法及び録音再生装置 |
US7813931B2 (en) * | 2005-04-20 | 2010-10-12 | QNX Software Systems, Co. | System for improving speech quality and intelligibility with bandwidth compression/expansion |
US8249861B2 (en) * | 2005-04-20 | 2012-08-21 | Qnx Software Systems Limited | High frequency compression integration |
US8086451B2 (en) | 2005-04-20 | 2011-12-27 | Qnx Software Systems Co. | System for improving speech intelligibility through high frequency compression |
DE102005032079A1 (de) * | 2005-07-08 | 2007-01-11 | Siemens Ag | Verfahren und Vorrichtung zur Geräuschunterdrückung |
CA2574468C (en) | 2005-04-28 | 2014-01-14 | Siemens Aktiengesellschaft | Noise suppression process and device |
JP4635709B2 (ja) * | 2005-05-10 | 2011-02-23 | ソニー株式会社 | 音声符号化装置及び方法、並びに音声復号装置及び方法 |
US8270439B2 (en) * | 2005-07-08 | 2012-09-18 | Activevideo Networks, Inc. | Video game system using pre-encoded digital audio mixing |
JP4899359B2 (ja) | 2005-07-11 | 2012-03-21 | ソニー株式会社 | 信号符号化装置及び方法、信号復号装置及び方法、並びにプログラム及び記録媒体 |
US8074248B2 (en) | 2005-07-26 | 2011-12-06 | Activevideo Networks, Inc. | System and method for providing video content associated with a source image to a television in a communication network |
US20070036228A1 (en) * | 2005-08-12 | 2007-02-15 | Via Technologies Inc. | Method and apparatus for audio encoding and decoding |
CN1937032B (zh) * | 2005-09-22 | 2011-06-15 | 财团法人工业技术研究院 | 切割语音数据序列的方法 |
US8068569B2 (en) * | 2005-10-05 | 2011-11-29 | Lg Electronics, Inc. | Method and apparatus for signal processing and encoding and decoding |
EP1952113A4 (en) * | 2005-10-05 | 2009-05-27 | Lg Electronics Inc | METHOD AND DEVICE FOR SIGNAL PROCESSING AND CODING AND DECODING METHOD AND DEVICE THEREFOR |
US7751485B2 (en) * | 2005-10-05 | 2010-07-06 | Lg Electronics Inc. | Signal processing using pilot based coding |
KR100857112B1 (ko) * | 2005-10-05 | 2008-09-05 | 엘지전자 주식회사 | 신호 처리 방법 및 이의 장치, 그리고 인코딩 및 디코딩방법 및 이의 장치 |
KR20070077652A (ko) * | 2006-01-24 | 2007-07-27 | 삼성전자주식회사 | 적응적 시간/주파수 기반 부호화 모드 결정 장치 및 이를위한 부호화 모드 결정 방법 |
US7624417B2 (en) | 2006-01-27 | 2009-11-24 | Robin Dua | Method and system for accessing media content via the internet |
US8064608B2 (en) * | 2006-03-02 | 2011-11-22 | Qualcomm Incorporated | Audio decoding techniques for mid-side stereo |
KR100738109B1 (ko) * | 2006-04-03 | 2007-07-12 | 삼성전자주식회사 | 입력 신호의 양자화 및 역양자화 방법과 장치, 입력신호의부호화 및 복호화 방법과 장치 |
JP2007293118A (ja) * | 2006-04-26 | 2007-11-08 | Sony Corp | 符号化方法および符号化装置 |
ATE463029T1 (de) * | 2006-05-10 | 2010-04-15 | Panasonic Corp | Codierungseinrichtung und codierungsverfahren |
KR101393299B1 (ko) * | 2006-06-21 | 2014-05-09 | 삼성전자주식회사 | 오디오 데이터 부호화 방법 및 장치 |
US7974848B2 (en) * | 2006-06-21 | 2011-07-05 | Samsung Electronics Co., Ltd. | Method and apparatus for encoding audio data |
US8032371B2 (en) * | 2006-07-28 | 2011-10-04 | Apple Inc. | Determining scale factor values in encoding audio data with AAC |
US8010370B2 (en) * | 2006-07-28 | 2011-08-30 | Apple Inc. | Bitrate control for perceptual coding |
JP4396683B2 (ja) * | 2006-10-02 | 2010-01-13 | カシオ計算機株式会社 | 音声符号化装置、音声符号化方法、及び、プログラム |
US8078301B2 (en) | 2006-10-11 | 2011-12-13 | The Nielsen Company (Us), Llc | Methods and apparatus for embedding codes in compressed audio data streams |
US8005671B2 (en) * | 2006-12-04 | 2011-08-23 | Qualcomm Incorporated | Systems and methods for dynamic normalization to reduce loss in precision for low-level signals |
WO2008081777A1 (ja) * | 2006-12-25 | 2008-07-10 | Kyushu Institute Of Technology | 高域信号補間装置及び高域信号補間方法 |
US9826197B2 (en) | 2007-01-12 | 2017-11-21 | Activevideo Networks, Inc. | Providing television broadcasts over a managed network and interactive content over an unmanaged network to a client device |
WO2008088741A2 (en) | 2007-01-12 | 2008-07-24 | Ictv, Inc. | Interactive encoded content system including object models for viewing on a remote device |
US7991622B2 (en) * | 2007-03-20 | 2011-08-02 | Microsoft Corporation | Audio compression and decompression using integer-reversible modulated lapped transforms |
US8086465B2 (en) * | 2007-03-20 | 2011-12-27 | Microsoft Corporation | Transform domain transcoding and decoding of audio data using integer-reversible modulated lapped transforms |
JP2008261978A (ja) * | 2007-04-11 | 2008-10-30 | Toshiba Microelectronics Corp | 再生音量自動調整方法 |
KR101411900B1 (ko) * | 2007-05-08 | 2014-06-26 | 삼성전자주식회사 | 오디오 신호의 부호화 및 복호화 방법 및 장치 |
JP5302190B2 (ja) * | 2007-05-24 | 2013-10-02 | パナソニック株式会社 | オーディオ復号装置、オーディオ復号方法、プログラム及び集積回路 |
US20090132238A1 (en) * | 2007-11-02 | 2009-05-21 | Sudhakar B | Efficient method for reusing scale factors to improve the efficiency of an audio encoder |
JP5328804B2 (ja) * | 2007-12-21 | 2013-10-30 | フランス・テレコム | 適応型ウィンドウを有する変換ベースの符号化/復号化 |
BRPI0908929A2 (pt) * | 2008-03-14 | 2016-09-13 | Panasonic Corp | dispositivo de codificação, dispositivo de decodificação, e método dos mesmos |
EP2257057B1 (en) * | 2008-03-19 | 2019-05-08 | National University Corporation Hokkaido University | Dynamic image search device and dynamic image search program |
US7782195B2 (en) * | 2008-03-19 | 2010-08-24 | Wildlife Acoustics, Inc. | Apparatus for scheduled low power autonomous data recording |
KR20090110244A (ko) * | 2008-04-17 | 2009-10-21 | 삼성전자주식회사 | 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치 |
KR101381513B1 (ko) | 2008-07-14 | 2014-04-07 | 광운대학교 산학협력단 | 음성/음악 통합 신호의 부호화/복호화 장치 |
WO2010028292A1 (en) * | 2008-09-06 | 2010-03-11 | Huawei Technologies Co., Ltd. | Adaptive frequency prediction |
WO2010028297A1 (en) * | 2008-09-06 | 2010-03-11 | GH Innovation, Inc. | Selective bandwidth extension |
US8515747B2 (en) * | 2008-09-06 | 2013-08-20 | Huawei Technologies Co., Ltd. | Spectrum harmonic/noise sharpness control |
US8577673B2 (en) * | 2008-09-15 | 2013-11-05 | Huawei Technologies Co., Ltd. | CELP post-processing for music signals |
WO2010031003A1 (en) | 2008-09-15 | 2010-03-18 | Huawei Technologies Co., Ltd. | Adding second enhancement layer to celp based core layer |
US8359205B2 (en) | 2008-10-24 | 2013-01-22 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8121830B2 (en) * | 2008-10-24 | 2012-02-21 | The Nielsen Company (Us), Llc | Methods and apparatus to extract data encoded in media content |
US9667365B2 (en) | 2008-10-24 | 2017-05-30 | The Nielsen Company (Us), Llc | Methods and apparatus to perform audio watermarking and watermark detection and extraction |
US8508357B2 (en) * | 2008-11-26 | 2013-08-13 | The Nielsen Company (Us), Llc | Methods and apparatus to encode and decode audio for shopper location and advertisement presentation tracking |
CN101751928B (zh) * | 2008-12-08 | 2012-06-13 | 扬智科技股份有限公司 | 应用音频帧频谱平坦度简化声学模型分析的方法及其装置 |
US8983831B2 (en) * | 2009-02-26 | 2015-03-17 | Panasonic Intellectual Property Corporation Of America | Encoder, decoder, and method therefor |
WO2010108332A1 (zh) * | 2009-03-27 | 2010-09-30 | 华为技术有限公司 | 编码和解码方法及装置 |
EP2425563A1 (en) | 2009-05-01 | 2012-03-07 | The Nielsen Company (US), LLC | Methods, apparatus and articles of manufacture to provide secondary content in association with primary broadcast media content |
WO2011047887A1 (en) * | 2009-10-21 | 2011-04-28 | Dolby International Ab | Oversampling in a combined transposer filter bank |
US9245148B2 (en) | 2009-05-29 | 2016-01-26 | Bitspray Corporation | Secure storage and accelerated transmission of information over communication networks |
US8194862B2 (en) * | 2009-07-31 | 2012-06-05 | Activevideo Networks, Inc. | Video game system with mixing of independent pre-encoded digital audio bitstreams |
US8311843B2 (en) * | 2009-08-24 | 2012-11-13 | Sling Media Pvt. Ltd. | Frequency band scale factor determination in audio encoding based upon frequency band signal energy |
US8515768B2 (en) * | 2009-08-31 | 2013-08-20 | Apple Inc. | Enhanced audio decoder |
GB2481185A (en) * | 2010-05-28 | 2011-12-21 | British Broadcasting Corp | Processing audio-video data to produce multi-dimensional complex metadata |
KR20130088756A (ko) * | 2010-06-21 | 2013-08-08 | 파나소닉 주식회사 | 복호 장치, 부호화 장치 및 이러한 방법 |
US20130101028A1 (en) * | 2010-07-05 | 2013-04-25 | Nippon Telegraph And Telephone Corporation | Encoding method, decoding method, device, program, and recording medium |
JP5337305B2 (ja) * | 2010-07-05 | 2013-11-06 | 日本電信電話株式会社 | 符号化方法、復号方法、符号化装置、復号装置、プログラム、及び記録媒体 |
US8918693B2 (en) * | 2010-10-06 | 2014-12-23 | Cleversafe, Inc. | Data transmission utilizing data processing and dispersed storage error encoding |
CA2814070A1 (en) | 2010-10-14 | 2012-04-19 | Activevideo Networks, Inc. | Streaming digital video between video devices using a cable television system |
CN103329199B (zh) * | 2011-01-25 | 2015-04-08 | 日本电信电话株式会社 | 编码方法、编码装置、周期性特征量决定方法、周期性特征量决定装置、程序、记录介质 |
JP5704397B2 (ja) * | 2011-03-31 | 2015-04-22 | ソニー株式会社 | 符号化装置および方法、並びにプログラム |
EP2695388B1 (en) | 2011-04-07 | 2017-06-07 | ActiveVideo Networks, Inc. | Reduction of latency in video distribution networks using adaptive bit rates |
KR20130034566A (ko) * | 2011-09-28 | 2013-04-05 | 한국전자통신연구원 | 제한된 오프셋 보상 및 루프 필터를 기반으로 하는 영상 부호화 및 복호화 방법 및 그 장치 |
JP6042900B2 (ja) | 2011-10-24 | 2016-12-14 | エルジー エレクトロニクス インコーポレイティド | 音声信号の帯域選択的量子化方法及び装置 |
US11665482B2 (en) | 2011-12-23 | 2023-05-30 | Shenzhen Shokz Co., Ltd. | Bone conduction speaker and compound vibration device thereof |
WO2013106390A1 (en) | 2012-01-09 | 2013-07-18 | Activevideo Networks, Inc. | Rendering of an interactive lean-backward user interface on a television |
US9380320B2 (en) * | 2012-02-10 | 2016-06-28 | Broadcom Corporation | Frequency domain sample adaptive offset (SAO) |
JP5942463B2 (ja) * | 2012-02-17 | 2016-06-29 | 株式会社ソシオネクスト | オーディオ信号符号化装置およびオーディオ信号符号化方法 |
CN102594701A (zh) * | 2012-03-14 | 2012-07-18 | 中兴通讯股份有限公司 | 一种频谱重构的确定方法及系统 |
CN103325373A (zh) | 2012-03-23 | 2013-09-25 | 杜比实验室特许公司 | 用于传送和接收音频信号的方法和设备 |
US9800945B2 (en) | 2012-04-03 | 2017-10-24 | Activevideo Networks, Inc. | Class-based intelligent multiplexing over unmanaged networks |
US9123084B2 (en) | 2012-04-12 | 2015-09-01 | Activevideo Networks, Inc. | Graphical application integration with MPEG objects |
US9357215B2 (en) * | 2013-02-12 | 2016-05-31 | Michael Boden | Audio output distribution |
WO2014145921A1 (en) | 2013-03-15 | 2014-09-18 | Activevideo Networks, Inc. | A multiple-mode system and method for providing user selectable video content |
EP2784775B1 (en) * | 2013-03-27 | 2016-09-14 | Binauric SE | Speech signal encoding/decoding method and apparatus |
US10078669B2 (en) | 2013-05-30 | 2018-09-18 | Nec Corporation | Data compression system |
US9294785B2 (en) | 2013-06-06 | 2016-03-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9219922B2 (en) | 2013-06-06 | 2015-12-22 | Activevideo Networks, Inc. | System and method for exploiting scene graph information in construction of an encoded video sequence |
US9326047B2 (en) | 2013-06-06 | 2016-04-26 | Activevideo Networks, Inc. | Overlay rendering of user interface onto source video |
FR3008533A1 (fr) * | 2013-07-12 | 2015-01-16 | Orange | Facteur d'echelle optimise pour l'extension de bande de frequence dans un decodeur de signaux audiofrequences |
CN104517611B (zh) * | 2013-09-26 | 2016-05-25 | 华为技术有限公司 | 一种高频激励信号预测方法及装置 |
KR101913241B1 (ko) * | 2013-12-02 | 2019-01-14 | 후아웨이 테크놀러지 컴퍼니 리미티드 | 인코딩 방법 및 장치 |
CN104811584B (zh) * | 2014-01-29 | 2018-03-27 | 晨星半导体股份有限公司 | 影像处理电路与方法 |
US9594580B2 (en) | 2014-04-09 | 2017-03-14 | Bitspray Corporation | Secure storage and accelerated transmission of information over communication networks |
US9788029B2 (en) | 2014-04-25 | 2017-10-10 | Activevideo Networks, Inc. | Intelligent multiplexing using class-based, multi-dimensioned decision logic for managed networks |
CN104021792B (zh) * | 2014-06-10 | 2016-10-26 | 中国电子科技集团公司第三十研究所 | 一种语音丢包隐藏方法及其系统 |
CN106033982B (zh) * | 2015-03-13 | 2018-10-12 | 中国移动通信集团公司 | 一种实现超宽带语音互通的方法、装置和终端 |
TWI693594B (zh) | 2015-03-13 | 2020-05-11 | 瑞典商杜比國際公司 | 解碼具有增強頻譜帶複製元資料在至少一填充元素中的音訊位元流 |
GB2545434B (en) * | 2015-12-15 | 2020-01-08 | Sonic Data Ltd | Improved method, apparatus and system for embedding data within a data stream |
EP3427178B1 (en) | 2016-03-09 | 2020-12-02 | Bitspray Corporation | Secure file sharing over multiple security domains and dispersed communication networks |
CN108089782B (zh) * | 2016-11-21 | 2021-02-26 | 佳能株式会社 | 用于对相关用户界面对象的改变进行建议的方法和装置 |
CN107135443B (zh) * | 2017-03-29 | 2020-06-23 | 联想(北京)有限公司 | 一种信号处理方法及电子设备 |
US10950251B2 (en) * | 2018-03-05 | 2021-03-16 | Dts, Inc. | Coding of harmonic signals in transform-based audio codecs |
EP3834200A4 (en) | 2018-09-12 | 2021-08-25 | Shenzhen Voxtech Co., Ltd. | SIGNAL PROCESSING DEVICE INCLUDING MULTIPLE ELECTROACOUSTIC TRANSDUCERS |
JP7311319B2 (ja) * | 2019-06-19 | 2023-07-19 | ファナック株式会社 | 時系列データ表示装置 |
TWI762908B (zh) * | 2020-04-17 | 2022-05-01 | 新唐科技股份有限公司 | 串接式擴增裝置及包含其之串接式系統 |
Family Cites Families (40)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US3967067A (en) * | 1941-09-24 | 1976-06-29 | Bell Telephone Laboratories, Incorporated | Secret telephony |
CH497089A (de) * | 1968-07-26 | 1970-09-30 | Autophon Ag | Anlage zur Übermittlung von kontinuierlichen Signalen |
US3566035A (en) * | 1969-07-17 | 1971-02-23 | Bell Telephone Labor Inc | Real time cepstrum analyzer |
US3659051A (en) * | 1971-01-29 | 1972-04-25 | Meguer V Kalfaian | Complex wave analyzing system |
US3919481A (en) * | 1975-01-03 | 1975-11-11 | Meguer V Kalfaian | Phonetic sound recognizer |
US4039754A (en) * | 1975-04-09 | 1977-08-02 | The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration | Speech analyzer |
US4058676A (en) * | 1975-07-07 | 1977-11-15 | International Communication Sciences | Speech analysis and synthesis system |
US4158751A (en) * | 1978-02-06 | 1979-06-19 | Bode Harald E W | Analog speech encoder and decoder |
US4424415A (en) * | 1981-08-03 | 1984-01-03 | Texas Instruments Incorporated | Formant tracker |
US4622680A (en) * | 1984-10-17 | 1986-11-11 | General Electric Company | Hybrid subband coder/decoder method and apparatus |
JPH0761044B2 (ja) | 1986-07-28 | 1995-06-28 | 日本電信電話株式会社 | 音声符号化法 |
US4776014A (en) * | 1986-09-02 | 1988-10-04 | General Electric Company | Method for pitch-aligned high-frequency regeneration in RELP vocoders |
US4771465A (en) * | 1986-09-11 | 1988-09-13 | American Telephone And Telegraph Company, At&T Bell Laboratories | Digital speech sinusoidal vocoder with transmission of only subset of harmonics |
US5054072A (en) * | 1987-04-02 | 1991-10-01 | Massachusetts Institute Of Technology | Coding of acoustic waveforms |
US5479562A (en) * | 1989-01-27 | 1995-12-26 | Dolby Laboratories Licensing Corporation | Method and apparatus for encoding and decoding audio information |
FR2690551B1 (fr) | 1991-10-15 | 1994-06-03 | Thomson Csf | Procede de quantification d'un filtre predicteur pour vocodeur a tres faible debit. |
CA2090052C (en) * | 1992-03-02 | 1998-11-24 | Anibal Joao De Sousa Ferreira | Method and apparatus for the perceptual coding of audio signals |
US5546477A (en) * | 1993-03-30 | 1996-08-13 | Klics, Inc. | Data compression and decompression |
US5684920A (en) * | 1994-03-17 | 1997-11-04 | Nippon Telegraph And Telephone | Acoustic signal transform coding method and decoding method having a high efficiency envelope flattening method therein |
JP3277692B2 (ja) * | 1994-06-13 | 2002-04-22 | ソニー株式会社 | 情報符号化方法、情報復号化方法及び情報記録媒体 |
US5890110A (en) * | 1995-03-27 | 1999-03-30 | The Regents Of The University Of California | Variable dimension vector quantization |
US5867819A (en) * | 1995-09-29 | 1999-02-02 | Nippon Steel Corporation | Audio decoder |
CN1126264C (zh) * | 1996-02-08 | 2003-10-29 | 松下电器产业株式会社 | 宽频带声音信号编码装置和宽频带声音信号编码解码装置 |
JP3344944B2 (ja) | 1997-05-15 | 2002-11-18 | 松下電器産業株式会社 | オーディオ信号符号化装置,オーディオ信号復号化装置,オーディオ信号符号化方法,及びオーディオ信号復号化方法 |
US6904404B1 (en) * | 1996-07-01 | 2005-06-07 | Matsushita Electric Industrial Co., Ltd. | Multistage inverse quantization having the plurality of frequency bands |
JP3246715B2 (ja) * | 1996-07-01 | 2002-01-15 | 松下電器産業株式会社 | オーディオ信号圧縮方法,およびオーディオ信号圧縮装置 |
JP3318825B2 (ja) * | 1996-08-20 | 2002-08-26 | ソニー株式会社 | デジタル信号符号化処理方法、デジタル信号符号化処理装置、デジタル信号記録方法、デジタル信号記録装置、記録媒体、デジタル信号伝送方法及びデジタル信号伝送装置 |
TW405328B (en) | 1997-04-11 | 2000-09-11 | Matsushita Electric Ind Co Ltd | Audio decoding apparatus, signal processing device, sound image localization device, sound image control method, audio signal processing device, and audio signal high-rate reproduction method used for audio visual equipment |
JPH10340099A (ja) | 1997-04-11 | 1998-12-22 | Matsushita Electric Ind Co Ltd | オーディオデコーダ装置及び信号処理装置 |
SE512719C2 (sv) * | 1997-06-10 | 2000-05-02 | Lars Gustaf Liljeryd | En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion |
AU3372199A (en) * | 1998-03-30 | 1999-10-18 | Voxware, Inc. | Low-complexity, low-delay, scalable and embedded speech and audio coding with adaptive frame loss concealment |
JP3813025B2 (ja) | 1998-10-29 | 2006-08-23 | 株式会社リコー | デジタル音響信号符号化装置、デジタル音響信号符号化方法及びデジタル音響信号符号化プログラムを記録した媒体 |
SE9903553D0 (sv) | 1999-01-27 | 1999-10-01 | Lars Liljeryd | Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL) |
JP4409733B2 (ja) | 1999-09-07 | 2010-02-03 | パナソニック株式会社 | 符号化装置、符号化方法、及びその記録媒体 |
US6678653B1 (en) | 1999-09-07 | 2004-01-13 | Matsushita Electric Industrial Co., Ltd. | Apparatus and method for coding audio data at high speed using precision information |
JP4792613B2 (ja) | 1999-09-29 | 2011-10-12 | ソニー株式会社 | 情報処理装置および方法、並びに記録媒体 |
JP2001154698A (ja) | 1999-11-29 | 2001-06-08 | Victor Co Of Japan Ltd | オーディオ符号化装置及びその方法 |
JP3510168B2 (ja) | 1999-12-09 | 2004-03-22 | 日本電信電話株式会社 | 音声符号化方法及び音声復号化方法 |
JP2001188563A (ja) | 2000-01-05 | 2001-07-10 | Matsushita Electric Ind Co Ltd | オーディオ符号化のための効果的なセクション化法 |
JP3597750B2 (ja) | 2000-04-11 | 2004-12-08 | 松下電器産業株式会社 | グループ化方法及びグループ化装置 |
-
2002
- 2002-10-30 DE DE60204038T patent/DE60204038T2/de not_active Expired - Lifetime
- 2002-10-30 WO PCT/JP2002/011256 patent/WO2003038813A1/en active IP Right Grant
- 2002-10-30 WO PCT/JP2002/011255 patent/WO2003038389A1/en active IP Right Grant
- 2002-10-30 DE DE60204039T patent/DE60204039T2/de not_active Expired - Lifetime
- 2002-10-30 CN CN02809440.9A patent/CN1288622C/zh not_active Expired - Fee Related
- 2002-10-30 CN CN02803419.8A patent/CN1209744C/zh not_active Expired - Fee Related
- 2002-10-30 DE DE60208426T patent/DE60208426T2/de not_active Expired - Lifetime
- 2002-10-30 EP EP02775413A patent/EP1440433B1/en not_active Expired - Fee Related
- 2002-10-30 CN CNB02803421XA patent/CN1324558C/zh not_active Expired - Fee Related
- 2002-10-30 EP EP02775412A patent/EP1440300B1/en not_active Expired - Fee Related
- 2002-10-30 WO PCT/JP2002/011254 patent/WO2003038812A1/en active IP Right Grant
- 2002-10-30 EP EP02775411A patent/EP1440432B1/en not_active Expired - Fee Related
- 2002-11-01 US US10/285,627 patent/US7392176B2/en not_active Expired - Fee Related
- 2002-11-01 US US10/285,609 patent/US7283967B2/en active Active
- 2002-11-01 US US10/285,633 patent/US7328160B2/en active Active
Cited By (17)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101185124B (zh) * | 2005-04-01 | 2012-01-11 | 高通股份有限公司 | 用于语音信号的分割频带编码的方法和设备 |
CN101641733B (zh) * | 2007-03-20 | 2013-04-03 | 三星电子株式会社 | 对音频信号编码和解码的方法和设备 |
US8938313B2 (en) | 2009-04-30 | 2015-01-20 | Dolby Laboratories Licensing Corporation | Low complexity auditory event boundary detection |
CN102414742A (zh) * | 2009-04-30 | 2012-04-11 | 杜比实验室特许公司 | 低复杂度听觉事件边界检测 |
CN102414742B (zh) * | 2009-04-30 | 2013-12-25 | 杜比实验室特许公司 | 低复杂度听觉事件边界检测 |
US9761235B2 (en) | 2013-01-15 | 2017-09-12 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
WO2014110895A1 (zh) * | 2013-01-15 | 2014-07-24 | 华为技术有限公司 | 编码方法、解码方法、编码装置和解码装置 |
US10770085B2 (en) | 2013-01-15 | 2020-09-08 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
US10210880B2 (en) | 2013-01-15 | 2019-02-19 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
US11869520B2 (en) | 2013-01-15 | 2024-01-09 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
US11430456B2 (en) | 2013-01-15 | 2022-08-30 | Huawei Technologies Co., Ltd. | Encoding method, decoding method, encoding apparatus, and decoding apparatus |
CN104981870A (zh) * | 2013-02-22 | 2015-10-14 | 三菱电机株式会社 | 声音增强装置 |
CN105814629A (zh) * | 2013-12-11 | 2016-07-27 | 高通股份有限公司 | 带宽扩展模式选择 |
CN107112024A (zh) * | 2014-10-24 | 2017-08-29 | 杜比国际公司 | 音频信号的编码和解码 |
CN107112024B (zh) * | 2014-10-24 | 2020-07-14 | 杜比国际公司 | 音频信号的编码和解码 |
CN110111800B (zh) * | 2019-04-04 | 2021-05-07 | 深圳信息职业技术学院 | 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备 |
CN110111800A (zh) * | 2019-04-04 | 2019-08-09 | 深圳信息职业技术学院 | 一种电子耳蜗的频带划分方法、装置及电子耳蜗设备 |
Also Published As
Publication number | Publication date |
---|---|
US20030088328A1 (en) | 2003-05-08 |
CN1324558C (zh) | 2007-07-04 |
DE60204039T2 (de) | 2006-03-02 |
EP1440432A1 (en) | 2004-07-28 |
US7392176B2 (en) | 2008-06-24 |
CN1288622C (zh) | 2006-12-06 |
EP1440433A1 (en) | 2004-07-28 |
EP1440300A1 (en) | 2004-07-28 |
DE60204038D1 (de) | 2005-06-09 |
DE60204038T2 (de) | 2006-01-19 |
US20030088400A1 (en) | 2003-05-08 |
US20030088423A1 (en) | 2003-05-08 |
EP1440433B1 (en) | 2005-05-04 |
CN1507618A (zh) | 2004-06-23 |
WO2003038812A1 (en) | 2003-05-08 |
US7283967B2 (en) | 2007-10-16 |
EP1440432B1 (en) | 2005-05-04 |
DE60208426T2 (de) | 2006-08-24 |
CN1209744C (zh) | 2005-07-06 |
US7328160B2 (en) | 2008-02-05 |
CN1484822A (zh) | 2004-03-24 |
WO2003038813A1 (en) | 2003-05-08 |
WO2003038389A1 (en) | 2003-05-08 |
EP1440300B1 (en) | 2005-12-28 |
DE60204039D1 (de) | 2005-06-09 |
DE60208426D1 (de) | 2006-02-02 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN1324558C (zh) | 编码设备,解码设备以及音频数据分配系统 | |
CN1131507C (zh) | 音频信号编码装置、解码装置及音频信号编码·解码装置 | |
CN1165891C (zh) | 对过采样合成宽带信号进行高频分量恢复的方法与设备 | |
CN1126265C (zh) | 可伸缩的立体声音频编码/解码方法和装置 | |
CN1096148C (zh) | 信号编码方法和装置 | |
CN1255809C (zh) | 音频编解码方法和设备 | |
CN1097396C (zh) | 声音编码装置和方法 | |
CN1702974A (zh) | 用于对数字信号编码/解码的方法和设备 | |
CN1871501A (zh) | 频谱编码装置、频谱解码装置、音响信号发送装置、音响信号接收装置及其使用方法 | |
CN1161751C (zh) | 语音分析方法和语音编码方法及其装置 | |
CN1248195C (zh) | 语音编码转换方法和装置 | |
CN1639984A (zh) | 数字信号编码方法、解码方法、编码设备、解码设备、数字信号编码程序和解码程序 | |
CN101048649A (zh) | 可扩展解码装置及可扩展编码装置 | |
CN1969317A (zh) | 基于多个参数化的多声道重构 | |
CN101067931A (zh) | 一种高效可配置的频域参数立体声及多声道编解码方法与系统 | |
CN1848690A (zh) | 多声道数字音频编码设备及其方法 | |
CN1748443A (zh) | 多声道音频扩展支持 | |
CN1765072A (zh) | 多声道音频扩展支持 | |
CN1391689A (zh) | 宽带语音和音频信号解码器中的增益平滑 | |
CN1113401A (zh) | 高效率编码方法、高效率编码的译码方法、高效率编码的编码装置、高效率编码的译码装置、高效率编码-译码系统和记录媒体 | |
CN1750406A (zh) | 用于从音频数据码流中解码重建多声道音频信号的解码器 | |
CN1122256C (zh) | 用前向和反向线性预测编码分析编码音频信号的方法和装置 | |
CN1383614A (zh) | 压缩方法及装置、扩展方法及装置、压缩扩展系统、存储媒体、程序 | |
CN1144178C (zh) | 音频信号编码装置和译码装置以及音频信号编码和译码方法 | |
CN1229194A (zh) | 基频特性曲线产生方法,基频特性曲线产生器,和程序记录介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
C17 | Cessation of patent right | ||
CF01 | Termination of patent right due to non-payment of annual fee |
Granted publication date: 20070704 Termination date: 20121030 |