CN101093670A - 根据频率变换重建具有不完全频谱的音频信号的频谱 - Google Patents

根据频率变换重建具有不完全频谱的音频信号的频谱 Download PDF

Info

Publication number
CN101093670A
CN101093670A CNA2007101373998A CN200710137399A CN101093670A CN 101093670 A CN101093670 A CN 101093670A CN A2007101373998 A CNA2007101373998 A CN A2007101373998A CN 200710137399 A CN200710137399 A CN 200710137399A CN 101093670 A CN101093670 A CN 101093670A
Authority
CN
China
Prior art keywords
signal
frequency
spectrum
spectrum component
component
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007101373998A
Other languages
English (en)
Other versions
CN101093670B (zh
Inventor
迈克尔·M·杜鲁门
马克·S·文顿
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Dolby Laboratories Licensing Corp
Original Assignee
Dolby Laboratories Licensing Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Dolby Laboratories Licensing Corp filed Critical Dolby Laboratories Licensing Corp
Publication of CN101093670A publication Critical patent/CN101093670A/zh
Application granted granted Critical
Publication of CN101093670B publication Critical patent/CN101093670B/zh
Anticipated expiration legal-status Critical
Expired - Lifetime legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • G10L19/0208Subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/0017Lossless audio signal coding; Perfect reconstruction of coded audio signal by transmission of coding error
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/002Dynamic bit allocation
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/012Comfort noise or silence coding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0204Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using subband decomposition
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/028Noise substitution, i.e. substituting non-tonal spectral components by noisy source
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/03Spectral prediction for preventing pre-echo; Temporary noise shaping [TNS], e.g. in MPEG2 or MPEG4
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/06Determination or coding of the spectral characteristics, e.g. of the short-term prediction coefficients
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/167Audio streaming, i.e. formatting and decoding of an encoded audio signal representation into a data stream for transmission or storage purposes
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/16Vocoder architecture
    • G10L19/173Transcoding, i.e. converting between two coded representations avoiding cascaded coding-decoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/04Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using predictive techniques
    • G10L19/26Pre-filtering or post-filtering
    • G10L19/265Pre-filtering, e.g. high frequency emphasis prior to encoding
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L21/00Processing of the speech or voice signal to produce another audible or non-audible signal, e.g. visual or tactile, in order to modify its quality or its intelligibility
    • G10L21/02Speech enhancement, e.g. noise reduction or echo cancellation
    • G10L21/038Speech enhancement, e.g. noise reduction or echo cancellation using band spreading techniques
    • G10L21/0388Details of processing therefor
    • GPHYSICS
    • G10MUSICAL INSTRUMENTS; ACOUSTICS
    • G10LSPEECH ANALYSIS OR SYNTHESIS; SPEECH RECOGNITION; SPEECH OR VOICE PROCESSING; SPEECH OR AUDIO CODING OR DECODING
    • G10L19/00Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis
    • G10L19/02Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders
    • G10L19/0212Speech or audio signals analysis-synthesis techniques for redundancy reduction, e.g. in vocoders; Coding or decoding of speech or audio signals, using source filter models or psychoacoustic analysis using spectral analysis, e.g. transform vocoders or subband vocoders using orthogonal transformation

Abstract

通过发送或记录具有估值的频谱包络和从信号的像噪声那样的质量的度量得出的噪声混淆参数的信号的基带,音频信号可以更加有效地传送。信号是通过把基带信号的频谱分量变换到基带以外的频率,调节再生分量的相位以保持相位相关性,按照估值的频谱包络调节频谱形状,以及按照噪声混淆参数加上噪声,而被重建的。优选地,发送的或记录的信号也包括被使用来调节重建信号的时间形状的估值的时间包络。

Description

根据频率变换重建具有不完全频谱的音频信号的频谱
本申请是申请号为03805096.X、申请日为2003年3月21日、发明名称为“根据频率变换重建具有不完全频谱的音频信号的频谱”的专利申请的分案申请。
技术领域
本发明总体上涉及音频信号的传输和记录。更具体地,本发明提供对于发送或存储给定的音频信号所需要的信息的减小,而同时保持输出信号的给定的感知质量水平。
背景技术
许多通信系统面对这样的问题,对于信息传输和存储容量的要求常常超过可提供的容量。结果,在广播和记录领域中相当大的兴趣是减小对于发送或记录打算供人们感知的音频信号所需要的信息量,而不恶化它的主观质量。同样地,需要对于给定的带宽或存储容量改进输出信号的质量。
两个主要考虑推进打算用于音频传输和存储的系统的设计:对于减小信息需求的需要和对于保证输出信号中特定程度的感知量的需要。这两个考虑冲突之处在于,减小发送的信息量会减小输出信号的感知量。虽然客观约束条件,诸如数据速率,通常是由通信系统本身加上的,但主观感知要求通常是由应用规定的。
用于减小信息需求的传统的方法包括只发送或记录输入信号的选择的部分,其余部分被丢弃。优选地,只有被认为是冗余的或与感知无关的部分被丢弃。如果需要额外的减小,优选地只有被认为是具有最小感知重要性的信号部分被丢弃。
强调超过保真度的清晰度的语音应用,诸如语音编码,只发送或记录一部分信号,这里称为“基带信号”,它只包含信号频谱的感知上最相关的部分。接收机可以从被包含在基带信号内的信息再生话音信号的省略的部分。再生的信号通常在感知上不等同于原先的信号,但对于许多应用,近似的再现是足够的。另一方面,被设计成达到高保真度的应用,诸如高质量音乐应用,通常需要较高的质量的输出信号。为了达到较高质量的输出信号,通常必须发送更大量的信息或利用更复杂的生成输出信号的方法。
在语音信号译码方面使用的一个技术被称为高频再生(“HFR”)。只包含信号的低频分量的基带信号被发送或存储。接收机根据接收的基带信号的内容再生省略的高频分量,以及组合基带信号与再生的高频分量,产生输出信号。虽然再生的高频分量通常不等同于原先信号的高频分量,但这个技术可以产生比起不使用HFR的其他技术更满意的输出信号。在语音编码和译码领域中开发了这个技术的许多变例。被使用于HFR的三个通用的方法是频谱折叠、频谱变换、和整流。这些技术的说明可以在以下文章中找到:Makhoul和Berouti在ICASSP 1979 IEEE International Conf.on Acoust.,Speech and SignalProc.,1979年4月2-4日著的”High-Frequency Regeneration inSpeech Coding Systems”。
虽然实施起来简单,但这些HFR技术通常不适用于高质量再现系统,诸如用于高质量音乐的再现系统。频谱折叠和频谱变换会产生不想要的背景音。整流往往产生觉察到刺耳的结果。本发明人注意到,在这些技术产生不满意的结果的许多情形下,技术被使用于其中HFR被限于对于5kHz的分量的变换的限带的语音编码译码器。
本发明人还注意到由于HFR技术的使用引起的两个其他的问题。第一个问题涉及到信号的音调和噪声特性,以及第二个问题涉及到再生信号的时间形状或包络。许多自然的信号包含噪声分量,它的幅度作为频率的函数增加。已知的HFR技术从基带信号再生高频分量,但无法在更高的频率上再现在再生信号中像音调的和像噪声的分量的正确的混合。再生的信号常常包含由于用基带中像音调的分量替换原先的、更像噪声的高频分量引起的不同的高频“蜂音”。而且,已知的HFR技术无法以再生的信号的时间包络保持或至少类似于原先的信号的时间包络的方式再生频谱分量。
已开发了多种更复杂的、提供改进的结果的HFR技术;然而,这些技术往往是特定于语音的,依赖于语音的特征,其不适合于音乐和其他的音频形式,或需要很大的、不能经济地实施的计算资源。
发明内容
本发明的一个目的是提供音频信号的处理,以便减小在传输或存储期间代表一个信号所需要的信息量而同时保持信号的感觉的质量。虽然本发明具体地针对音乐信号的再现,但它也可以应用于各种各样的音频信号,包括话音。
按照本发明的一个方面,在发射机中,输出信号被通过如下生成:得出具有音频信号的某些但不是全部频谱分量的基带信号的频域代表;得出具有不在基带信号中的音频信号的频谱分量的剩余信号的估值的频谱包络;从剩余信号的噪声内容的度量导出噪声混淆参数;以及把代表基带信号的频域代表的数据、估值的频谱包络和噪声混淆参数组装到输出信号。
按照本发明的另一个方面,在接收机中,音频信号被通过如下重建:接收包含代表基带信号的数据、估值的频谱包络和噪声混淆参数的信号;从数据得出基带信号的频域代表;通过在频率上变换基带的频谱分量而得到包括再生的频谱分量的再生的信号;调节再生的频谱分量的相位以保持再生信号内的相位相干性;藉助于响应噪声混淆参数得出噪声信号、通过按照估值的频谱包络和噪声混淆参数调节再生的频谱分量的幅度而修正再生信号、和组合修正的再生信号与噪声信号,而得到调节的再生的信号;以及得出相应于调节的再生信号中的频谱分量与基带信号的频域代表中的频谱分量的组合的重建的信号的时域代表。
本发明的其他方面在下面说明,以及在权利要求中阐述。
通过参照附图和以下的说明可以更好地了解本发明的各种特征和它的优选实施方案,其中相同的标号是指几个图上相同的单元。以下的讨论和附图的内容仅仅作为例子阐述,而不应当理解为代表对于本发明的范围的限制。
附图说明
图1显示通信系统中的主要部件。
图2是发射机的方框图。
图3A和3B是音频信号和相应的基带信号的假设的示意图。
图4是接收机的方框图。
图5A-5D是基带信号和通过基带信号的变换生成的信号的假设的示意图。
图6A-6G是通过使用频谱变换和噪声混淆再生高频分量得到的信号的假设的示意图。
图6H是图6G的信号在增益调节后的图形。
图7是图6B所示的基带信号与图6H所示的再生信号相组合的图形。
图8A是信号的时间形状的图形。
图8B显示通过从图8A的信号得出基带信号与通过频谱变换的处理再生信号而产生的输出信号的时间形状。
图8C显示图8B的信号在执行时间包络控制后的时间形状。
图9是通过使用时域技术提供对于时间包络控制所需要的信息的发射机的方框图。
图10是通过使用时域技术提供时间包络控制的接收机的方框图。
图11是通过使用频域技术提供对于时间包络控制所需要的信息的发射机的方框图。
图12是通过使用频域技术提供时间包络控制的接收机的方框图。
具体实施方式
A.总述
图1显示在通信系统的一个例子中的主要部件。信息源112沿路径115生成音频信号,它代表基本上任何类型的音频信息,诸如语音或音乐。发射机136接收来自路径115的音频信号,以及把该信息处理成适合于通过信道140传输的形式。发射机136可以准备好信号以与信道140的物理特性相匹配。信道140可以是诸如电线或光纤那样的传输路径,或它可以是通过空间的无线通信路径。信道140也可包括记录信号在存储媒体上的存储装置,诸如磁带或磁盘或光盘,供接收机142以后使用。接收机142可以执行各种各样的处理功能,诸如解调或译码从信道140接收的信号。接收机142的输出沿着路径145被传送到换能器147,它把该输出变换成适合于用户的输出信号152。在传统的音频播放系统中,例如,扬声器用作为换能器,把电信号变换成声音信号。
被限制于通过具有有限带宽的信道进行发送或在具有有限容量的媒体上进行记录的通信系统,在对于信息的要求超过这个可提供的带宽或容量时遇到问题。结果,在广播和记录领域中不断需要减小对于发送或记录打算供人们感知的音频信号所需要的信息量,而不恶化它的主观质量。同样地,需要对于给定的传输带宽或存储容量改进输出信号的质量。
在语音编码方面使用的一个技术被称为高频再生(“HFR”)。只包含语音信号的低频分量的基带信号被发送或存储。接收机142根据接收的基带信号的内容再生省略的高频分量,以及组合基带信号与再生的高频分量,产生输出信号。然而,通常,已知的HFR技术产生的再生高频分量容易与原先信号中的高频分量不同。本发明提供改进的用于频谱分量再生的技术,它产生的再生频谱分量比起由其他已知的技术提供的分量,在感觉上更加类似于原先的信号中的相应的频谱分量。重要的是指出,虽然这里描述的技术有时被称为高频再生,但本发明并不限于再生信号的高频分量。下面描述的技术也可被利用来再生频谱的任何部分中的频谱分量。
B.发射机
图2是按照本发明的一个方面的发射机136的方框图。输入音频信号从路径115被接收以及由分析滤波器库705进行处理,得到输入信号的频域代表。基带信号分析器710确定输入信号的哪些频谱分量要被丢弃。滤波器715去除要被丢弃的频谱分量,产生包含剩余的频谱分量的基带信号。频谱包络估值器720得到输入信号频谱包络的估值。频谱分析器722分析估值的频谱包络,以确定信号的噪声混淆参数。信号格式化器725把估值的频谱包络信息,噪声混淆参数,和基带信号组合成具有适合于传输或存储的形式的输出信号。
1.分析滤波器库
分析滤波器库705可以通过基本上任何时域到频域的变换而被实施。在本发明的优选实施例中使用的变换在以下文章中描述:Princen,Johnson和Bradley著的”Subband/Transform Coding Using FilterBank Designs Based on Time Domain Aliasing Cancellation”,ICASSP1987 Conf.Proc.,1987年5月,第2161-64页。这种变换是具有时域混抵销的奇数堆叠的临界采样的单边带分析-合成系统的时域等价物,这里被称为”O-TDAC”。
按照O-TDAC技术,音频信号被采样,量化,和分组为一系列重叠的时域信号样本块。每个样本块被分析窗口函数加权,这等价于信号样本块的逐个样本的乘法。O-TDAC技术把修正的离散余弦变换(”DCT”)施加到加权的时域信号样本块,产生变换系数组,这里被称为“变换块”。为了达到临界采样,技术只在传输或存储之前保持频谱系数的一半。不幸地,仅仅一半的频谱系数的保持,使得互补的逆变换生成时域混淆分量。O-TDAC技术可以抵销混叠以及精确地恢复输入信号。块的长度可以通过使用本领域已知的技术响应于信号特性而变化;然而,由于下面讨论的原因应当注意相位相干性。通过参考美国专利5,394,473,可以得到O-TDAC技术的其它细节。
为了从变换块恢复原先的输入信号块,O-TDAC技术利用逆修正的DCT。由逆变换产生的信号块由合成窗口函数加权,被重叠和相加,以重建输入信号。为了抵销时域混叠和精确地恢复输入信号,分析和合成窗口必须被设计成满足严格的准则。
在用于传输或记录以44.1千样本/秒的速率采样的输入数字信号的系统的一个优选实施例中,从分析滤波器库705得到的频谱分量被划分成四个子频带,具有如表I所示的频率范围。
    频带     频率范围(kHz)
    0123     0.0到5.55.5到11.011.0到16.516.5到22.0
表I
2.基带信号分析器
基带信号分析器710选择哪些频谱分量被丢弃,以及哪些频谱分量被保持用于基带信号。这个选择可根据输入信号特性改变,或它可按照应用的需要保持固定;然而,本发明人通过实验确定,如果一个或多个信号的基波频率被丢弃,音频信号的感觉质量恶化。所以,优选地,保留包含信号的基波频率的频谱的这些部分。因为话音和大多数自然乐器的基波频率通常不高于约5kHz,打算用于音乐应用的发射机136的优选实施方案使用处于或约5kHz的固定的截止频率,以及丢弃大于该频率的所有的频谱分量。在固定的截止频率的情形下,基带信号分析器只要提供固定的截止频率到滤波器715和频谱分析器722。在替换实施方案中,基带信号分析器710被取消,以及滤波器715和频谱分析器722按照固定的截止频率运行。在以上表I所示的子频带结构中,例如,仅仅子频带0中的频谱分量保持用于基带信号。这个选择也是合适的,因为人耳不容易区分5kHz以上的音调的差别,所以不容易分辨在这个频率以上的再生分量中的不精确性。
截止频率的选择影响基带信号的带宽,它又影响由发射机136生成的输出信号的信息容量要求与由接收机142重建的信号的感觉的质量之间的折衷。由接收机142重建的信号的感觉质量受三个因素影响,这在以下的段落中讨论。
第一个因素是被发送或存储的基带信号代表的精确性。通常,如果基带信号的带宽保持为恒定的,则当基带信号代表的精确性提高时,重建的信号的感觉质量将提高。如果不精确性足够大,不精确性代表在重建的信号中可听见的噪声。噪声将降低基带信号和由基带信号再生的频谱分量的感觉质量。在示例性实施例中,基带信号代表是一组频域变换系数。这个代表的精确性由被使用来表示每个变换系数的比特数控制。编码技术可被使用来以较少的比特传送给定水平的精确性;然而,对于任何给定的编码技术,存在有基带信号精确性与信息容量要求之间的基本折衷。
第二个因素是被发送或存储的基带信号的带宽。通常,如果基带信号代表的精确性保持为恒定的,则当基带信号的带宽提高时,重建的信号的感觉质量将提高。较宽的带宽的基带信号的使用允许接收机142限制再生频谱分量到更高的频率,在更高的频率人的听觉系统对于时间和频谱形状的差别不太敏感。在上述的示例性实施方案中,基带信号的带宽由代表中的变换系数的数目控制。编码技术可被使用来以较少的比特传送给定的数目的系数;然而,对于任何给定的编码技术,存在有基带信号带宽与信息容量要求之间的基本折衷。
第三个因素是对于发送或存储基带信号表示所需要的信息容量。如果信息容量要求保持为恒定的,则基带信号精确性将随基带信号的带宽相反地变化。应用的需要通常将为由发射机136生成的输出信号规定特定的信息容量要求。这个容量必须分配给输出信号的各个部分,诸如基带信号代表和估值的频谱包络。分配必须平衡对于通信系统熟知的多个冲突的利益的需要。在这个分配内,基带信号的带宽应当被选择成平衡与编码精确性的折衷,使得重建的信号的感觉质量最佳化。
3.频谱包络估值器
频谱包络估值器720分析音频信号,提取关于信号的频谱包络的信息。如果可提供的信息容量许可,发射机136的实施方案优选地通过把信号的频谱划分成具有近似于人耳的临界频带的带宽的频带,和提取关于在每个频带中信号幅度的信息,而得到信号的频谱包络的估值。然而,在具有有限的信息容量的大多数应用中,优选地把频谱划分成较小的数目的子频带,诸如以上在表I中所显示的安排。也可以使用其他变例,诸如计算功率谱密度或提取每个频带中平均的或最大的幅度。更复杂的技术可以提供输出信号的更高的质量,但通常需要更大的计算资源。被使用来得到估值的频谱包络的方法的选择通常具有实际的意义,因为它通常影响通信系统的感觉的质量;然而,方法的选择在原则上不是严格的。可以按需要使用几乎任何技术。
在使用表I所示的子频带结构的一个实施方案中,频谱包络估值器720只对于子频带0,1,和2得到频谱包络的估值。子频带3被排除,以便减小对于表示估值的频谱包络所需要的信息量。
4.频谱分析器
频谱分析器722分析从频谱包络估值器720接收的估值的频谱包络和来自基带信号分析器710的信息,它识别要从基带信号中丢弃的频谱分量,以及计算要由接收机142使用的一个或多个噪声混淆参数,以生成变换的频谱分量的噪声分量。优选实施方案通过计算和发送要被接收机142加到所有的变换分量的单个噪声混淆参数,而使得数据速率要求最小化。噪声混淆参数可以通过多个不同的方法的任何一个方法进行计算。优选的方法导出等于频谱平坦度度量的单个噪声混淆参数,这是从短时间功率谱的几何平均值对算术平均值的比值计算的。该比值给出对于频谱的平坦度的粗略的表示。表示更平坦的频谱的更高的频谱平坦度度量,也表示更高的噪声混淆水平是适当的。
在发射机136的替换的实施方案中,频谱分量被分组成多个子频带,诸如表I显示的,以及发射机136发送每个子频带的噪声混淆参数。这更加精确地规定要与变换的频率内容混合的噪声量,但也需要更高的数据速率来发送额外的噪声混淆参数。
5.基带信号滤波器
滤波器715接收来自基带信号分析器710的信息,它标识从基带信号中被选择为丢弃的频谱分量,以及消除选择的频率分量,以得出基带信号的频域代表,用于传输或存储。图3A和3B是音频信号和相应的基带信号的假设的示意图。图3A显示假设的音频信号的频域代表600的频谱包络。图3B显示在音频信号被处理成消除选择的高频分量之后剩余的基带信号610的频谱包络。
滤波器715可以以有效地去除被选择为丢弃的频率分量的基本上任何方式实施。在一个实施方案中,滤波器715把频域窗口函数施加到输入音频信号的频域代表上。窗口函数的形状被选择为提供对于接收机142最终生成的输出音频信号的时域结果的频率选择性与衰减之间的适当的折衷。
6信号格式化器
信号格式化器725通过把估值的频谱包络信息,一个或多个参数混淆参数,和基带信号的代表组合成具有适合于传输或存储的形式的输出信号,而生成沿通信信道140的输出信号,各个信号可以以基本上任何方式被组合。在许多应用中,格式化器725把各个信号复用成串行比特流,该比特流具有适当的同步格化,检错和纠错码,以及与传输或存储操作有关的或与其中使用音频信息的应用有关的其他信息。信号格式化器725也可编码全部或部分输出信号,以减小信息容量要求,提供安全性,或把输出信号放在便于以后使用的格式中。
C.接收机
图4是按照本发明的一个方面的接收机142的方框图。去格式化器805接收来自通信信道140的信号,以及从这个信号得出基带信号,估值的频谱包络信息和一个或多个噪声混淆参数。这些信息单元被发送到信号处理器808,它包括频谱再生器810,相位调节器815,混淆滤波器818,和增益调节器820。频谱分量再生器810确定在基带信号中哪些频谱分量丢失,以及通过把基带信号的全部或至少某些频谱分量变换到丢失的频谱分量的位置来再生它们。变换的分量被传送到相位调节器815,它调节组合信号内一个或多个频谱分量的相位,以保证相位相干性。混淆滤波器818按照随基带信号接收的一个或多个噪声混淆参数,把一个或多个噪声分量加到变换的分量。增益调节器820按照随基带信号接收的估值的频谱包络信息,调节再生信号中频谱分量的幅度。变换的和调节的频谱分量与基带信号相组合,产生输出信号的频域代表。合成滤波器库825处理该信号,得出输出信号的时域代表,它沿路径145传送。
1.去格式化器
去格式化器805以与信号格式化器725提供的格式化过程互补的方式处理从通信信道140接收的信号。在许多应用中,去格式化器805从信道140接收串行比特流,使用比特流内的同步格式来同步它的处理,使用纠错和检错码,以识别和校正在传输或存储期间引入到比特流中的错误,以及作为解复用器运行,提取基带信号的代表,估值的频谱包络信息,一个或多个噪声混淆参数,以及可与应用有关的任何其他信息。去格式化器805也可以译码全部或部分串行比特流,逆反发射机136提供的任何编码的效果。基带信号的频域代表被传送到频谱分量再生器810,噪声混淆参数被传送到混淆滤波器818,以及频谱包络信息被传送到增益调节器820。
2.频谱分量再生器
频谱分量再生器810通过复制或变换基带信号的全部或至少某些频谱分量到信号的丢失的分量的位置,而再生丢失的频谱分量。频谱分量可被复制到一个以上的频率间隔,由此允许生成具有比基带信号的带宽的两倍大的带宽的输出信号。
在只使用上面如表I所示的子频带0和1的接收机142的实施方案中,基带信号不包含大于处于或约5.5kHz的截止频率的频谱分量。基带信号的频谱分量被复制或变换到从约5.5kHz到约11.0kHz的频率范围。如果16.5kHz的带宽是想要的,例如,基带信号的频谱分量也可被变换到从约11.0kHz到约16.5kHz的频率范围。一般地,频谱分量被变换到非重叠的频率范围,这样,在包括基带信号和全部复制的频谱分量的频谱中不存在缝隙;然而,这个特性不是重要的。频谱分量可被变换到重叠的频率范围和/或按想要的基本上任何方式被变换到频谱中具有缝隙的频率范围。
关于应当复制哪些频谱分量的选择可加以改变,以适合于具体的应用。例如,被复制的频谱分量不需要在基带的下部边缘开始,以及不需要在基带的上部边缘结束。被接收机142重建的信号的感觉质量有时可以通过排除话音和乐器的基波频率以及只复制谐波而被改进。通过从变换中排除低于约1kHz的这些基带频谱分量,可以把这方面合并到一个实施方案。参照以上表I所示的子频带结构作为例子,只有从约1kHz到约5.5kHz的频谱分量被变换。
如果要被再生的所有的频谱分量的带宽比起要被复制的基带频谱分量的带宽更宽,则基带频谱分量可以以循环方式被复制,从最低的频率分量开始直到最高的频率分量,以及如果必要的话,围绕最低的频率分量循环并以最低的频率分量继续进行。例如,参照表I所示的子频带结构,如果只有从约1kHz到5.5kHz的基带频谱分量被复制和对于跨过从约5.5kHz到16.5kHz的频率的子频带1和2再生频谱分量,则从约1kHz到约5.5kHz的基带频谱分量被复制到从约5.5kHz到10kHz的各个频率,从约1kHz到约5.5kHz的相同的基带频谱分量再次被复制到从约10kHz到14.5kHz的各个频率,以及从约1kHz到约3kHz的基带频谱分量被复制到从约14.5kHz到16.5kHz的各个频率。替换地,通过复制基带的最低的频率分量到各个子频带的下部边缘以及如果必要的话,在整个基带频谱分量上以循环方式继续进行,以完成该子频带的变换,而可以为再生的分量的每个单独的子频带进行这个复制过程。
图5A到5D是基带信号的频谱包络与通过在基带信号内频谱分量的变换而生成的信号的频谱包络的假设的示意图。图5A显示假设的译码的基带信号900。图5B显示被变换到较高的频率的基带信号905的频谱分量。图5C显示被变换多次到较高的频率的基带信号分量910。图5D显示通过组合变换的分量915与基带信号920而得到的信号。
3,相位调节器
频谱分量的变换可能在再生的分量的相位上产生不连续性。上述的O-TDAC变换实施方案,例如以及许多其他可能的实施方案,提供被安排在变换系数块中的频域代表。变换的频谱分量也被安排在块中。如果通过变换再生的频谱分量在接连的块之间具有相位不连续性,则在输出音频信号中多半出现可听见的人为产物。
相位调节器815调节每个再生的频谱分量的相位,以保持一致的或相干的相位。在采用上述的O-TDAC变换的接收机142的实施方案中,每个再生的频谱分量被乘以复数值ejΔω,其中Δω代表每个各个频谱分量被变换的频率间隔,表示为相应于该频率间隔的变换系数的数目。例如,如果频谱分量被变换到相邻的分量的频率,则变换间隔Δω等于1。替换的实施方案可需要适合于合成滤波器库825的具体的实施方案的不同的相位调节技术。
变换处理过程可以适于把再生的分量与基带信号内重要的频谱分量的谐波相匹配。变换可被调整的两个方法是改变要被复制的特定的频谱分量,或者改变变换的量。如果使用自适应过程,应当特别注意相位相干性,如果频谱分量被安排在块内的话。如果再生的频谱分量从不同的基波分量逐个块地被复制,或如果频率变换的量逐个块地被改变,则非常可能再生的分量将不是相位相干的。有可能调整频谱分量的变换,但必须注意保证由相位不相干性造成的人为产物的听见的程度是不显著的。采用多通道技术或前向技术的系统能识别其间可以调整变换的时间间隔。代表其间再生的频谱分量被认为是听不见的音频信号的间隔的块通常是用于调整变换过程的良好的候选者。
4.噪声混淆滤波器
混淆滤波器818通过使用从去格式化器805接收的噪声混淆参数生成用于变换的频谱分量的噪声分量。混淆滤波器818生成噪声信号,通过使用噪声混淆参数计算噪声混淆函数,以及利用噪声混淆函数组合噪声信号与变换的频谱分量。
噪声信号可以通过各种各样的方式的任何一种方式被生成。在优选实施方案中,通过生成具有0的中值和1的方差的分布的随机数序列,而产生噪声信号。混淆滤波器818通过把噪声信号乘以噪声混淆函数而调节噪声信号。如果使用单个噪声混淆参数,则噪声混淆函数通常应当调节噪声信号成在更高的频率上具有更高的幅度。这从以上讨论的假设得出,话音和自然乐器信号往往在更高的频率上包含更多的噪声。在优选实施方案中,当频谱分量被变换到较高的频率时,噪声混淆函数在较高的频率上具有最大的幅度,以及在噪声被混淆的最低的频率上平滑地衰减到最小值。
一个实施方案使用噪声混淆函数N(k),如以下的表达式表示:
N ( k ) = max ( k - k MIN k MAX - k MIN + B - 1,0 ) 对于kMIN≤k≤kMAX(1)
其中max(x,y)=x和y中的较大者;
B=基于SFM的噪声混淆参数;
k=再生的频谱分量的系数;
kMAX=用于频谱分量再生的最高频率;以及
kMIN=用于频谱分量再生的最低频率。
在这个实施方案中,B的数值从0变到1,其中1表示平坦频谱,它典型地是像噪声那样的信号,以及0表示不平坦的频谱形状,它典型地是像音调那样的信号。公式(1)中商的数值在k从kMIN增加到kMAX时从0改变到1。如果B等于0,”max”函数中的第一项从-1改变到0,所以,N(k)在再生的频谱中等于0,以及没有噪声加到再生的频谱分量。如果B等于1,”max”函数中的第一项从1改变到0;所以,N(k)从在最低的再生频率kMIN时的0线性地增加到在最大的再生频率kMAX时的1。如果B具有在0与1之间的数值,则N(k)在从kMIN直到在kMIN与kMAX之间的某个频率,都等于0,以及对于其余的再生频谱,线性地增加。再生的频谱分量的幅度通过把再生分量与噪声混淆函数相乘而被调节。调节的噪声信号与调节的再生频谱分量相组合。
上述的这个具体的实施方案仅仅是一个适当的例子。其他噪声混淆技术也可以按需要被使用。
图6A到6G是通过使用频谱变换与噪声混淆再生高频分量而得到的信号的频谱包络的假设的示意图。图6A显示要被发送的假设的输入信号410。图6B显示通过丢弃高频分量产生的基带信号420。图6C显示再生的高频分量431,432和433。图6D显示可能的噪声混淆函数440,给予在较高的频率的噪声分量更大的权重。图6E是与噪声混淆函数440相乘的噪声信号445的示意图。图6F显示通过把再生的高频分量431,432和433与噪声混淆函数440的倒数相乘而生成的信号450。图6G是通过把调节的噪声信号445加到调节的高频分量450而得出的组合信号460的示意图。图6G用来示意地显示,高频部分430包含变换的高频分量431,432和433与噪声的混合物的高频部分430。
5.增益调节器
增益调节器820按照从去格式化器805接收的估值的频谱包络信息调节再生信号的幅度。图6H是在增益调节后图6G所示的信号460的频谱包络的假设的图形。包含变换的频谱分量与噪声的混合物的信号的部分510,被给予近似于图6A所示的原先的信号410的频谱包络。以细刻度再现频谱包络通常是不必要的,因为再生的频谱分量没有精确地再现原先的信号的频谱分量。变换的谐波系列通常不等于谐波系列;所以,通常不可能保证再生的输出信号在细刻度时等同于原先的输入信号。与几个关键的或更少的频带内的频谱能量相匹配的粗略近似被发现为很行得通。应当指出,通常宁愿使用频谱形状的粗估值,而不是更细的近似,因为粗估值对于传输信道和存储介质提出较低的信息容量要求。然而,在具有一个以上的信道的音频应用中,通过使用频谱形状的更细的近似以使得可以进行更精确的增益调节,来保证信道之间的正确的平衡,而可以改进声音图像。
6.合成滤波器库
由增益调节器820提供的增益调节的噪声频谱分量与从去格式化器805接收的基带信号的频域代表相组合,形成重建的信号的频域代表。这可以通过把再生的分量加到基带信号的相应的分量而完成。图7显示通过把图6B所示的基带信号与图6H所示的再生的分量相组合而得到的假设的重建的信号。
合成滤波器库825把频域代表变换成重建的信号的时域代表。这个滤波器库可以以基本上任何方式来实施,但应当是与发射机136中使用的滤波器库705相反的。在以上讨论的优选实施方案中,接收机142使用O-TDAC合成,它采用逆修正的DCT。
D.本发明的替换实施方案
基带信号的宽度和位置可以以基本上任何方式被建立,以及例如可以按照输入信号特性动态地改变。在一个替换实施方案中,发射机136通过丢弃多个频带的频谱分量,由此造成基带信号频谱中的缝隙而生成基带信号。在频谱分量再生期间,部分基带信号被变换,再生丢失的频谱分量。
变换的方向也可变化。在另一个实施方案中,发射机136丢弃在低频的频谱分量,产生处在相对较高的频率的基带信号。接收机142把部分的高频基带信号向下变换到较低的频率位置,再生丢失的频谱分量。
E.时间包络控制
以上讨论的再生技术能够生成重建信号,基本上保留输入音频信号的频谱包络;然而,通常没有保留输入信号的时间包络。图8A显示音频信号860的时间形状。图8B显示通过从图8A的信号860得出基带信号和通过频谱分量变换的处理过程再生丢弃的频谱分量,而产生的重建的输出信号870的时间形状。重建的输出信号870的时间形状与原先的信号860的时间形状有很大的不同。时间形状的改变对于再生的音频信号的感觉质量有很大影响。下面讨论用于保留时间包络的两种方法。
1.时域技术
在第一种方法中,发射机136在时域中确定输入音频信号的时间形状,以及接收机142在时域中在重建的信号中恢复相同的或基本上相同的时间形状。
(a)发射机
图9显示在通过使用时域技术提供时间包络的通信系统中的发射机136的一个实施方案的方框图。分析滤波器库205接收来自路径115的输入信号,以及把信号划分成多个子频带信号。图上为了说明简明起见只显示两个子频带;然而,分析滤波器库205可以把输入信号划分成大于1的任何整数个子频带。
分析滤波器库205可以以实际上任何方式来实施,诸如级联连接的一个或多个正交镜像滤波器(QMF),或优选地,通过准QMF技术,它在一个滤波器级中把输入信号划分成任何整数个子频带。有关准QMF技术的附加信息可以从以下专著中得到:Vaidyanathan,”Multirate Systems and Filter Banks(多速率系统和滤波器库)”,Prentice Hall,New Jersey,1993,pp.354-373。
一个或多个子频带信号被使用来形成基带信号。其余的子频带信号包含被丢弃的输入信号的频谱分量。在许多应用中,基带信号从代表输入信号的最低频率频谱分量的一个子频带信号被形成,但这在原理上不是必须的。在用于发送或记录以44.1千样本/每秒速度采样的输入数字信号的系统的一个优选实施方案中,分析滤波器库205把输入信号划分成四个子频带,具有如以上表I中显示的频率范围。最低频率子频带被使用来形成基带信号。
参照图9所示的实施方案,分析滤波器库205把较低频率子频带信号作为基带信号传送到时间包络估值器213和调制器214。时间包络估值器213把基带信号的估值的时间包络提供到调制器214和信号格式化器225,优选地,低于约500Hz的基带信号频谱分量或者被排除在估值时间包络的处理过程以外,或者被衰减,以使得它们对于估值的时间包络的形状没有多大影响。这可以通过把适当的高通滤波器施加到由时间包络估值器213分析的信号上而被完成。调制器214把基带信号的幅度除以估值的时间包络,并把时间上平坦的基带信号的代表传送到分析滤波器库215。分析滤波器库215生成平坦的基带信号的频域代表,它被传送到编码器220用于编码。分析滤波器库215,以及下面讨论的分析滤波器库212,可以通过基本上任何的时域到频域变换被实施;然而,通常宁愿采用像实施临界采样滤波器库的O-TDAC变换那样的变换。编码器220是任选的;然而,它的使用是优选的,因为编码通常可被使用来减小平坦的基带信号的信息要求。平坦的基带信号,无论是否编码,被传送到信号格式化器225。
分析滤波器库205把高频子频带信号传送到时间包络估值器210和调制器211。时间包络估值器210把较高频率子频带信号的估值时间包络提供到输出信号格式化器225。调制器211把较高频率子频带信号的幅度除以估值的时间包络,并把时间上平坦的、较高频率的子频带信号的代表传送到分析滤波器库212。分析滤波器库212生成平坦的较高的频率的子频带信号的频域代表。频谱包络估值器720和频谱分析仪722以基本上与以上描述的相同的方式分别提供估值的频谱包络和一个或多个噪声混淆参数,用于较高的频率的子频带信号,以及把这个信息传送到信号格式化器225。
信号格式化器225通过把平坦的基带信号的代表,基带信号的估值的时间包络和较高频率子频带信号组装成输出信号,而沿着通信信道140提供输出信号。通过使用如上述的用于信号格式化器725的、基本上任何想要的格式化技术,各个信号和信息被组装成具有适合于传输或存储的形式的信号。
(b)时间包络估值器
时间包络估值器210和213可以以各种各样的方式被实施。在一个实施方案中,每个这些估值器处理被划分成子频带信号样本块的子频带信号。这些子频带信号样本块也通过分析滤波器库212或215被处理。在许多实际的实施方案中,这些块被安排成包含的样本数是2的幂,以及大于256个样本。这样的块的尺寸通常被优选为提高被使用来实施分析滤波器库212和215的变换的效率和频率分辨率。块的长度也可根据输入信号特性,诸如大的瞬态是否发生而被适配。每个块还被划分成256样本的组,用于时间包络估值。组的尺寸被选择为平衡在估值的精确度性与在输出信号中对于传送估值所需要的信息量之间的折衷。
在一个实施方案中,时间包络估值器计算在每个组的子频带信号样本中样本的功率。子频带信号样本块的一组功率值是对于该块的估值的时间包络。在另一个实施方案中,时间包络估值器计算在每个组中子频带信号样本幅度的平均值。该块的一组平均值是对于该块的估值的时间包络。
在估值的包络中的一组数值可以以各种各样的方式被编码。在一个例子中,每个块的包络由该块的第一组样本的初始值以及表示以后的组的相对值的一组差分值代表。在另一个例子中,差分的或绝对的代码以自适应方式被使用,以减小对于传送该数值所需要的信息量。
(c)接收机
图10显示通过使用时域技术提供时间包络控制的、通信系统中的接收机的一个实施方案的方框图。去格式化器265接收来自通信信道140的信号,以及从这个信号得到平坦的基带信号的代表,基带信号和较高的频率子频带信号的估值的时间包络,估值的频谱包络和一个或多个噪声混淆参数。译码器267是可任选的,但应当被使用来颠倒发射机136中执行的任何编码的效果,以得到平坦的基带信号的频域代表。
合成滤波器库280接收平坦的基带信号的频域代表,以及通过使用与在发射机136中的分析滤波器库215使用的、相反的技术,生成时域代表。调制器281从去格式化器265接收基带信号的估值的时间包络,以及使用这个估值来调制从合成滤波器库280接收的平坦的基带信号。这种调制提供基本上与在原先的基带信号被发射机136中的调制器214平坦化之前它的时间形状相同的时间形状。
信号处理器808接收来自去格式化器265的平坦的基带信号的频域代表,估值的时间包络,和一个或多个噪声混淆参数,以及以与以上对于图4所示的信号处理器808讨论的相同的方式再生频谱分量。再生的频谱分量被传送到合成滤波器库283,它通过使用与由发射机136中的分析滤波器库212和215使用的相反的技术生成时域代表。调制器284接收来自去格式化器265的较高频率子频带信号的估值的时间包络,以及使用这个估值的包络来调制从合成滤波器库283接收的再生的频谱分量信号。这个调制提供基本上与在原先的较高频率子频带信号被发射机136中的调制器211平坦化之前它的时间形状相同的时间形状。
调制的子频带信号和调制的较高频率子频带信号被组合,形成重建的信号,并把它传送到合成滤波器库287。合成滤波器库287使用与在发射机136中的分析滤波器库205使用的相反的技术,提供沿着路径145的输出信号,它们在感觉上与由发射机136从路径115接收的原先的输入信号不可区分的或几乎不可区分的。
2.频域技术
在第二种方法中,发射机136确定在频域中输入音频信号的时间包络,以及接收机142在频域中恢复与重建的信号相同的或基本上相同的时间包络。
(a)发射机
图11显示通过使用频域技术提供时间包络控制的、通信系统中的发射机136的一个实施方案的方框图。这个发射机的实施方案非常类似于图2所示的发射机的实施方案。主要的差别是时间包络估值器707。其他的部件不在这里详细讨论,因为它们的运行基本上是与以上结合图2描述的相同的。
参照图11,时间包络估值器707从分析滤波器库705接收输入信号的频域代表,该输入信号由分析滤波器库分析而得出输入信号的时间包络的估值。优选地,低于约500Hz的频谱分量或者从频域代表被排除,或者被衰减,以使得它们对于估值时间包络的处理过程没有重大的影响。时间包络估值器707通过对于估值的时间包络的频域代表和输入信号的频域代表进行去卷积而得出输入信号的时间平坦的版本的频域代表,这个去卷积可以通过用估值的时间包络的频域代表的倒数卷积输入信号的频域代表而完成。输入信号的时间平坦的版本的频域代表被传送到滤波器715,基带信号分析器710,和频谱包络估值器720。估值的时间包络的频域代表的说明被传送到信号格式化器725,用于组装成输出信号,沿着通信信道140被传送。
(b)时间包络估值器
时间包络估值器707可以以多种方式实施。用于时间包络估值器的一个实施方案的技术基础可以通过公式2所示的线性系统进行说明:
y(t)=h(t)·x(t)    (2)
其中y(t)=要被发送的信号;
h(t)=要被发送的信号的时间包络;
点符号(.)表示乘法;以及
x(t)=信号y(t)的时间平坦的版本。
公式2可被重写为:
Y[k]=H[k]*X[k]    (3)
其中Y[k]=输入信号y(t)的频域代表;
H[k]=h(t)的频域代表;
星符号(*)表示卷积;以及
X[k]=x(t)的频域代表。
参照图11,信号y(t)是发射机136从路径115接收的音频信号。分析滤波器库705提供信号y(t)的频域代表Y[k]。时间包络估值器707通过求解从X[k]和Y[k]的自回归移动平均(ARMA)模型得到的方程组而得出信号的时间包络h(t)的频域代表H[k]的估值。关于ARMA模型的使用的附加信息可以从以下专著得出:Proakis and Manolakis,“Digital Signal Processing:Principles,Algorithms  andApplications(数字信号处理:原理,算法和应用)”,MacMillanPublishing Co.,New York,1988。具体见pp.818-821。
在发射机136的优选实施方案中,滤波器库705对于代表信号y(t)的样本块实施变换,提供频域代表Y[k],被安排在变换系数块中。每个变换系数块表示信号y(t)的短时间信号频谱。频域代表X[k]也被安排在变换系数块中。频域代表X[k]中每个系数块代表假设为广义平稳(WSS)的时间平坦的信号的样本块。还假设,在每个X代表块中的系数是独立分布的(ID)。给出这些假设后,信号可通过ARMA模型被表示为如下:
Y [ k ] + Σ i = 1 L a i Y [ k - l ] = Σ q = 0 Q b q X [ k - q ] - - - ( 4 )
通过求解Y[k]的自相关函数,可以解方程4求出al和bq:
E { Y [ k ] · Y [ k - m ] } = - Σ i = 1 L a i E { Y [ k - l ] · Y [ k - m ] } + Σ q = 0 Q b q E { X [ k - q ] · Y [ k - m ] } - - - ( 5 )
其中E{}表示期望值函数;
L=ARMA模型的自  部分的长度;
Q=ARMA模型的移动平均部分的长度。
方程5可被重写为:
R YY [ m ] = - Σ i = 1 L a i R YY [ m - l ] + Σ q = 0 Q b q R XY [ m - q ] - - - ( 6 )
其中RYY[n]表示Y[n]的自相关函数;以及
RXY[n]表示Y[n]和X[n]的互相关函数。
如果我们进一步假设由H[k]代表的线性系统仅仅是自回归的,则方程6的右面的第二项等于X[k]的方差。方程6然后可被重写为:
Figure A20071013739900244
通过求逆以下的线性方程组,可求解方程7:
Figure A20071013739900245
给出这个基础知识后,现在有可能描述使用频域技术的时间包络估值器的一个实施方案。在这个实施方案中,时间包络估值器707接收输入信号y(t)的频域代表Y[k]和计算自相关序列RXX[m],对于-L≤m≤L。这些数值被使用来构建公式8中显示的矩阵。然后对矩阵求逆,解出系数ai。因为公式8中的矩阵是Toeplitz的,它可以通过Levinson-Durbin算法求逆。对于信息可参阅Proakis and Manolakis,pp.458-462。
通过矩阵求逆,得到的方程组不能直接解出,因为X[k]的方差2X是未知的;然而,对于某些适宜的方差,诸如数值1,方程组可以求解。一旦对于这个适宜的数值被解出,方程组就产生一组非归一化的系数{a’0,...a’L}。这些系数是非归一化的,因为方程是对于适宜的方差求解的。通过把每个系数除以第一非归一化系数值,系数可被归一化,它可被表示为:
a i = a i a 0 对于0<i≤L    (9)
方程可以从以下公式得出:
σ X 2 = 1 a 0 - - - ( 10 )
归一化系数组{1,a1,...,aL}代表平坦的滤波器FF的零,它们可以用输入信号y(t)的频域代表进行卷积,得到输入信号的时间平坦的版本x(t)的频域代表。归一化系数组代表重建的滤波器FR的极点,得到该平坦信号的频域代表,具有基本上等于输入信号y(t)的时间包络的修正的时间形状。
时间包络估值器707用从滤波器库705接收的频域代表Y[k]对平坦的滤波器FF进行卷积,以及把时间平坦的结构传送到滤波器715,基带信号分析器710,和频谱包络估值器720。在平坦滤波器FF中的系数的说明被传送到信号格式化器725,用于组装成输出信号,沿路径140传送。
(c)接收机
图12显示通过使用频域技术提供时间包络控制的、通信系统中的接收机142的一个实施方案的方框图。这个接收机的实施方案非常类似于图4所示的接收机的实施方案。主要的差别是时间包络再生器807。其他的部件不在这里详细讨论,因为它们的运行基本上是与以上结合图4描述的相同的。
参照图12,时间包络再生器807从去格式化器805接收估值的时间包络的说明,它是用重建的信号的频域代表进行卷积。从卷积得出的结果被传送到合成滤波器库825,它提供沿着路径145的输出信号,它们在感觉上与由发射机136从路径115接收的原先的输入信号是很难区分的或接近很难区分的。
时间包络再生器807可以以多种方式实施。在与以上讨论的包络估值器的实施方案相兼容的实施方案中,去格式化器805提供代表重建滤波器FR的极点的一组系数,它是与重建的信号的频域代表进行卷积。
(d)替换实施方案
替换实施方案是可能的。在用于发射机136的替换例中,从滤波器库705接收的频域代表的频谱分量被分组为子频带。表I所示的子频带组是一个适当的例子。等于每个子频带得出一个平坦滤波器FF,把它与每个子频带的频域代表进行卷积,以使得它在时间上平坦化。信号格式化器725把每个子频带的估值的时间包络的标识组装成输出信号。接收机142接收每个子频带的估值的时间包络,得出每个子频带的适当的再生滤波器FR,以及把它与在重建的信号中的相应的子频带的频域代表进行卷积。
在另一个替换例中,多组系数{Ci}j被存储在表中。对于输入信号,计算用于平坦滤波器FF的系数{1,a1,...,aL},以及把计算的系数与被存储在表中的多组系数的每组系数进行比较。选择表中的、似乎最接近于计算的系数的组{Ci}j,以及被使用来使得输入信号平坦化。从表中选择的该组{Ci}j的标识被传送到信号格式化器725,被组装成输出信号。接收机142接收该组{Ci}j的标识,查询存储的系数组的表以得出适当的系数组{Ci}j,得出相应于该系数的再生滤波器FR,以及把该滤波器与重建的信号的频域代表进行卷积。这个替换例也可以应用于以上讨论的子频带。
用来选择表中的一组系数的一个方法是在L维空间中规定具有等于输入信号或输入信号的子频带的的计算的系数(a1,...,aL)的、欧几里得坐标的一个目标点。被存储在表中的每个组规定L维空间的各个点。其相关的点具有离目标点最短的欧几里得距离的、被存储在表中的组被认为最接近于计算的系数。如果该表例如存储256组系数,则8比特数被传送到信号格式化器725,以识别选择的系数组。
F.实施方案
本发明可以以各种各样的方式实施。可以按需要使用模拟和数字技术。各个方面例如可以通过分立的电子元件,集成电路,可编程逻辑阵列,ASIC,和其他类型的电子元件,以及通过执行指令的程序的设备来实施。指令的程序可以通过基本上任何设备可读的媒体,诸如磁和光存储媒体,只读存储器和可编程存储器来传送。

Claims (5)

1.一种用于产生重建信号的方法,所述方法包括:
接收包含代表从音频信号导出的基带信号和估计的频谱包络的数据的信号;
从所述数据获得所述基带信号的频域代表,所述频域代表包括基带频谱分量;
通过对于各单独子频带,以循环方式将最低频率基带频谱分量拷贝到相应子频带的下边缘并继续拷贝所述基带频谱分量,以完成该相应子频带的变换,从而获得包括再生频谱分量的再生信号;及
获得相应于基带频谱分量、再生频谱分量和估计的频谱包络的组合的重建的信号的时域代表。
2.根据权利要求1的方法,其中获得所述重建信号的时域代表以代表重建信号的在长度上变化的分段。
3.根据权利要求1的方法,包括:应用时域混叠抵消合成变换以获得所述重建信号的时域代表。
4.根据权利要求1的方法,包括:通过改变拷贝哪些频谱分量或通过改变拷贝频谱分量的频率量,调整所述频谱分量的拷贝。
5.根据权利要求1-4中的任一个的方法,其中在所接收的信号中包含的所述数据还代表从音频信号的噪声内容的度量中导出的噪声混淆参数,所述方法还包括:
根据估计出的频谱包络和噪声混淆参数调节所述再生的频谱分量的幅度。
CN2007101373998A 2002-03-28 2003-03-21 用于产生重建信号的方法 Expired - Lifetime CN101093670B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/113,858 2002-03-28
US10/113,858 US20030187663A1 (en) 2002-03-28 2002-03-28 Broadband frequency translation for high frequency regeneration

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB03805096XA Division CN100338649C (zh) 2002-03-28 2003-03-21 处理音频信号、生成重建的音频信号的方法、设备及媒体

Publications (2)

Publication Number Publication Date
CN101093670A true CN101093670A (zh) 2007-12-26
CN101093670B CN101093670B (zh) 2010-06-02

Family

ID=28453693

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB03805096XA Expired - Lifetime CN100338649C (zh) 2002-03-28 2003-03-21 处理音频信号、生成重建的音频信号的方法、设备及媒体
CN2007101373998A Expired - Lifetime CN101093670B (zh) 2002-03-28 2003-03-21 用于产生重建信号的方法

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB03805096XA Expired - Lifetime CN100338649C (zh) 2002-03-28 2003-03-21 处理音频信号、生成重建的音频信号的方法、设备及媒体

Country Status (16)

Country Link
US (19) US20030187663A1 (zh)
EP (2) EP1488414A1 (zh)
JP (1) JP4345890B2 (zh)
KR (1) KR101005731B1 (zh)
CN (2) CN100338649C (zh)
AT (1) ATE511180T1 (zh)
AU (1) AU2003239126B2 (zh)
CA (1) CA2475460C (zh)
HK (2) HK1078673A1 (zh)
MX (1) MXPA04009408A (zh)
MY (1) MY140567A (zh)
PL (1) PL208846B1 (zh)
SG (8) SG10201710912WA (zh)
SI (1) SI2194528T1 (zh)
TW (1) TWI319180B (zh)
WO (1) WO2003083834A1 (zh)

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102237954A (zh) * 2010-04-30 2011-11-09 财团法人工业技术研究院 软性解映射方法及其装置与其通讯系统
CN102449692A (zh) * 2009-05-27 2012-05-09 杜比国际公司 高效组合谐波转置
CN102834864A (zh) * 2010-04-13 2012-12-19 索尼公司 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序
CN103370742A (zh) * 2011-02-18 2013-10-23 株式会社Ntt都科摩 语音解码装置、语音编码装置、语音解码方法、语音编码方法、语音解码程序以及语音编码程序
CN104221081A (zh) * 2011-11-02 2014-12-17 瑞典爱立信有限公司 带宽扩展音频信号的高频带扩展的生成
CN106663437A (zh) * 2014-05-01 2017-05-10 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、记录介质
CN109036457A (zh) * 2018-09-10 2018-12-18 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
AUPR433901A0 (en) 2001-04-10 2001-05-17 Lake Technology Limited High frequency signal construction method
US20030035553A1 (en) * 2001-08-10 2003-02-20 Frank Baumgarte Backwards-compatible perceptual coding of spatial cues
US7292901B2 (en) * 2002-06-24 2007-11-06 Agere Systems Inc. Hybrid multi-channel/cue coding/decoding of audio signals
US7583805B2 (en) * 2004-02-12 2009-09-01 Agere Systems Inc. Late reverberation-based synthesis of auditory scenes
US7116787B2 (en) * 2001-05-04 2006-10-03 Agere Systems Inc. Perceptual synthesis of auditory scenes
US7644003B2 (en) * 2001-05-04 2010-01-05 Agere Systems Inc. Cue-based audio coding/decoding
US20030187663A1 (en) 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7447631B2 (en) 2002-06-17 2008-11-04 Dolby Laboratories Licensing Corporation Audio coding system using spectral hole filling
US20040138876A1 (en) * 2003-01-10 2004-07-15 Nokia Corporation Method and apparatus for artificial bandwidth expansion in speech processing
EP1482482A1 (de) * 2003-05-27 2004-12-01 Siemens Aktiengesellschaft Frequenzerweiterung für Synthesizer
KR101058062B1 (ko) 2003-06-30 2011-08-19 코닌클리케 필립스 일렉트로닉스 엔.브이. 잡음 부가에 의한 디코딩된 오디오의 품질 개선
US20050004793A1 (en) * 2003-07-03 2005-01-06 Pasi Ojala Signal adaptation for higher band coding in a codec utilizing band split coding
US7461003B1 (en) * 2003-10-22 2008-12-02 Tellabs Operations, Inc. Methods and apparatus for improving the quality of speech signals
US7672838B1 (en) * 2003-12-01 2010-03-02 The Trustees Of Columbia University In The City Of New York Systems and methods for speech recognition using frequency domain linear prediction polynomials to form temporal and spectral envelopes from frequency domain representations of signals
US6980933B2 (en) * 2004-01-27 2005-12-27 Dolby Laboratories Licensing Corporation Coding techniques using estimated spectral magnitude and phase derived from MDCT coefficients
US7805313B2 (en) * 2004-03-04 2010-09-28 Agere Systems Inc. Frequency-based coding of channels in parametric multi-channel coding systems
DE102004021403A1 (de) * 2004-04-30 2005-11-24 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Informationssignalverarbeitung durch Modifikation in der Spektral-/Modulationsspektralbereichsdarstellung
BRPI0510014B1 (pt) * 2004-05-14 2019-03-26 Panasonic Intellectual Property Corporation Of America Dispositivo de codificação, dispositivo de decodificação e método do mesmo
US7512536B2 (en) * 2004-05-14 2009-03-31 Texas Instruments Incorporated Efficient filter bank computation for audio coding
US20070165892A1 (en) * 2004-06-28 2007-07-19 Koninklijke Philips Electronics, N.V. Wireless audio
US7921007B2 (en) * 2004-08-17 2011-04-05 Koninklijke Philips Electronics N.V. Scalable audio coding
TWI393121B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 處理一組n個聲音信號之方法與裝置及與其相關聯之電腦程式
TWI393120B (zh) * 2004-08-25 2013-04-11 Dolby Lab Licensing Corp 用於音訊信號編碼及解碼之方法和系統、音訊信號編碼器、音訊信號解碼器、攜帶有位元流之電腦可讀取媒體、及儲存於電腦可讀取媒體上的電腦程式
US7830900B2 (en) 2004-08-30 2010-11-09 Qualcomm Incorporated Method and apparatus for an adaptive de-jitter buffer
US8085678B2 (en) 2004-10-13 2011-12-27 Qualcomm Incorporated Media (voice) playback (de-jitter) buffer adjustments based on air interface
US7720230B2 (en) * 2004-10-20 2010-05-18 Agere Systems, Inc. Individual channel shaping for BCC schemes and the like
US8204261B2 (en) * 2004-10-20 2012-06-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Diffuse sound shaping for BCC schemes and the like
WO2006060279A1 (en) 2004-11-30 2006-06-08 Agere Systems Inc. Parametric coding of spatial audio with object-based side information
WO2006060278A1 (en) * 2004-11-30 2006-06-08 Agere Systems Inc. Synchronizing parametric coding of spatial audio with externally provided downmix
US7787631B2 (en) * 2004-11-30 2010-08-31 Agere Systems Inc. Parametric coding of spatial audio with cues based on transmitted channels
US7903824B2 (en) * 2005-01-10 2011-03-08 Agere Systems Inc. Compact side information for parametric coding of spatial audio
JP4761506B2 (ja) * 2005-03-01 2011-08-31 国立大学法人北陸先端科学技術大学院大学 音声処理方法と装置及びプログラム並びに音声システム
US8155965B2 (en) 2005-03-11 2012-04-10 Qualcomm Incorporated Time warping frames inside the vocoder by modifying the residual
US8355907B2 (en) * 2005-03-11 2013-01-15 Qualcomm Incorporated Method and apparatus for phase matching frames in vocoders
EP1829424B1 (en) * 2005-04-15 2009-01-21 Dolby Sweden AB Temporal envelope shaping of decorrelated signals
US8311840B2 (en) * 2005-06-28 2012-11-13 Qnx Software Systems Limited Frequency extension of harmonic signals
JP4554451B2 (ja) * 2005-06-29 2010-09-29 京セラ株式会社 通信装置、通信システム、変調方法、及びプログラム
DE102005032724B4 (de) 2005-07-13 2009-10-08 Siemens Ag Verfahren und Vorrichtung zur künstlichen Erweiterung der Bandbreite von Sprachsignalen
FR2891100B1 (fr) * 2005-09-22 2008-10-10 Georges Samake Codec audio utilisant la transformation de fourier rapide, le recouvrement partiel et une decomposition en deux plans basee sur l'energie.
KR100717058B1 (ko) * 2005-11-28 2007-05-14 삼성전자주식회사 고주파 성분 복원 방법 및 그 장치
JP5034228B2 (ja) * 2005-11-30 2012-09-26 株式会社Jvcケンウッド 補間装置、音再生装置、補間方法および補間プログラム
US8126706B2 (en) * 2005-12-09 2012-02-28 Acoustic Technologies, Inc. Music detector for echo cancellation and noise reduction
JP5457171B2 (ja) * 2006-03-20 2014-04-02 オランジュ オーディオデコーダ内で信号を後処理する方法
US20080076374A1 (en) * 2006-09-25 2008-03-27 Avraham Grenader System and method for filtering of angle modulated signals
US8625808B2 (en) 2006-09-29 2014-01-07 Lg Elecronics Inc. Methods and apparatuses for encoding and decoding object-based audio signals
US8295507B2 (en) * 2006-11-09 2012-10-23 Sony Corporation Frequency band extending apparatus, frequency band extending method, player apparatus, playing method, program and recording medium
KR101434198B1 (ko) * 2006-11-17 2014-08-26 삼성전자주식회사 신호 복호화 방법
JP4967618B2 (ja) * 2006-11-24 2012-07-04 富士通株式会社 復号化装置および復号化方法
JP5103880B2 (ja) * 2006-11-24 2012-12-19 富士通株式会社 復号化装置および復号化方法
CN101237317B (zh) * 2006-11-27 2010-09-29 华为技术有限公司 确定发送频谱的方法和装置
EP1947644B1 (en) * 2007-01-18 2019-06-19 Nuance Communications, Inc. Method and apparatus for providing an acoustic signal with extended band-width
JP5220840B2 (ja) * 2007-03-30 2013-06-26 エレクトロニクス アンド テレコミュニケーションズ リサーチ インスチチュート マルチチャネルで構成されたマルチオブジェクトオーディオ信号のエンコード、並びにデコード装置および方法
CN101809657B (zh) 2007-08-27 2012-05-30 爱立信电话股份有限公司 用于噪声填充的方法和设备
PT2571024E (pt) * 2007-08-27 2014-12-23 Ericsson Telefon Ab L M Frequência de transição adaptativa entre preenchimento de ruído e extensão da largura de banda
EP2220646A1 (en) * 2007-11-06 2010-08-25 Nokia Corporation Audio coding apparatus and method thereof
WO2009059633A1 (en) * 2007-11-06 2009-05-14 Nokia Corporation An encoder
KR100970446B1 (ko) * 2007-11-21 2010-07-16 한국전자통신연구원 주파수 확장을 위한 가변 잡음레벨 결정 장치 및 그 방법
US8688441B2 (en) * 2007-11-29 2014-04-01 Motorola Mobility Llc Method and apparatus to facilitate provision and use of an energy value to determine a spectral envelope shape for out-of-signal bandwidth content
US8433582B2 (en) * 2008-02-01 2013-04-30 Motorola Mobility Llc Method and apparatus for estimating high-band energy in a bandwidth extension system
US20090201983A1 (en) * 2008-02-07 2009-08-13 Motorola, Inc. Method and apparatus for estimating high-band energy in a bandwidth extension system
KR20090110244A (ko) * 2008-04-17 2009-10-21 삼성전자주식회사 오디오 시맨틱 정보를 이용한 오디오 신호의 부호화/복호화 방법 및 그 장치
US8005152B2 (en) 2008-05-21 2011-08-23 Samplify Systems, Inc. Compression of baseband signals in base transceiver systems
USRE47180E1 (en) * 2008-07-11 2018-12-25 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for generating a bandwidth extended signal
US8463412B2 (en) * 2008-08-21 2013-06-11 Motorola Mobility Llc Method and apparatus to facilitate determining signal bounding frequencies
CN101727906B (zh) * 2008-10-29 2012-02-01 华为技术有限公司 高频带信号的编解码方法及装置
CN101770775B (zh) * 2008-12-31 2011-06-22 华为技术有限公司 信号处理方法及装置
US8463599B2 (en) * 2009-02-04 2013-06-11 Motorola Mobility Llc Bandwidth extension method and apparatus for a modified discrete cosine transform audio coder
JP5387076B2 (ja) * 2009-03-17 2014-01-15 ヤマハ株式会社 音処理装置およびプログラム
EP2239732A1 (en) * 2009-04-09 2010-10-13 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for generating a synthesis audio signal and for encoding an audio signal
RU2452044C1 (ru) 2009-04-02 2012-05-27 Фраунхофер-Гезелльшафт цур Фёрдерунг дер ангевандтен Форшунг Е.Ф. Устройство, способ и носитель с программным кодом для генерирования представления сигнала с расширенным диапазоном частот на основе представления входного сигнала с использованием сочетания гармонического расширения диапазона частот и негармонического расширения диапазона частот
JP4932917B2 (ja) * 2009-04-03 2012-05-16 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
AU2012204068B2 (en) * 2009-04-03 2013-12-19 Ntt Docomo, Inc. Speech encoding device, speech decoding device, speech encoding method, speech decoding method, speech encoding program, and speech decoding program
JP4921611B2 (ja) * 2009-04-03 2012-04-25 株式会社エヌ・ティ・ティ・ドコモ 音声復号装置、音声復号方法、及び音声復号プログラム
US11657788B2 (en) 2009-05-27 2023-05-23 Dolby International Ab Efficient combined harmonic transposition
TWI401923B (zh) * 2009-06-06 2013-07-11 Generalplus Technology Inc 適應性時脈重建方法與裝置以及進行音頻解碼方法
JP5754899B2 (ja) 2009-10-07 2015-07-29 ソニー株式会社 復号装置および方法、並びにプログラム
CN102576541B (zh) 2009-10-21 2013-09-18 杜比国际公司 组合换位滤波器组的过采样
US8699727B2 (en) 2010-01-15 2014-04-15 Apple Inc. Visually-assisted mixing of audio using a spectral analyzer
BR122019025131B1 (pt) * 2010-01-19 2021-01-19 Dolby International Ab sistema e método para gerar um sinal transposto de frequência e/ou estendido no tempo a partir de um sinal de áudio de entrada e meio de armazenamento
TWI443646B (zh) 2010-02-18 2014-07-01 Dolby Lab Licensing Corp 音訊解碼器及使用有效降混之解碼方法
EP2362375A1 (en) 2010-02-26 2011-08-31 Fraunhofer-Gesellschaft zur Förderung der Angewandten Forschung e.V. Apparatus and method for modifying an audio signal using harmonic locking
WO2011110499A1 (en) 2010-03-09 2011-09-15 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for processing an audio signal using patch border alignment
CN102985970B (zh) 2010-03-09 2014-11-05 弗兰霍菲尔运输应用研究公司 在用于音频信号的基于相角声码器的带宽扩展中改善的幅值响应和时间对准
AU2011226208B2 (en) 2010-03-09 2013-12-19 Fraunhofer-Gesellschaft Zur Foerderung Der Angewandten Forschung E.V. Apparatus and method for handling transient sound events in audio signals when changing the replay speed or pitch
JP5651980B2 (ja) * 2010-03-31 2015-01-14 ソニー株式会社 復号装置、復号方法、およびプログラム
JP5652658B2 (ja) * 2010-04-13 2015-01-14 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
JP6103324B2 (ja) * 2010-04-13 2017-03-29 ソニー株式会社 信号処理装置および方法、並びにプログラム
JP5609737B2 (ja) * 2010-04-13 2014-10-22 ソニー株式会社 信号処理装置および方法、符号化装置および方法、復号装置および方法、並びにプログラム
US8793126B2 (en) * 2010-04-14 2014-07-29 Huawei Technologies Co., Ltd. Time/frequency two dimension post-processing
US9443534B2 (en) * 2010-04-14 2016-09-13 Huawei Technologies Co., Ltd. Bandwidth extension system and approach
JP5554876B2 (ja) * 2010-04-16 2014-07-23 フラウンホーファーゲゼルシャフト ツール フォルデルング デル アンゲヴァンテン フォルシユング エー.フアー. ガイドされた帯域幅拡張およびブラインド帯域幅拡張を用いて広帯域信号を生成するため装置、方法およびコンピュータプログラム
TW201138354A (en) * 2010-04-27 2011-11-01 Ind Tech Res Inst Soft demapping method and apparatus thereof and communication system thereof
JP5243620B2 (ja) * 2010-06-09 2013-07-24 パナソニック株式会社 帯域拡張方法、帯域拡張装置、プログラム、集積回路およびオーディオ復号装置
EP2596497B1 (en) 2010-07-19 2014-05-28 Dolby International AB Processing of audio signals during high frequency reconstruction
JP6075743B2 (ja) 2010-08-03 2017-02-08 ソニー株式会社 信号処理装置および方法、並びにプログラム
US8762158B2 (en) * 2010-08-06 2014-06-24 Samsung Electronics Co., Ltd. Decoding method and decoding apparatus therefor
US8759661B2 (en) 2010-08-31 2014-06-24 Sonivox, L.P. System and method for audio synthesizer utilizing frequency aperture arrays
US8649388B2 (en) 2010-09-02 2014-02-11 Integrated Device Technology, Inc. Transmission of multiprotocol data in a distributed antenna system
JP5707842B2 (ja) 2010-10-15 2015-04-30 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
US9059778B2 (en) * 2011-01-07 2015-06-16 Integrated Device Technology Inc. Frequency domain compression in a base transceiver system
US8989088B2 (en) * 2011-01-07 2015-03-24 Integrated Device Technology Inc. OFDM signal processing in a base transceiver system
EP2663978A4 (en) * 2011-01-12 2016-04-06 Nokia Technologies Oy AUDIO CODING AND DECODING DEVICE
US8653354B1 (en) * 2011-08-02 2014-02-18 Sonivoz, L.P. Audio synthesizing systems and methods
JP5942358B2 (ja) 2011-08-24 2016-06-29 ソニー株式会社 符号化装置および方法、復号装置および方法、並びにプログラム
EP2631906A1 (en) 2012-02-27 2013-08-28 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Phase coherence control for harmonic signals in perceptual audio codecs
CN103368682B (zh) 2012-03-29 2016-12-07 华为技术有限公司 信号编码和解码的方法和设备
JP5997592B2 (ja) * 2012-04-27 2016-09-28 株式会社Nttドコモ 音声復号装置
US9215296B1 (en) 2012-05-03 2015-12-15 Integrated Device Technology, Inc. Method and apparatus for efficient radio unit processing in a communication system
US9313453B2 (en) * 2012-08-20 2016-04-12 Mitel Networks Corporation Localization algorithm for conferencing
WO2014034697A1 (ja) * 2012-08-29 2014-03-06 日本電信電話株式会社 復号方法、復号装置、プログラム、及びその記録媒体
US9135920B2 (en) * 2012-11-26 2015-09-15 Harman International Industries, Incorporated System for perceived enhancement and restoration of compressed audio signals
CN103971693B (zh) 2013-01-29 2017-02-22 华为技术有限公司 高频带信号的预测方法、编/解码设备
US9786286B2 (en) * 2013-03-29 2017-10-10 Dolby Laboratories Licensing Corporation Methods and apparatuses for generating and using low-resolution preview tracks with high-quality encoded object and multichannel audio signals
US8804971B1 (en) 2013-04-30 2014-08-12 Dolby International Ab Hybrid encoding of higher frequency and downmixed low frequency content of multichannel audio
MY170179A (en) 2013-06-10 2019-07-09 Fraunhofer Ges Forschung Apparatus and method for audio signal envelope encoding, processing and decoding by splitting the audio signal envelope employing distribution quantization and coding
WO2014198726A1 (en) 2013-06-10 2014-12-18 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for audio signal envelope encoding, processing and decoding by modelling a cumulative sum representation employing distribution quantization and coding
MX351363B (es) 2013-06-21 2017-10-11 Fraunhofer Ges Forschung Aparato y metodo para generar una forma espectral adaptativa de ruido de confort.
US9454970B2 (en) * 2013-07-03 2016-09-27 Bose Corporation Processing multichannel audio signals
EP2830061A1 (en) 2013-07-22 2015-01-28 Fraunhofer Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an encoded audio signal using temporal noise/patch shaping
WO2015025052A1 (en) 2013-08-23 2015-02-26 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for processing an audio signal using an aliasing error signal
US9203933B1 (en) 2013-08-28 2015-12-01 Integrated Device Technology, Inc. Method and apparatus for efficient data compression in a communication system
US9875746B2 (en) 2013-09-19 2018-01-23 Sony Corporation Encoding device and method, decoding device and method, and program
US9553954B1 (en) 2013-10-01 2017-01-24 Integrated Device Technology, Inc. Method and apparatus utilizing packet segment compression parameters for compression in a communication system
US9485688B1 (en) 2013-10-09 2016-11-01 Integrated Device Technology, Inc. Method and apparatus for controlling error and identifying bursts in a data compression system
US9398489B1 (en) 2013-10-09 2016-07-19 Integrated Device Technology Method and apparatus for context based data compression in a communication system
US8989257B1 (en) 2013-10-09 2015-03-24 Integrated Device Technology Inc. Method and apparatus for providing near-zero jitter real-time compression in a communication system
US9313300B2 (en) 2013-11-07 2016-04-12 Integrated Device Technology, Inc. Methods and apparatuses for a unified compression framework of baseband signals
JP6345780B2 (ja) * 2013-11-22 2018-06-20 クゥアルコム・インコーポレイテッドQualcomm Incorporated ハイバンドコーディングにおける選択的位相補償
CA2934602C (en) 2013-12-27 2022-08-30 Sony Corporation Decoding apparatus and method, and program
US20150194157A1 (en) * 2014-01-06 2015-07-09 Nvidia Corporation System, method, and computer program product for artifact reduction in high-frequency regeneration audio signals
FR3017484A1 (fr) * 2014-02-07 2015-08-14 Orange Extension amelioree de bande de frequence dans un decodeur de signaux audiofrequences
US9542955B2 (en) 2014-03-31 2017-01-10 Qualcomm Incorporated High-band signal coding using multiple sub-bands
US10115410B2 (en) * 2014-06-10 2018-10-30 Peter Graham Craven Digital encapsulation of audio signals
MY182777A (en) * 2014-10-31 2021-02-05 Ericsson Telefon Ab L M Radio receiver, method of detecting an obtruding signal in the radio receiver, and computer program
WO2016091994A1 (en) * 2014-12-11 2016-06-16 Ubercord Gmbh Method and installation for processing a sequence of signals for polyphonic note recognition
JP6763194B2 (ja) * 2016-05-10 2020-09-30 株式会社Jvcケンウッド 符号化装置、復号装置、通信システム
KR20180056032A (ko) 2016-11-18 2018-05-28 삼성전자주식회사 신호 처리 프로세서 및 신호 처리 프로세서의 제어 방법
US11176958B2 (en) * 2017-04-28 2021-11-16 Hewlett-Packard Development Company, L.P. Loudness enhancement based on multiband range compression
KR102468799B1 (ko) 2017-08-11 2022-11-18 삼성전자 주식회사 전자장치, 그 제어방법 및 그 컴퓨터프로그램제품
CN107545900B (zh) * 2017-08-16 2020-12-01 广州广晟数码技术有限公司 带宽扩展编码和解码中高频弦信号生成的方法和装置
JP7123134B2 (ja) 2017-10-27 2022-08-22 フラウンホファー ゲセルシャフト ツール フェールデルンク ダー アンゲヴァンテン フォルシュンク エー.ファオ. デコーダにおけるノイズ減衰
WO2019091576A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio encoders, audio decoders, methods and computer programs adapting an encoding and decoding of least significant bits
WO2019091573A1 (en) 2017-11-10 2019-05-16 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Apparatus and method for encoding and decoding an audio signal using downsampling or interpolation of scale parameters
EP3483883A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio coding and decoding with selective postfiltering
EP3483879A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Analysis/synthesis windowing function for modulated lapped transformation
EP3483882A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Controlling bandwidth in encoders and/or decoders
EP3483884A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Signal filtering
EP3483886A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Selecting pitch lag
EP3483880A1 (en) * 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Temporal noise shaping
EP3483878A1 (en) 2017-11-10 2019-05-15 Fraunhofer-Gesellschaft zur Förderung der angewandten Forschung e.V. Audio decoder supporting a set of different loss concealment tools
US10714098B2 (en) 2017-12-21 2020-07-14 Dolby Laboratories Licensing Corporation Selective forward error correction for spatial audio codecs
TWI702594B (zh) * 2018-01-26 2020-08-21 瑞典商都比國際公司 用於音訊信號之高頻重建技術之回溯相容整合
US11417348B2 (en) * 2018-04-05 2022-08-16 Telefonaktiebolaget Lm Erisson (Publ) Truncateable predictive coding
CN115318605B (zh) * 2022-07-22 2023-09-08 东北大学 变频超声换能器自动匹配方法

Family Cites Families (87)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US3995115A (en) * 1967-08-25 1976-11-30 Bell Telephone Laboratories, Incorporated Speech privacy system
US3684838A (en) * 1968-06-26 1972-08-15 Kahn Res Lab Single channel audio signal transmission system
US4051331A (en) * 1976-03-29 1977-09-27 Brigham Young University Speech coding hearing aid system utilizing formant frequency transformation
US4232194A (en) * 1979-03-16 1980-11-04 Ocean Technology, Inc. Voice encryption system
NL7908213A (nl) * 1979-11-09 1981-06-01 Philips Nv Spraaksynthese inrichting met tenminste twee vervormingsketens.
US4419544A (en) * 1982-04-26 1983-12-06 Adelman Roger A Signal processing apparatus
JPS6011360B2 (ja) * 1981-12-15 1985-03-25 ケイディディ株式会社 音声符号化方式
US4667340A (en) * 1983-04-13 1987-05-19 Texas Instruments Incorporated Voice messaging system with pitch-congruent baseband coding
US4866777A (en) * 1984-11-09 1989-09-12 Alcatel Usa Corporation Apparatus for extracting features from a speech signal
US4790016A (en) * 1985-11-14 1988-12-06 Gte Laboratories Incorporated Adaptive method and apparatus for coding speech
WO1986003873A1 (en) * 1984-12-20 1986-07-03 Gte Laboratories Incorporated Method and apparatus for encoding speech
US4885790A (en) * 1985-03-18 1989-12-05 Massachusetts Institute Of Technology Processing of acoustic waveforms
US4935963A (en) * 1986-01-24 1990-06-19 Racal Data Communications Inc. Method and apparatus for processing speech signals
JPS62234435A (ja) * 1986-04-04 1987-10-14 Kokusai Denshin Denwa Co Ltd <Kdd> 符号化音声の復号化方式
DE3683767D1 (de) * 1986-04-30 1992-03-12 Ibm Sprachkodierungsverfahren und einrichtung zur ausfuehrung dieses verfahrens.
US4776014A (en) * 1986-09-02 1988-10-04 General Electric Company Method for pitch-aligned high-frequency regeneration in RELP vocoders
US5054072A (en) * 1987-04-02 1991-10-01 Massachusetts Institute Of Technology Coding of acoustic waveforms
DE3785189T2 (de) * 1987-04-22 1993-10-07 Ibm Verfahren und Einrichtung zur Veränderung von Sprachgeschwindigkeit.
US5127054A (en) * 1988-04-29 1992-06-30 Motorola, Inc. Speech quality improvement for voice coders and synthesizers
US4964166A (en) * 1988-05-26 1990-10-16 Pacific Communication Science, Inc. Adaptive transform coder having minimal bit allocation processing
US5109417A (en) * 1989-01-27 1992-04-28 Dolby Laboratories Licensing Corporation Low bit rate transform coder, decoder, and encoder/decoder for high-quality audio
US5054075A (en) * 1989-09-05 1991-10-01 Motorola, Inc. Subband decoding method and apparatus
CN1062963C (zh) * 1990-04-12 2001-03-07 多尔拜实验特许公司 用于产生高质量声音信号的解码器和编码器
SG49883A1 (en) * 1991-01-08 1998-06-15 Dolby Lab Licensing Corp Encoder/decoder for multidimensional sound fields
US5327457A (en) * 1991-09-13 1994-07-05 Motorola, Inc. Operation indicative background noise in a digital receiver
JP2693893B2 (ja) * 1992-03-30 1997-12-24 松下電器産業株式会社 ステレオ音声符号化方法
US5455888A (en) * 1992-12-04 1995-10-03 Northern Telecom Limited Speech bandwidth extension method and apparatus
ATE211326T1 (de) * 1993-05-31 2002-01-15 Sony Corp Verfahren und vorrichtung zum kodieren oder dekodieren von signalen und aufzeichnungsmedium
US5623577A (en) * 1993-07-16 1997-04-22 Dolby Laboratories Licensing Corporation Computationally efficient adaptive bit allocation for encoding method and apparatus with allowance for decoder spectral distortions
WO1995010886A1 (fr) * 1993-10-08 1995-04-20 Sony Corporation Processeur de signaux numeriques, procede de traitement de signaux numeriques et support d'enregistrement de donnees
JPH07160299A (ja) * 1993-12-06 1995-06-23 Hitachi Denshi Ltd 音声信号帯域圧縮伸張装置並びに音声信号の帯域圧縮伝送方式及び再生方式
US5619503A (en) * 1994-01-11 1997-04-08 Ericsson Inc. Cellular/satellite communications system with improved frequency re-use
US6173062B1 (en) * 1994-03-16 2001-01-09 Hearing Innovations Incorporated Frequency transpositional hearing aid with digital and single sideband modulation
US6169813B1 (en) * 1994-03-16 2001-01-02 Hearing Innovations Incorporated Frequency transpositional hearing aid with single sideband modulation
EP0775409A4 (en) * 1994-08-12 2000-03-22 Neosoft Ag NON-LINEAR DIGITAL TELECOMMUNICATION SYSTEM
US5587998A (en) * 1995-03-03 1996-12-24 At&T Method and apparatus for reducing residual far-end echo in voice communication networks
DE69619284T3 (de) * 1995-03-13 2006-04-27 Matsushita Electric Industrial Co., Ltd., Kadoma Vorrichtung zur Erweiterung der Sprachbandbreite
DE19509149A1 (de) 1995-03-14 1996-09-19 Donald Dipl Ing Schulz Codierverfahren
JPH08328599A (ja) 1995-06-01 1996-12-13 Mitsubishi Electric Corp Mpegオーディオ復号器
JPH09101799A (ja) * 1995-10-04 1997-04-15 Sony Corp 信号符号化方法及び装置
US5956674A (en) * 1995-12-01 1999-09-21 Digital Theater Systems, Inc. Multi-channel predictive subband audio coder using psychoacoustic adaptive bit allocation in frequency, time and over the multiple channels
JP3092653B2 (ja) * 1996-06-21 2000-09-25 日本電気株式会社 広帯域音声符号化装置及び音声復号装置並びに音声符号化復号装置
DE19628293C1 (de) * 1996-07-12 1997-12-11 Fraunhofer Ges Forschung Codieren und Decodieren von Audiosignalen unter Verwendung von Intensity-Stereo und Prädiktion
US5744739A (en) * 1996-09-13 1998-04-28 Crystal Semiconductor Wavetable synthesizer and operating method using a variable sampling rate approximation
US6098038A (en) * 1996-09-27 2000-08-01 Oregon Graduate Institute Of Science & Technology Method and system for adaptive speech enhancement using frequency specific signal-to-noise ratio estimates
GB2318029B (en) * 1996-10-01 2000-11-08 Nokia Mobile Phones Ltd Audio coding method and apparatus
JPH10124088A (ja) * 1996-10-24 1998-05-15 Sony Corp 音声帯域幅拡張装置及び方法
TW326070B (en) * 1996-12-19 1998-02-01 Holtek Microelectronics Inc The estimation method of the impulse gain for coding vocoder
US6167375A (en) * 1997-03-17 2000-12-26 Kabushiki Kaisha Toshiba Method for encoding and decoding a speech signal including background noise
US6336092B1 (en) * 1997-04-28 2002-01-01 Ivl Technologies Ltd Targeted vocal transformation
EP0878790A1 (en) * 1997-05-15 1998-11-18 Hewlett-Packard Company Voice coding system and method
JPH10341256A (ja) * 1997-06-10 1998-12-22 Logic Corp 音声から有音を抽出し、抽出有音から音声を再生する方法および装置
SE512719C2 (sv) * 1997-06-10 2000-05-02 Lars Gustaf Liljeryd En metod och anordning för reduktion av dataflöde baserad på harmonisk bandbreddsexpansion
US6035048A (en) * 1997-06-18 2000-03-07 Lucent Technologies Inc. Method and apparatus for reducing noise in speech and audio signals
DE19730130C2 (de) * 1997-07-14 2002-02-28 Fraunhofer Ges Forschung Verfahren zum Codieren eines Audiosignals
US5899969A (en) 1997-10-17 1999-05-04 Dolby Laboratories Licensing Corporation Frame-based audio coding with gain-control words
US6019607A (en) * 1997-12-17 2000-02-01 Jenkins; William M. Method and apparatus for training of sensory and perceptual systems in LLI systems
US6159014A (en) * 1997-12-17 2000-12-12 Scientific Learning Corp. Method and apparatus for training of cognitive and memory systems in humans
JP3473828B2 (ja) 1998-06-26 2003-12-08 株式会社東芝 オーディオ用光ディスク及び情報再生方法及び再生装置
SE9903553D0 (sv) * 1999-01-27 1999-10-01 Lars Liljeryd Enhancing percepptual performance of SBR and related coding methods by adaptive noise addition (ANA) and noise substitution limiting (NSL)
WO2000070769A1 (fr) * 1999-05-14 2000-11-23 Matsushita Electric Industrial Co., Ltd. Procede et appareil d'elargissement de la bande d'un signal audio
US6226616B1 (en) * 1999-06-21 2001-05-01 Digital Theater Systems, Inc. Sound quality of established low bit-rate audio coding systems without loss of decoder compatibility
GB2351889B (en) * 1999-07-06 2003-12-17 Ericsson Telefon Ab L M Speech band expansion
US6978236B1 (en) * 1999-10-01 2005-12-20 Coding Technologies Ab Efficient spectral envelope coding using variable time/frequency resolution and time/frequency switching
AUPQ366799A0 (en) * 1999-10-26 1999-11-18 University Of Melbourne, The Emphasis of short-duration transient speech features
US6704711B2 (en) * 2000-01-28 2004-03-09 Telefonaktiebolaget Lm Ericsson (Publ) System and method for modifying speech signals
US7058572B1 (en) * 2000-01-28 2006-06-06 Nortel Networks Limited Reducing acoustic noise in wireless and landline based telephony
US7742927B2 (en) * 2000-04-18 2010-06-22 France Telecom Spectral enhancing method and device
FR2807897B1 (fr) * 2000-04-18 2003-07-18 France Telecom Methode et dispositif d'enrichissement spectral
EP1158799A1 (en) 2000-05-18 2001-11-28 Deutsche Thomson-Brandt Gmbh Method and receiver for providing subtitle data in several languages on demand
EP1158800A1 (en) 2000-05-18 2001-11-28 Deutsche Thomson-Brandt Gmbh Method and receiver for providing audio translation data on demand
US7330814B2 (en) * 2000-05-22 2008-02-12 Texas Instruments Incorporated Wideband speech coding with modulated noise highband excitation system and method
SE0001926D0 (sv) * 2000-05-23 2000-05-23 Lars Liljeryd Improved spectral translation/folding in the subband domain
WO2001093251A1 (en) * 2000-05-26 2001-12-06 Koninklijke Philips Electronics N.V. Transmitter for transmitting a signal encoded in a narrow band, and receiver for extending the band of the signal at the receiving end
US20020016698A1 (en) * 2000-06-26 2002-02-07 Toshimichi Tokuda Device and method for audio frequency range expansion
SE0004163D0 (sv) * 2000-11-14 2000-11-14 Coding Technologies Sweden Ab Enhancing perceptual performance of high frequency reconstruction coding methods by adaptive filtering
SE0004187D0 (sv) * 2000-11-15 2000-11-15 Coding Technologies Sweden Ab Enhancing the performance of coding systems that use high frequency reconstruction methods
US7236929B2 (en) * 2001-05-09 2007-06-26 Plantronics, Inc. Echo suppression and speech detection techniques for telephony applications
US6941263B2 (en) * 2001-06-29 2005-09-06 Microsoft Corporation Frequency domain postfiltering for quality enhancement of coded speech
US20050004803A1 (en) * 2001-11-23 2005-01-06 Jo Smeets Audio signal bandwidth extension
US20030187663A1 (en) * 2002-03-28 2003-10-02 Truman Michael Mead Broadband frequency translation for high frequency regeneration
US7502743B2 (en) * 2002-09-04 2009-03-10 Microsoft Corporation Multi-channel audio encoding and decoding with multi-channel transform selection
US7024358B2 (en) * 2003-03-15 2006-04-04 Mindspeed Technologies, Inc. Recovering an erased voice frame with time warping
EP1638083B1 (en) * 2004-09-17 2009-04-22 Harman Becker Automotive Systems GmbH Bandwidth extension of bandlimited audio signals
US8086451B2 (en) * 2005-04-20 2011-12-27 Qnx Software Systems Co. System for improving speech intelligibility through high frequency compression
US7831434B2 (en) * 2006-01-20 2010-11-09 Microsoft Corporation Complex-transform channel coding with extended-band frequency coding
US8015368B2 (en) * 2007-04-20 2011-09-06 Siport, Inc. Processor extensions for accelerating spectral band replication

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102449692A (zh) * 2009-05-27 2012-05-09 杜比国际公司 高效组合谐波转置
CN102449692B (zh) * 2009-05-27 2014-05-07 杜比国际公司 高效组合谐波转置
CN102834864A (zh) * 2010-04-13 2012-12-19 索尼公司 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法、以及程序
CN102834864B (zh) * 2010-04-13 2014-06-25 索尼公司 信号处理装置和信号处理方法、编码器和编码方法、解码器和解码方法
CN102237954A (zh) * 2010-04-30 2011-11-09 财团法人工业技术研究院 软性解映射方法及其装置与其通讯系统
CN104916290A (zh) * 2011-02-18 2015-09-16 株式会社Ntt都科摩 语音解码装置、语音编码装置、语音解码方法以及语音编码方法
CN103370742A (zh) * 2011-02-18 2013-10-23 株式会社Ntt都科摩 语音解码装置、语音编码装置、语音解码方法、语音编码方法、语音解码程序以及语音编码程序
CN103370742B (zh) * 2011-02-18 2015-06-03 株式会社Ntt都科摩 语音解码装置、语音编码装置、语音解码方法以及语音编码方法
CN104221081A (zh) * 2011-11-02 2014-12-17 瑞典爱立信有限公司 带宽扩展音频信号的高频带扩展的生成
CN104221081B (zh) * 2011-11-02 2017-03-15 瑞典爱立信有限公司 带宽扩展音频信号的高频带扩展的生成
CN106663437A (zh) * 2014-05-01 2017-05-10 日本电信电话株式会社 编码装置、解码装置、编码方法、解码方法、编码程序、解码程序、记录介质
CN109036457A (zh) * 2018-09-10 2018-12-18 广州酷狗计算机科技有限公司 恢复音频信号的方法和装置
US11315582B2 (en) 2018-09-10 2022-04-26 Guangzhou Kugou Computer Technology Co., Ltd. Method for recovering audio signals, terminal and storage medium

Also Published As

Publication number Publication date
US10269362B2 (en) 2019-04-23
US20170206909A1 (en) 2017-07-20
US9412388B1 (en) 2016-08-09
US20140161283A1 (en) 2014-06-12
US20170148454A1 (en) 2017-05-25
CN100338649C (zh) 2007-09-19
CA2475460C (en) 2012-02-28
EP1488414A1 (en) 2004-12-22
US20180005639A1 (en) 2018-01-04
SG153658A1 (en) 2009-07-29
HK1078673A1 (en) 2006-03-17
SG10201710912WA (en) 2018-02-27
MY140567A (en) 2009-12-31
TWI319180B (en) 2010-01-01
US20200143817A1 (en) 2020-05-07
US9947328B2 (en) 2018-04-17
SG10201710917UA (en) 2018-02-27
US9466306B1 (en) 2016-10-11
US20190172472A1 (en) 2019-06-06
US9412383B1 (en) 2016-08-09
US20160232904A1 (en) 2016-08-11
CN1639770A (zh) 2005-07-13
SG10201710913TA (en) 2018-02-27
US9653085B2 (en) 2017-05-16
AU2003239126B2 (en) 2009-06-04
JP4345890B2 (ja) 2009-10-14
PL208846B1 (pl) 2011-06-30
SG173224A1 (en) 2011-08-29
US20090192806A1 (en) 2009-07-30
US20160314796A1 (en) 2016-10-27
JP2005521907A (ja) 2005-07-21
MXPA04009408A (es) 2005-01-25
US20120328121A1 (en) 2012-12-27
HK1114233A1 (en) 2008-10-24
US9767816B2 (en) 2017-09-19
KR20040101227A (ko) 2004-12-02
US20160232911A1 (en) 2016-08-11
US20150243295A1 (en) 2015-08-27
US20150279379A1 (en) 2015-10-01
US9343071B2 (en) 2016-05-17
US8285543B2 (en) 2012-10-09
CA2475460A1 (en) 2003-10-09
TW200305855A (en) 2003-11-01
US9548060B1 (en) 2017-01-17
CN101093670B (zh) 2010-06-02
US9177564B2 (en) 2015-11-03
SG10201710915PA (en) 2018-02-27
US9324328B2 (en) 2016-04-26
US20160379655A1 (en) 2016-12-29
KR101005731B1 (ko) 2011-01-06
EP2194528B1 (en) 2011-05-25
US20170084281A1 (en) 2017-03-23
US20030187663A1 (en) 2003-10-02
SG10201710911VA (en) 2018-02-27
SG2013057666A (en) 2015-12-30
US8126709B2 (en) 2012-02-28
PL371410A1 (en) 2005-06-13
US20120128177A1 (en) 2012-05-24
US20180204581A1 (en) 2018-07-19
US8457956B2 (en) 2013-06-04
EP2194528A1 (en) 2010-06-09
AU2003239126A1 (en) 2003-10-13
WO2003083834A1 (en) 2003-10-09
SI2194528T1 (sl) 2012-03-30
US9704496B2 (en) 2017-07-11
US9412389B1 (en) 2016-08-09
US10529347B2 (en) 2020-01-07
ATE511180T1 (de) 2011-06-15
US20160232905A1 (en) 2016-08-11

Similar Documents

Publication Publication Date Title
CN101093670B (zh) 用于产生重建信号的方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1114233

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1114233

Country of ref document: HK

EE01 Entry into force of recordation of patent licensing contract

Assignee: GUANGZHOU PANYU JUDA CAR AUDIO EQUIPMENT Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.

Contract record no.: 2010990000986

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20101216

EE01 Entry into force of recordation of patent licensing contract

Assignee: ZHEJIANG BELSON TECHNOLOGY Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.

Contract record no.: 2011990000044

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20110117

EE01 Entry into force of recordation of patent licensing contract

Assignee: GUANGZHOU PANYU JUDA CAR AUDIO EQUIPMENT Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.

Contract record no.: 2011990000899

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20110915

EE01 Entry into force of recordation of patent licensing contract

Assignee: DESAY A & V SCIENCE AND TECHNOLOGY Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.

Contract record no.: 2011990000968

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20111012

EE01 Entry into force of recordation of patent licensing contract

Assignee: GUANGDONG OPPO MOBILE TELECOMMUNICATIONS Corp.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.

Contract record no.: 2012990000215

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20120411

EE01 Entry into force of recordation of patent licensing contract

Assignee: QING DAO HAIER ELECTRONIC Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.|DOLBY INTERNATIONAL AB

Contract record no.: 2012990000481

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Open date: 20071226

Record date: 20120706

EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20071226

Assignee: Lenovo Mobile Communication Technology Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.|DOLBY INTERNATIONAL AB

Contract record no.: 2012990000858

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Record date: 20121129

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20071226

Assignee: Lenovo (Beijing) Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.|DOLBY INTERNATIONAL AB

Contract record no.: 2013990000005

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Record date: 20130106

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
EE01 Entry into force of recordation of patent licensing contract

Application publication date: 20071226

Assignee: Beijing millet Communication Technology Co.,Ltd.

Assignor: DOLBY LABORATORIES LICENSING Corp.|DOLBY INTERNATIONAL AB

Contract record no.: 2013990000048

Denomination of invention: Method for producing rebuilding signal

Granted publication date: 20100602

License type: Common License

Record date: 20130206

LICC Enforcement, change and cancellation of record of contracts on the licence for exploitation of a patent or utility model
CX01 Expiry of patent term
CX01 Expiry of patent term

Granted publication date: 20100602