CN101523921A - 帧内预测编码控制方法和装置、其程序和记录程序的记录介质 - Google Patents

帧内预测编码控制方法和装置、其程序和记录程序的记录介质 Download PDF

Info

Publication number
CN101523921A
CN101523921A CNA2007800367625A CN200780036762A CN101523921A CN 101523921 A CN101523921 A CN 101523921A CN A2007800367625 A CNA2007800367625 A CN A2007800367625A CN 200780036762 A CN200780036762 A CN 200780036762A CN 101523921 A CN101523921 A CN 101523921A
Authority
CN
China
Prior art keywords
prediction block
block sizes
coded object
decision
coding
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2007800367625A
Other languages
English (en)
Other versions
CN101523921B (zh
Inventor
清水淳
谷田隆一
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Nippon Telegraph and Telephone Corp
Original Assignee
Nippon Telegraph and Telephone Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Nippon Telegraph and Telephone Corp filed Critical Nippon Telegraph and Telephone Corp
Publication of CN101523921A publication Critical patent/CN101523921A/zh
Application granted granted Critical
Publication of CN101523921B publication Critical patent/CN101523921B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/169Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding
    • H04N19/17Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the coding unit, i.e. the structural portion or semantic portion of the video signal being the object or the subject of the adaptive coding the unit being an image region, e.g. an object
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/102Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or selection affected or controlled by the adaptive coding
    • H04N19/103Selection of coding mode or of prediction mode
    • H04N19/11Selection of coding mode or of prediction mode among a plurality of spatial predictive coding modes
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/189Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding
    • H04N19/196Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the adaptation method, adaptation tool or adaptation type used for the adaptive coding being specially adapted for the computation of encoding parameters, e.g. by averaging previously computed encoding parameters
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/50Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding
    • H04N19/593Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using predictive coding involving spatial prediction techniques
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N19/00Methods or arrangements for coding, decoding, compressing or decompressing digital video signals
    • H04N19/10Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding
    • H04N19/134Methods or arrangements for coding, decoding, compressing or decompressing digital video signals using adaptive coding characterised by the element, parameter or criterion affecting or controlling the adaptive coding
    • H04N19/136Incoming video signal characteristics or properties
    • H04N19/14Coding unit complexity, e.g. amount of activity or edge presence estimation

Landscapes

  • Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Signal Processing (AREA)
  • Computing Systems (AREA)
  • Theoretical Computer Science (AREA)
  • Compression Or Coding Systems Of Tv Signals (AREA)

Abstract

本发明涉及一种帧内预测编码控制方法,在具有多个预测模式和预测块大小、在编码时能够对该多个预测模式和预测块大小进行切换的帧内预测编码中使用,该帧内预测编码控制方法具有:对表示编码对象区域的平坦度的平坦程度进行计算的步骤;对应于所述计算出的平坦程度,对编码对象区域的帧内预测编码中使用的预测块大小进行决定的步骤;以及以所述决定了的预测块大小,对编码对象区域的帧内预测编码中使用的预测模式进行选择的步骤。

Description

帧内预测编码控制方法和装置、其程序和记录程序的记录介质
技术领域
本发明涉及在能够切换多个预测模式和预测块大小的帧内预测编码中使用的帧内预测编码控制方法和其装置、用于实现该帧内预测编码控制方法的帧内预测编码控制程序、和记录了该程序的计算机能够读取的记录介质,特别是涉及实现运算成本的削减的帧内预测编码控制方法和其装置、用于实现该帧内预测编码控制方法的帧内预测编码控制程序、和记录了该程序的计算机能够读取的记录介质。
本申请基于2006年10月10日申请的日本专利申请2006-275951号主张优先权,并在这里引用其内容。
背景技术
在作为标准活动图像编码方式的ITU-T H.264(例如,参照非专利文献1)中,为了使编码效率提高,在进行帧内编码时,采用根据附近的像素生成预测信号的预测编码方式。
在H.264的帧内预测编码方式中,能够适宜地切换预测模式或预测块大小。通过采用该预测编码方式,与现有的影像编码方式相比能够格外地提高帧内编码的编码效率。
图6A~8B表示在H.264采用的预测块大小和预测模式。
这里,图6A、6B是以4×4像素的预测块大小对编码对象的宏块(16×16像素)进行帧内预测编码时的说明图,图6A表示编码对象块和已编码结束的块的位置关系,图6B表示预测方向。
同样地,图7A、7B是以8×8像素的预测块大小对编码对象的宏块进行帧内预测编码时的说明图,图7A表示编码对象块和已编码结束的块的位置关系,图7B表示预测方向。
同样地,图8A、8B是对编码对象的宏块以与其相同大小的16×16像素的预测块大小进行帧内预测编码时的说明图,图8A表示编码对象块和已编码结束的信号(像素)的位置关系,图8B表示根据各种方向和方法的预测。
像这样,在H.264中,对应于编码效率,能够选择各种预测块大小和预测方向。
可是,虽然能够选择的预测模式或预测块大小的增加可使编码效率提高,但是为了预测模式或预测块大小的选择,运算成本增加。因此提案了一种帧内预测编码的运算成本削减方法。
在非专利文献1中记述的发明中,按照图9所示的流程图的顺序,首先进行边缘(edge)方向的判定,接着限制预测模式,接着选择预测模式,接着决定预测块大小,由此进行帧内预测编码。
像这样,在非专利文献1中记述的发明中,通过预先调查边缘的方向而排除选择概率低的预测模式,由此谋求运算成本的削减。
此外,在下述非专利文献2中记述的发明中,按照图10所示的流程图的顺序,首先以4×4大小的块来选择预测模式,接着测定该预测模式的偏移(bias),基于该测定结果,可能能够跳过8×8大小的预测模式的选择,选择8×8大小或16×16大小的预测模式(关于8×8大小是没有跳过的情况),接着决定预测块大小,由此进行帧内预测编码。
像这样,在非专利文献2中记述的发明中,首先以作为最小的块大小的4×4大小的块选择预测模式,根据在该4×4大小的预测模式的出现频度,进行8×8大小或16×16大小的预测模式的限制、和预测块大小选择的控制。
在该非专利文献2中记述的发明中,通过根据在最小块大小的偏移,限制8×8大小的预测模式,或跳过8×8大小的预测,从而谋求运算成本的削减。
此外,在下述专利文献1记述的发明中,对附近块的预测模式的频度信息赋予权重,基于该被赋予了权重的频度信息来限定预测模式。
在该专利文献1中记述的发明中,在最初取得参照块的预测模式和权重系数,接着取得预测模式的优先顺序。接着基于该取得的预测模式和权重系数的信息,针对预测模式生成加权直方图,接着基于该加权直方图选定预测模式的候补。这时,在加权直方图中没有满足用于决定候补的规定数的预测模式的情况下,选择优先顺序高的预测模式,接着计算各预测模式的成本并选择预测模式,由此进行帧内预测编码。
像这样,在专利文献1中记述的发明中,根据附近块的预测模式的统计信息,通过对利用的预测模式进行限定,从而削减在预测模式选择时所需要的成本计算的次数。
非专利文献1:Feng Pan et al.,“Fast Mode Decision Algorithm forIntraprediction in H.264/AVC Video Coding,”IEEETrans.Circuits Syst.Video Technol.,vol.15,No.7,pp.813-822,July2005.
非专利文献2:常松祐一等,“モ—ドの
Figure A200780036762D0006104944QIETU
りを用いたH.264/AVCFRExt Intraモ—ド决定方法,”2005年電子情報通信学会
Figure A200780036762D0006105000QIETU
合大会,D-11-55,p.55,Mar.2005.
专利文献1:日本专利申请公开2005-348280号公报
发明的公开
发明要解决的问题
如上所述,在现有方法中,在进行帧内预测编码时,通过对利用的预测模式进行限制而谋求运算成本的削减。
在采用该结构时,在现有方法中,作为用于对在帧内预测编码中使用的预测模式进行限制的信息,利用输入信号的边缘方向、或在最小块大小的预测模式选择的结果、或在附近块的预测模式的频度信息等。
可是,在任一个现有方法中,没有限制比宏块大小(16×16)小的4×4大小或8×8大小的预测模式的利用,或即使限制利用也只是部分地限制。
比宏块大小小的4×4大小或8×8大小的预测模式的决定需要生成临时的解码图像。这是因为在宏块内的除去左上的小块的小块中,预测模式的判定需要参照邻接小块的解码图像。
生成解码图像需要正交变换、量化、反量化、反正交变换的处理。这些处理并不是实际地被利用在编码中,而是用于预测模式选择的临时的解码结果。在该块大小没有被选择的情况下,放弃该临时的解码结果。
在图11中表示以在H.264采用的各块大小,进行预测模式的选择所需要的解码处理量。
从该图可知,例如在利用三个块大小(4×4、8×8、16×16)的情况下,预测模式的选择所需要的解码处理量是在4×4大小为15块(240像素)的量,在8×8大小为3块(192像素)的量。在最终预测模式决定为16×16大小的情况下,包含实际上进行编码的16×16大小的解码处理,需要进行大约3个宏块的量的解码处理。
像这样,在现有方法中,对不明确最终是否被选择的预测块大小,需要在预测模式选择时进行临时的解码处理。
由此,例如在最终选择了16×16的块大小(即,宏块大小)的情况下,针对4×4大小和8×8大小的临时的解码结果被放弃,至少432(=240+192)像素的量的解码处理被浪费。
发明内容
本发明正是鉴于这种情况而完成的,其目的在于提供一种在进行帧内预测编码时通过实现不需要的解码处理的省略,从而实现运算成本的削减的新的帧内预测编码控制技术。
解决问题的方法
为了实现该目的,本发明的帧内预测编码控制装置,在具有多个预测模式和预测块大小的、在编码时能够对该多个预测模式和预测块大小进行切换的帧内预测编码中使用时,构成为具备:(1)对表示编码对象区域的平坦度(degree of flatness)的平坦程度(flatness degree index)进行计算的计算单元;(2)对应于计算单元计算出的平坦程度,决定编码对象区域的帧内预测编码中使用的预测块大小的决定单元;(3)以决定单元所决定的预测块大小,选择编码对象区域的帧内预测编码中使用的预测模式的选择单元。
在采用该结构时,有时还具备:(4)计算编码对象区域的量化步长的计算单元;(5)基于计算单元计算出的量化步长,对决定单元使用的阈值进行设定的设定单元。
这里,通过上述的各处理单元工作而实现的本发明的帧内预测编码控制方法以计算机程序也能够实现,该计算机程序记录在适当的计算机能够读取的记录介质中而被提供,或经由网络被提供,在实施本发明时被安装并通过在CPU等的控制单元上工作,从而实现本发明。
在以这样的方式构成的本发明的帧内预测编码控制装置中,首先通过基于编码对象区域内的亮度信号的统计量对平坦程度进行计算等,从而计算出表示编码对象区域的平坦度的平坦程度。
这时,考虑到由于编码对象区域宽阔而包含多个具有平坦程度的区域,将编码对象区域分割成小区域并针对各小区域计算平坦程度,基于这些平坦程度计算编码对象区域的平坦程度。
接着,以在编码对象区域的平坦度低的情况下,作为帧内预测编码中使用的预测块大小决定小的预测块大小,在编码对象区域的平坦度高的情况下,作为帧内预测编码中使用的预测块大小决定大的预测块大小的方式,对应于计算出的平坦程度,决定编码对象区域的帧内预测编码中使用的预测块大小。
接着,按照决定了的预测块大小,以使预测块大小为固定的方式,选择编码对象区域的帧内预测编码中使用的预测模式。
以这样的方式,在本发明的帧内预测编码控制装置中,使用表示编码对象区域的平坦度的平坦程度,以不进行预测模式判定,而决定编码对象区域的帧内预测编码中使用的预测块大小的方式进行处理。
在该预测块大小的决定时,在本发明的帧内预测编码控制装置中,例如,对计算出的编码对象区域的平坦程度和对应于能够选择的预测块大小而设定的阈值进行比较,基于该比较结果,决定帧内预测编码中使用的预测块大小。
关于这时使用的阈值,为了减轻编码效率的下降,有时基于编码对象区域的量化步长进行设定,例如,在量化步长变小的情况下,以小的预测块大小被决定的比例变大的方式进行设定。
在该阈值的设定时,在预测块大小的决定处理前不能够计算编码对象区域的量化步长的情况下,基于已经计算出的其它的区域的量化步长,对代替编码对象区域的量化步长的量化步长进行计算。
发明的效果
根据本发明,在进行帧内预测编码时,使用表示编码对象区域的平坦度的平坦程度,能够不进行预测模式判定,而决定编码对象区域的预测块大小。
由此,根据本发明,在进行帧内预测编码时,不仅能够限制判定的预测模式数量,还不需要在各预测块大小所需要的用于预测模式决定的临时的解码处理,能够削减运算成本。
附图说明
图1是按照本发明的影像编码装置执行的流程图。
图2是按照本发明的影像编码装置的一个实施例。
图3是阈值表的表数据的说明图。
图4是查找表的表数据的说明图。
图5是帧内预测编码机构执行的流程图。
图6A是在H264中采用的使用了4×4像素的预测块大小的编码的说明图。
图6B是图6A的预测方向的说明图。
图7A是在H.264中采用的使用了8×8像素的预测块大小的编码的说明图。
图7B是图7A的预测方向的说明图。
图8A是在H.264中采用的使用了16×16像素的预测块大小的编码的说明图。
图8B是根据图8A的各种方向和方法的预测的说明图。
图9是非专利文献2中记述的发明执行的流程图。
图10是非专利文献3中记述的发明执行的流程图。
图11是在H264中预测模式的选择所需要的解码处理量的说明图。
附图标记的说明
1    影像编码装置
2    帧内预测编码机构
3    预测块大小决定机构
4    预测模式选择机构
5    编码机构
6    量化步长计算部
30   宏块分割部
31   L1离散计算部
32   宏块平坦程度计算部
33   预测块大小决定部
34   阈值表
35   查找表
36   表数据登录部
37   阈值设定部
具体实施方式
下面,按照实施方式对本发明进行详细地说明。
本发明在进行帧内预测编码的情况下,不是像现有方法那样限定预测模式,而是在最初就限定预测块大小。以这样的方式,通过在最初限定预测块大小,能够省略不需要的解码处理,能够削减运算成本。
图1表示按照本发明的影像编码装置执行的流程图的一个例子。按照该流程图,对具备本发明的影像编码装置执行的处理进行说明。
本影像编码装置首先在最初,在步骤S10对表示编码对象区域的平坦度的平坦程度进行计算。
接着在步骤S11,对与计算出的平坦程度进行比较的阈值,对应于能够利用的预测块大小进行设定。
接着在步骤S12,基于计算出的平坦程度和设定的阈值的比较结果,决定编码对象区域的预测块大小。
这时,平坦度越低的块越选择小的块大小,此外,平坦度越高的块越选择大的块大小,由此决定编码对象区域的预测块大小。
接着在步骤S13,按照以该方式决定的预测块大小,以将预测块大小作为固定的方式选择预测模式。
最后在步骤S14,基于决定了的预测块大小和选择了的预测模式,对编码对象区域进行帧内预测编码。
接着,对这些处理进行详细地说明。
在本发明中,使用编码对象区域的平坦程度,在最初,对编码对象区域的帧内预测编码中使用的预测块大小进行决定。
该平坦程度能够根据像素值的离散(dispersion)或平均值来计算,例如,使用下述的式(1)中表示的L2离散进行计算,或使用下述的式(2)中表示的L1离散进行计算。
[数式1]
act = &Sigma; i = 0 N x &Sigma; j = 0 N y ( s ( i , j ) - < s > ) 2     式(1)
act = &Sigma; i = 0 N x &Sigma; j = 0 N y | s ( i , j ) - < s > |     式(2)
这里,s(i,j)表示编码对象区域内的位置(i,j)的像素值,<s>表示这些像素值的平均值。
如以这些数式表示的那样,计算出的“平坦程度”值越大,平坦度越低,“平坦程度”值越小,平坦度越高。
在编码对象区域宽阔的情况下,由于有包含多个具有平坦程度的区域的可能性,所以能够将编码对象区域分割为小区域来计算平坦程度。这时,由于编码对象区域的平坦程度仅求取小区域的数,所以将其中的最小值或最大值作为编码对象区域的平坦程度。
例如,将16×16大小的宏块分割为8×8大小的小块,对各小块的每一个计算平坦程度。当以该方式进行时,由于对每一个宏块计算四个平坦程度,所以将其最小值或最大值作为宏块的平坦程度。
再有,关于该平坦程度,有也在量化控制等其它的编码处理中利用的例子,在共用的情况下,不需要考虑帧内预测编码控制的运算成本。因此,与求取边缘方向的情况等不同,有附加的运算成本变小的可能性。
与平坦程度比较的阈值对应于预测块大小进行设定。
例如,按照H.264,在切换4×4大小、8×8大小、16×16大小这三种预测块大小的情况下,为了能够切换这些预测块大小,设定用于4×4大小和8×8大小的切换的TH4-8、用于8×8大小和16×16大小的切换的TH8-16这两个阈值(TH4-8>TH8-16)。
使用这两个阈值,在
平坦程度≥TH4-8
的平坦度低的情况下,因为当不减小预测块大小时预测精度降低,所以将预测块大小决定为最小的4×4大小,另一方面,在
TH4-8>平坦程度≥TH8-16
的平坦度为中等程度的情况下,因为优选将预测块大小设定为中等程度,所以将预测块大小决定为8×8大小,另一方面,在
TH8-16>平坦程度
的平坦度高的情况下,因为即使增大预测块大小,预测精度也不降低,并且能够削减码量,所以将预测块大小决定为最大的16×16大小。
这里,用于与平坦程度进行比较的阈值,能够对应于量化步长而变动。
在各预测模式中,由于开销(overhead)信息(预测模式信息、有意系数(significant coefficient)块信息等)的码量不同,所以根据量化步长,预测块大小和平坦程度之间的关系变化。因此,通过根据量化步长而使阈值变动,能够减轻编码效率的下降。
根据本申请发明者通过实验而获得的知见,在量化步长变小的情况下,即在微细地进行量化的情况下,通过以决定为小的预测块大小的比例(概率)变大的方式设定阈值,能够进一步减轻编码效率的下降。
由此,在量化步长变小的情况下,例如以将阈值TH4-8设定为更小的值的方式进行处理。通过该方式,最小的4×4的预测块大小变得更容易被选择,能够减轻编码效率的下降。
这里,针对量化步长,优选是在对编码对象区域进行量化时使用的值。可是,在预测块大小的决定处理之前不能够求取量化步长的情况下,能够利用之前编码了的区域的量化步长,或在画面内处理结束的块的量化步长的平均值等。
以该方式,根据本发明,在进行帧内预测编码时,使用编码对象区域的平坦程度,不进行预测模式判定,就能够决定编码对象区域的预测块大小。
由此,根据本发明,在进行帧内预测编码时,不仅能够限制判定的预测模式数量,而且不需要在各预测块大小所需要的用于预测模式决定的临时的编码处理,所以能够削减运算成本。
实施例
在以下说明的实施例中,作为帧内预测编码方式以H264作为前提,帧内预测编码中使用的块大小为16×16大小、8×8大小、4×4大小的三种。
图2表示作为本发明的一个实施例的影像编码装置1。
如该图所示那样,本影像编码装置1具备:帧内预测编码机构2,其按照本发明执行帧内预测编码。
该帧内预测编码机构2具备:预测块大小决定机构3,通过进行本发明的特征的处理,对编码对象宏块的帧内预测编码中使用的预测块大小进行决定;预测模式选择机构4,按照预测块大小决定机构3决定的预测块大小,将预测块大小作为固定的大小,对编码对象宏块的帧内预测编码中使用的预测模式进行选择;以及编码机构5,基于预测块大小决定机构3决定的预测块大小、和预测模式选择机构4选择的预测模式,对编码对象宏块进行帧内预测编码。
这里,图中所示的6是量化控制机构等具备的量化步长计算部,其对编码对象宏块的量化步长进行计算,进行将其通知到帧内预测编码机构2的处理。
预测块大小决定机构3为了进行决定编码对象宏块的帧内预测编码中使用的预测块大小的处理,具备:宏块分割部30、L1离散计算部31、宏块平坦程度计算部32、预测块大小决定部33、阈值表34、查找表35、表数据登录部36、以及阈值设定部37。
宏块分割部30将编码对象的宏块分割为8×8大小的四个小块。
L1离散计算部31针对宏块分割部30分割了的8×8大小的小块的每一个,按照下述式(3),计算亮度信号的L1离散actn,作为表示小块的平坦度的值(平坦程度)。
[数式2]
act n = &Sigma; i = 0 7 &Sigma; j = 0 7 | s y ( i , j ) - < s y > |     式(3)
这里,sy(i,j)表示小块n(n=0~3)的亮度信号的像素值,<sy>表示离开n的亮度信号的平均值。
宏块平坦程度计算部32针对L1离散计算部31计算出的四个L1离散actn,计算其最大值actmax
即,计算
actmax=max(act0,act1,act2,act3)
预测块大小决定部33使用从阈值表34读出的两个阈值TH4-8、TH8-16(TH4-8>TH8-16),在
actmax≥TH4-8
的关系成立的情况下,决定将4×4大小作为预测块大小,在
TH4-8>actmax≥TH8-16
的关系成立的情况下,决定将8×8大小作为预测块大小,在
TH8-16>actmax
的关系成立的情况下,决定将16×16大小作为预测块大小。
阈值表34如图3所示,对预测块大小决定部33使用的两个阈值TH4-8、TH8-16进行管理。
查找表35如图4所示,与量化步长范围对应起来,对该量化步长范围时使用的阈值TH4-8、TH8-16进行管理。
表数据登录部36对查找表35登录量化步长范围和阈值TH4-8、TH8-16的对应关系数据。在这时登录的对应关系数据中,在量化步长变小的情况下,以决定为小的预测块大小的比例(概略)变大的方式设定阈值。
阈值设定部37将量化步长计算部6计算出的量化步长作为关键(key),通过参照查找表35,取得与该量化步长适合的阈值TH4-8、TH8-16,将其写入阈值表34从而设定阈值TH4-8、TH8-16
图5中表示以该方式构成的帧内预测编码机构2执行的流程图的一个例子。按照该流程图,对以该方式构成的帧内预测编码机构2执行的处理进行详细地说明。
帧内预测编码机构2当被赋予编码对象宏块的信息时,如图5的流程图所示,首先在最初,在步骤S100将编码对象宏块(16×16大小)分割为四个8×8大小的小块。
接着在步骤S101,针对分割的四个小块的每一个,按照上述的式(3),计算亮度信息的L1离散act0、act1、act2、act3
接着在步骤S102,对计算出的四个L1离散act0、act1、act2、act3中的最大值actmax进行计算,
actmax=max(act0,act1,act2,act3)
将该计算出的最大值actmax作为表示编码对象宏块的平坦度的平坦程度。
接着在步骤S103,对预测块大小的判定中使用的阈值TH4-8、TH8-16进行设定。
该阈值的设定处理,具体以下述方式进行,将通过量化步长计算部6计算出的编码对象宏块的量化步长作为关键,通过参照查找表35,取得适合于该量化步长的阈值TH4-8、TH8-16,将其写入阈值表34中。
接着在步骤S104,通过比较作为编码对象宏块的平坦程度计算出的L1离散的最大值actmax、和从阈值表34读出的两个阈值TH4-8、TH8-16,判定编码对象宏块的平坦度。
该判定处理具体以下述方式进行,在
actmax≥TH4-8
的关系成立的情况下,判定为平坦度低,在
TH4-8>actmax≥TH8-16
的关系成立的情况下,判定为平坦度是中等程度,在
TH8-16>actmax
的关系成立的情况下,判定为平坦度高。
按照该步骤S104的判定处理,在判定为编码对象宏块的平坦度高的情况下,进入步骤S105,作为预测块大小决定为16×16大小,接着在步骤S106,以该决定了的预测块选择编码对象宏块的预测模式。
另一方面,按照步骤S104的判定处理,在判定为编码对象宏块的平坦度是中等程度的情况下,进入步骤S107,作为预测块大小决定为8×8大小,接着在步骤S108,以该决定了的预测块选择编码对象宏块的预测模式。
另一方面,按照步骤S104的判定处理,在判定为编码对象宏块的平坦度低的情况下,进入步骤S109,作为预测块大小决定为4×4大小,接着在步骤S110,以该决定了的预测块选择编码对象宏块的预测模式。
以该方式,按照步骤S105~S110的处理,当选择编码对象宏块的预测块大小和预测模式时,接着在步骤S111,以该预测块大小和预测模式对编码对象宏块进行帧内预测编码。
以该方式,在本发明中,在进行帧内预测编码时,在进行预测模式的判定之前,能够决定编码中使用的预测块大小。
在以上说明的实施例中,在各预测块大小中没有进行预测模式的限制,但通过限制能够利用的预测模式数量,能够进一步削减运算成本。
产业上的利用可能性
本发明能够在进行帧内预测编码时应用,不仅能够限制判定的预测模式数量,还不需要在各预测块大小所需要的用于预测模式决定的临时的解码处理,由此能够削减运算成本。

Claims (12)

1.一种帧内预测编码控制方法,在具有多个预测模式和预测块大小的、在编码时能够对该多个预测模式和预测块大小进行切换的帧内预测编码中使用,具有:
对表示编码对象区域的平坦度的平坦程度进行计算的步骤;
对应于所述计算出的平坦程度,对编码对象区域的帧内预测编码中使用的预测块大小进行决定的步骤;以及
以所述决定了的预测块大小,对编码对象区域的帧内预测编码中使用的预测模式进行选择的步骤。
2.根据权利要求1所述的帧内预测编码控制方法,其中,
在决定所述预测块大小的步骤中,在编码对象区域的平坦度低的情况下,作为编码中使用的预测块大小决定小的预测块大小,在编码对象区域的平坦度高的情况下,作为编码中使用的预测块大小决定大的预测块大小。
3.根据权利要求2所述的帧内预测编码控制方法,其中,
在决定所述预测块大小的步骤中,比较编码对象区域的平坦程度、和对应于能够选择的预测块大小而设定的阈值,基于该比较结果,决定编码中使用的预测块大小。
4.根据权利要求3所述的帧内预测编码控制方法,具有:
对编码对象区域的量化步长进行计算的步骤;以及
基于所述计算出的量化步长,设定所述阈值的步骤。
5.根据权利要求4所述的帧内预测编码控制方法,其中,
在对所述量化步长进行计算的步骤中,在决定所述预测块大小的步骤执行之前不能够计算编码对象区域的量化步长的情况下,基于其它的区域的、已经计算出的量化步长,计算编码对象区域的量化步长。
6.根据权利要求4所述的帧内预测编码控制方法,其中,
在设定所述阈值的步骤中,在所述计算出的量化步长相对小的情况下,设定使决定为相对小的预测块大小的比例变大的阈值。
7.根据权利要求1所述的帧内预测编码控制方法,其中,
在计算所述编码对象区域的平坦程度的步骤中,基于编码对象区域内的亮度信号的统计量计算平坦程度。
8.根据权利要求1所述的帧内预测编码控制方法,其中,
在计算所述编码对象区域的平坦程度的步骤中,将编码对象区域分割为小区域并针对各小区域计算平坦程度,基于这些平坦程度,计算编码对象区域的平坦程度。
9.一种帧内预测编码控制装置,在具有多个预测模式和预测块大小的、在编码时能够对该多个预测模式和预测块大小进行切换的帧内预测编码中使用,具有:
对表示编码对象区域的平坦度的平坦程度进行计算的计算单元;
对应于所述计算单元计算出的平坦程度,决定编码对象区域的帧内预测编码中使用的预测块大小的决定单元;以及
以所述决定单元所决定的预测块大小,对编码对象区域的帧内预测编码中使用的预测模式进行选择的选择单元。
10.根据权利要求9所述的帧内预测编码控制装置,其中,
所述决定单元,在编码对象区域的平坦度低的情况下,作为编码中使用的预测块大小决定小的预测块大小,在编码对象区域的平坦度高的情况下,作为编码中使用的预测块大小决定大的预测块大小。
11.一种帧内预测编码控制程序,用于使计算机执行实现权利要求1所述的帧内预测编码控制方法中使用的处理。
12.一种计算机能够读取的记录介质,记录了帧内预测编码控制程序,该帧内预测编码控制程序用于使计算机执行实现权利要求1所述的帧内预测编码控制方法中使用的处理。
CN2007800367625A 2006-10-10 2007-10-05 帧内预测编码控制方法和装置 Active CN101523921B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP275951/2006 2006-10-10
JP2006275951 2006-10-10
PCT/JP2007/069620 WO2008044658A1 (en) 2006-10-10 2007-10-05 Intra prediction encoding control method and device, its program, and storage medium containing program

Publications (2)

Publication Number Publication Date
CN101523921A true CN101523921A (zh) 2009-09-02
CN101523921B CN101523921B (zh) 2011-04-06

Family

ID=39282853

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2007800367625A Active CN101523921B (zh) 2006-10-10 2007-10-05 帧内预测编码控制方法和装置

Country Status (11)

Country Link
US (1) US8228998B2 (zh)
EP (1) EP2073557B1 (zh)
JP (2) JPWO2008044658A1 (zh)
KR (2) KR101242013B1 (zh)
CN (1) CN101523921B (zh)
BR (1) BRPI0719853A2 (zh)
CA (1) CA2664668C (zh)
ES (1) ES2630203T3 (zh)
RU (1) RU2407221C1 (zh)
TW (1) TWI386064B (zh)
WO (1) WO2008044658A1 (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795409A (zh) * 2010-03-03 2010-08-04 北京航空航天大学 内容自适应分数像素运动估计方法
CN103686183A (zh) * 2013-12-27 2014-03-26 南京讯思雅信息科技有限公司 一种功耗可控的帧内视频编码方法
CN114375571A (zh) * 2020-06-11 2022-04-19 腾讯美国有限责任公司 改进的量化器

Families Citing this family (30)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4901772B2 (ja) * 2007-02-09 2012-03-21 パナソニック株式会社 動画像符号化方法及び動画像符号化装置
US8219074B2 (en) * 2008-06-12 2012-07-10 Telefonaktiebolaget L M Ericsson (Publ) Method and apparatus for communication site planning
TW201041405A (en) * 2009-03-06 2010-11-16 Sony Corp Image processing device and method
JP5219089B2 (ja) * 2009-04-30 2013-06-26 株式会社メガチップス 画像データの生成方法
WO2011080925A1 (ja) * 2009-12-28 2011-07-07 パナソニック株式会社 画像符号化装置および方法
JP2011239365A (ja) 2010-04-12 2011-11-24 Canon Inc 動画像符号化装置及びその制御方法、コンピュータプログラム
US9215470B2 (en) 2010-07-09 2015-12-15 Qualcomm Incorporated Signaling selected directional transform for video coding
PT3373581T (pt) * 2010-12-21 2020-01-27 Ntt Docomo Inc Codificação com intra-predição melhorada utilizando representações planares
US10992958B2 (en) 2010-12-29 2021-04-27 Qualcomm Incorporated Video coding using mapped transforms and scanning modes
JP5552078B2 (ja) * 2011-02-28 2014-07-16 株式会社メガチップス 符号化装置
BR122020015659B1 (pt) 2011-03-09 2023-03-28 Nec Corporation Dispositivo de decodificação de vídeo e método de decodificação de vídeo
DE112012001609B9 (de) * 2011-04-25 2021-11-18 Lg Electronics Inc. Intra-Prädiktionsverfahren, Kodierer und Dekodierer zur Benutzung desselben
JP5720399B2 (ja) * 2011-04-26 2015-05-20 株式会社Jvcケンウッド 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
US9025665B2 (en) * 2011-07-01 2015-05-05 Cavium, Inc. Video encoder bit estimator for macroblock encoding
WO2013009029A2 (ko) * 2011-07-08 2013-01-17 한양대학교 산학협력단 부호화 단위의 크기 결정 방법 및 장치
US9674525B2 (en) 2011-07-28 2017-06-06 Qualcomm Incorporated Multiview video coding
US9635355B2 (en) 2011-07-28 2017-04-25 Qualcomm Incorporated Multiview video coding
CN107222744B (zh) * 2011-10-28 2020-10-27 三星电子株式会社 用于视频的帧内预测的方法和设备
JP6190103B2 (ja) * 2012-10-29 2017-08-30 キヤノン株式会社 動画像符号化装置、動画像符号化方法およびプログラム
US9177393B2 (en) * 2013-02-04 2015-11-03 Qualcomm Incorporated Mixed mode for frame buffer compression
US10003792B2 (en) * 2013-05-27 2018-06-19 Microsoft Technology Licensing, Llc Video encoder for images
US10136140B2 (en) 2014-03-17 2018-11-20 Microsoft Technology Licensing, Llc Encoder-side decisions for screen content encoding
US10306229B2 (en) 2015-01-26 2019-05-28 Qualcomm Incorporated Enhanced multiple transforms for prediction residual
EP3254463A4 (en) 2015-02-06 2018-02-21 Microsoft Technology Licensing, LLC Skipping evaluation stages during media encoding
US10038917B2 (en) 2015-06-12 2018-07-31 Microsoft Technology Licensing, Llc Search strategies for intra-picture prediction modes
US10136132B2 (en) 2015-07-21 2018-11-20 Microsoft Technology Licensing, Llc Adaptive skip or zero block detection combined with transform size decision
US9955186B2 (en) 2016-01-11 2018-04-24 Qualcomm Incorporated Block size decision for video coding
US10623774B2 (en) 2016-03-22 2020-04-14 Qualcomm Incorporated Constrained block-level optimization and signaling for video coding tools
JP7027044B2 (ja) * 2017-04-27 2022-03-01 キヤノン株式会社 画像符号化装置、画像符号化方法及びプログラム
US11323748B2 (en) 2018-12-19 2022-05-03 Qualcomm Incorporated Tree-based transform unit (TU) partition for video coding

Family Cites Families (21)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5122875A (en) 1991-02-27 1992-06-16 General Electric Company An HDTV compression system
US5214507A (en) * 1991-11-08 1993-05-25 At&T Bell Laboratories Video signal quantization for an mpeg like coding environment
JP3640651B2 (ja) * 1992-12-25 2005-04-20 三菱電機株式会社 符号化制御装置
TW297202B (zh) 1993-10-13 1997-02-01 Rca Thomson Licensing Corp
JP3864461B2 (ja) * 1996-08-30 2006-12-27 ソニー株式会社 映像データ圧縮装置およびその方法
US6633611B2 (en) * 1997-04-24 2003-10-14 Mitsubishi Denki Kabushiki Kaisha Method and apparatus for region-based moving image encoding and decoding
JPH11331850A (ja) * 1998-03-16 1999-11-30 Mitsubishi Electric Corp 動画像符号化方式
US6529634B1 (en) 1999-11-08 2003-03-04 Qualcomm, Inc. Contrast sensitive variance based adaptive block size DCT image compression
NZ524955A (en) 2000-09-27 2005-01-28 Milestone Entertainment Llc A lottery game and method for play in games of chance
US6831947B2 (en) * 2001-03-23 2004-12-14 Sharp Laboratories Of America, Inc. Adaptive quantization based on bit rate prediction and prediction error energy
JP4323770B2 (ja) * 2002-10-18 2009-09-02 キヤノン株式会社 画像処理装置、画像処理方法、プログラム及び記録媒体
HUP0301368A3 (en) * 2003-05-20 2005-09-28 Amt Advanced Multimedia Techno Method and equipment for compressing motion picture data
CN1209928C (zh) * 2003-07-04 2005-07-06 清华大学 一种基于预测块组的采用帧内预测的帧内编码帧编码方法
CN100479527C (zh) * 2004-02-26 2009-04-15 联合信源数字音视频技术(北京)有限公司 一种帧内预测模式选取方法
JP2005244666A (ja) * 2004-02-26 2005-09-08 Sony Corp データ処理装置、符号化装置およびデータ処理方法
US8467447B2 (en) * 2004-05-07 2013-06-18 International Business Machines Corporation Method and apparatus to determine prediction modes to achieve fast video encoding
JP2005348280A (ja) 2004-06-07 2005-12-15 Nippon Telegr & Teleph Corp <Ntt> 画像符号化方法、画像符号化装置、画像符号化プログラム及びそのプログラムを記録したコンピュータ読み取り可能な記録媒体
US7792188B2 (en) * 2004-06-27 2010-09-07 Apple Inc. Selecting encoding types and predictive modes for encoding video data
JP2006074474A (ja) 2004-09-02 2006-03-16 Toshiba Corp 動画像符号化装置、動画像符号化方法および動画像符号化プログラム
US20060193527A1 (en) * 2005-01-11 2006-08-31 Florida Atlantic University System and methods of mode determination for video compression
JP4802535B2 (ja) 2005-03-30 2011-10-26 株式会社島津製作所 分析装置情報提示システム

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101795409A (zh) * 2010-03-03 2010-08-04 北京航空航天大学 内容自适应分数像素运动估计方法
CN103686183A (zh) * 2013-12-27 2014-03-26 南京讯思雅信息科技有限公司 一种功耗可控的帧内视频编码方法
CN114375571A (zh) * 2020-06-11 2022-04-19 腾讯美国有限责任公司 改进的量化器

Also Published As

Publication number Publication date
EP2073557A4 (en) 2011-03-09
KR20090064404A (ko) 2009-06-18
US8228998B2 (en) 2012-07-24
JPWO2008044658A1 (ja) 2010-02-12
US20100020872A1 (en) 2010-01-28
TW200826691A (en) 2008-06-16
CA2664668A1 (en) 2008-04-17
EP2073557B1 (en) 2017-03-29
WO2008044658A1 (en) 2008-04-17
JP5757596B2 (ja) 2015-07-29
KR101242013B1 (ko) 2013-03-12
KR20110086159A (ko) 2011-07-27
RU2407221C1 (ru) 2010-12-20
RU2009111869A (ru) 2010-10-10
TWI386064B (zh) 2013-02-11
EP2073557A1 (en) 2009-06-24
CA2664668C (en) 2014-04-01
JP2014140169A (ja) 2014-07-31
BRPI0719853A2 (pt) 2014-06-03
CN101523921B (zh) 2011-04-06
ES2630203T3 (es) 2017-08-18

Similar Documents

Publication Publication Date Title
CN101523921B (zh) 帧内预测编码控制方法和装置
CN102611892B (zh) 在编码过程中实现自适应量化的方法及装置
KR100860147B1 (ko) 화상 부호화 방법, 그 장치 및 제어 프로그램을 기록한 컴퓨터 판독가능한 기록 매체
RU2492586C2 (ru) Способ автоматического формирования процедуры генерации прогнозируемого значения пикселя, способ кодирования изображений, способ декодирования изображений, соответствующее устройство, соответствующие программы и носители информации, которые хранят программы
CN102210151A (zh) 图像编码装置以及图像解码装置
CN1809161B (zh) 对编码视频数据选择编码类型和预测模式
CN103270700A (zh) 使用平面表达的增强帧内预测编码
CN101483780B (zh) 一种帧内dc预测的方法及装置
CN101971631A (zh) 自适应帧内模式选择
CN104717502A (zh) 运动图像编码装置以及运动图像解码装置
JPH09224253A (ja) 画像符号化装置および画像復号装置
KR100346740B1 (ko) 이산코사인변환계수예측방법
CN103188493A (zh) 图像编码装置及图像编码方法
KR20070037532A (ko) 영상의 인트라 예측 부호화 방법 및 그 방법을 사용하는부호화 장치
CN102215392B (zh) 用于估计像素值的帧内预测方法或装置
EP1603343B1 (en) Apparatus for spatial predictive decoding of video data
US10015484B2 (en) Adaptive scan device and method for scanning thereof
KR100982514B1 (ko) 영상의 인트라 예측 부호화 방법 및 그 장치
JP6946979B2 (ja) 動画像符号化装置、動画像符号化方法、及び動画像符号化プログラム
KR20030009575A (ko) 신경망 분류기를 이용한 동영상 전송률 제어 장치 및 그방법
KR101630167B1 (ko) Hevc를 위한 고속 화면내 부호화 모드 결정 방법
JP4177278B2 (ja) 量子化ステップサイズ変更方法、量子化ステップサイズ変更装置、量子化ステップサイズ変更プログラムおよびそのプログラムを記録したコンピュータ読み取り可能な記録媒体
KR101226989B1 (ko) 계조 추정을 통한 예측 영상 생성 방법 및 장치
JP6101067B2 (ja) 画像処理装置及び画像処理プログラム
KR20090026944A (ko) 고속모드선택방법 및 그 기록매체

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant