CN1512453A - 图像处理方法及装置 - Google Patents

图像处理方法及装置 Download PDF

Info

Publication number
CN1512453A
CN1512453A CNA021600163A CN02160016A CN1512453A CN 1512453 A CN1512453 A CN 1512453A CN A021600163 A CNA021600163 A CN A021600163A CN 02160016 A CN02160016 A CN 02160016A CN 1512453 A CN1512453 A CN 1512453A
Authority
CN
China
Prior art keywords
mentioned
face
zone
mouth
candidate face
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA021600163A
Other languages
English (en)
Other versions
CN1282943C (zh
Inventor
陈新武
纪新
王立冰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Priority to CNB021600163A priority Critical patent/CN1282943C/zh
Priority to US10/704,591 priority patent/US7403636B2/en
Publication of CN1512453A publication Critical patent/CN1512453A/zh
Application granted granted Critical
Publication of CN1282943C publication Critical patent/CN1282943C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V40/00Recognition of biometric, human-related or animal-related patterns in image or video data
    • G06V40/10Human or animal bodies, e.g. vehicle occupants or pedestrians; Body parts, e.g. hands
    • G06V40/16Human faces, e.g. facial parts, sketches or expressions
    • G06V40/161Detection; Localisation; Normalisation
    • G06V40/165Detection; Localisation; Normalisation using facial parts and geometric relationships

Abstract

本发明提供了一种图像处理方法,其特征在于包括以下步骤:识别上述图像中的候选人脸区域;在上述候选人脸区域中选取嘴邻近区域;处理上述嘴邻近区域;以及根据上述处理步骤的结果,将上述候选人脸区域分类。按照本发明的方法,无需整个人脸的所有像素,仅根据嘴邻近区域中的像素即可检测出人脸。

Description

图像处理方法及装置
技术领域
本发明涉及图像处理,尤其涉及将在其中检测人脸的图像处理方法及装置。
背景技术
众所周知,许多技术可用于检测图像中感兴趣的区域,如人脸或其他感兴趣的要识别的目标。人脸检测是一个令人特别感兴趣的领域,因为人脸识别不仅对于图像处理,而且对于身份鉴别和安全,以及人机界面都有重要性。人机界面不仅识别人脸的位置,如果人脸存在的话,其还能识别特定的人脸,并可以理解面部表情和姿势。
近来,报道了许多关于自动人脸检测的研究。参考资料例如包括1996年5th IEEE International Workshop on Robot and HumanCommunication,第341到第346页中的“Face Detection andRotations Estimation using Color Information”和1999年6月IEEE Transaction on Pattern Analysis and MachineIntelligence卷21第6号中的“Face Detectionfrom Color ImagesUsing a Fuzzy Pattern Matching Method”。
所有检测人脸的常规方法,都有它们的优点和不足,这取决于处理图像时所用的不同算法。一些方法虽然准确但却复杂而耗时。
发明内容
本发明的目的在于提供一种根据位于嘴邻近区域的像素,尤其是根据计算出的与嘴邻近区域相关的边缘信息检测人脸的图像处理方法及装置。
为实现上述目的,本发明提供了一种图像处理方法,其特征在于包括以下步骤:
识别上述图像中的候选人脸区域;
在上述候选人脸区域中选取嘴邻近区域;
处理上述嘴邻近区域;以及
根据上述处理步骤的结果,将上述候选人脸区域分类。
本发明还提供了一种图像处理装置,其特征在于包括:
候选区域识别器,用于识别上述图像中的候选人脸区域;
嘴邻近区域选取器,用于在由上述候选区域识别器识别出的上述候选人脸区域中选取嘴邻近区域;
嘴邻近区域处理器,用于处理由上述嘴邻近区域选取器选取的上述嘴邻近区域;以及
分类器,用于根据上述嘴邻近区域处理器的输出,将由上述候选区域识别器识别出的上述候选人脸区域分类。
根据本发明的方法和装置,仅根据包含在嘴邻近区域内的像素即可检测出人脸,而无需根据整张脸的所有像素。并且使用与嘴邻近区域相关的边缘信息提高了人脸检测的精确性。
另外,本发明的方法易于与各种确定候选人脸区域的常规方法相结合,以便适应不同的情况。
本发明的其他特点和优点可结合附图从下面通过举例对本发明的原理进行解释的优选实施方式的说明中变得更清楚。
附图说明
图1是按照本发明的图像处理方法的第一种实施方式的流程图;
图2是按照本发明的图像处理方法的第二种实施方式的流程图;
图3A是示意框图,示出按照本发明的图像处理装置的结构;
图3B示意性示出图3A中所示的嘴邻近区域处理器的内部结构;
图3C示意性示出图3B中所示的边缘信息计算器的内部结构;
图3D示意性示出图3B中所示的边缘信息计算器的另一内部结构;
图4示意性示出人脸中嘴邻近区域、嘴区域和眼区域之间的关系;
图5示出用于解释图1和图2所示方法的两个例子;以及
图6示意性示出图1和图2所示的每种方法可在其中实现的图像处理系统。
具体实施方式
下面将对本发明作详细说明。在下面的说明中,关于如何识别图像中的一个候选人脸区域,可参考由同一申请人于2000年9月15日提出申请,并于2002年4月10日公开的中国专利申请第00127067.2号,以及由同一申请人于2001年9月6日提出申请的中国专利申请第01132807.x号。这些申请在此作为参考。但是,中国专利申请第00127067.2和第01132807.x号中公开的识别候选人脸区域的方法不构成对本发明的限制。本发明可以使用任何识别图像中候选人脸区域的常规方法。
图1是按照本发明的图像处理方法的第一种实施方式的流程图。
流程开始于步骤101。在步骤102,输入待处理图像。在步骤103,在步骤102中输入的图像中识别一个候选人脸区域。S1表示步骤103中识别出的候选人脸区域的大小。这里,图像的大小被定义为组成该图像的像素的个数。
步骤102和103中,任何在图像中识别一个候选人脸区域的常规方法都可以被采用,且不构成对本发明的限制。
在步骤104,在步骤103中识别出的候选人脸区域中选取嘴邻近区域。关于如何在一张人脸中选取嘴邻近区域将在后面参照图4进行详细说明。
然后,处理嘴邻近区域。
图1中虚线框住的步骤105到111和图2中虚线框住的步骤205到207表示处理嘴邻近区域的两种不同方法。图1和图2所示的这两种不同方法的共同基础是首先形成候选人脸区域或至少嘴邻近区域的边缘图;根据边缘图计算嘴邻近区域的边缘信息;最后利用边缘信息将候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或者假人脸。
当然,对嘴邻近区域也可以应用其他处理方法,只要嘴邻近区域的处理结果足以将候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或者假人脸。并且除特殊区域(例如图1的步骤106中形成的明亮区域)的大小和区域中平均边缘强度(例如图2的步骤206中计算出的两个强度)之外,处理嘴邻近区域的方法中也可以使用其他边缘信息,只要该边缘信息足以将候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或者假人脸。
处理嘴邻近区域的不同方法和不同边缘信息不构成对本发明的任何限制。
具体而言,在图1的步骤105中,形成一张至少与嘴邻近区域相对应的边缘图。
应当注意,如果将整个候选人脸区域转换为边缘图,则步骤104和105的顺序并不重要。
即,可以形成整个候选人脸区域边缘图,然后在该边缘图中选取嘴邻近区域。
如果将候选人脸区域表示为灰度图,形成的边缘图将显示为黑色背景下的多条明亮的边缘。边缘图中的每一条明亮边缘表示候选人脸区域灰度图中相应位置的像素的灰度级变化显著。为了将灰度图转换为边缘图,可以使用常规的“索贝尔”算子。在本说明书的结尾,给出四个例子以解释图1和图2中所示的方法。
在步骤106,从步骤105中形成的边缘图中,选取多个其特征值大于第一阈值的像素。这些被选像素以它们自己的位置,在边缘图中组成一系列明亮区域。
一种选取这些像素的独特方法被称作“灰度图二值化”,在说明书结尾描述的四个例子中将对“二值化”进行说明。
在这一系列明亮区域中,S2表示最大明亮区域的大小,S3表示第二大明亮区域的大小。照常,区域的大小为位于该区域内的像素的个数。关于如何在一系列明亮区域中识别最大和第二大区域,可以使用许多方法。例如,一种被称作“标记”(Labeling)的算法在此处是适用的,说明书结尾描述的四个例子中使用了该算法。
然后,在步骤107,判断S2与S1的比率(即S2/S1)是否大于或等于第二阈值。第二阈值的范围从0到0.1,并且优选取值0.003。步骤107的目的在于判断是否存在显著明亮区域。
如果步骤107的结果为“是”,流程进入步骤108;否则进入步骤112。
在步骤112,将候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
在步骤108,判断S3与S2的比率(即S3/S2)是否小于第三阈值。第三阈值的范围从0.2到0.8,并且优选取值0.5。步骤108的目的在于判断是否存在最显著明亮区域。
如果步骤108的结果为“是”,流程进入步骤109;否则进入步骤110。
如果流程进入步骤109,意味着在一系列明亮区域中存在最显著明亮的区域。如果这样,该明亮区域必为最大明亮区域。
在步骤109,判断该最大明亮区域的中心是否在嘴区域中。嘴区域是嘴邻近区域中的预定区域。关于嘴区域的定义,将在后面参照图4进行详细说明。
如果步骤109的结果为“否”,则流程进入步骤112,否则进入步骤113。
在步骤113,将候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
在步骤110,识别前两个最大明亮区域的中心之间的中点。然后,流程进入步骤111。
在步骤111,判断步骤110中识别的中点是否在嘴区域中。
如果步骤111的结果为“是”,则流程进入步骤113,否则进入步骤112。
步骤112或113之后,流程进入步骤114,在该步骤中,检测图像中的人脸的流程结束。
一旦检测出图像中的人脸,则可对图像或检测出的人脸进行进一步的处理。
图2是按照本发明的图像处理方法的第二种实施方式的流程图。
步骤201-205及步骤212-214与图1中的步骤101-105及步骤112-114相似,省略对它们的详细说明。
如上面参照图1所述,图2中使用的边缘信息是嘴邻近区域和嘴区域中的平均边缘强度。
具体而言,在步骤206,分别计算嘴区域和嘴邻近区域中的平均边缘强度,并分别表示为I1和I2。然后,在步骤207,判断I1和I2之差是否大于第四阈值。第四阈值的范围从0到50,并优选取值5。
如果步骤207的结果为“否”,则流程进入步骤212,否则进入步骤213。
图3A是示意框图,示出按照本发明的图像处理装置的结构。
如图3A所示,标号301表示候选人脸区域识别器;标号302表示分类器;标号303表示嘴邻近区域选取器;标号304表示嘴邻近区域处理器。
候选人脸区域识别器301用于识别图像中待处理的候选人脸区域。任何用于识别图像中候选人脸区域的常规算法都可被候选人脸区域识别器301采用,并且不构成对本发明的限制。
嘴邻近区域选取器303用于在由候选人脸区域识别器301已经识别出的候选人脸区域中选取嘴邻近区域。关于如何选择人脸中的嘴邻近区域,将在后面参照图4进行详细说明。
嘴邻近区域处理器304用于处理已经由嘴邻近区域选取器303选取出的嘴邻近区域,并且输出处理结果,该处理结果通常是由嘴邻近区域选取器303选取出的嘴邻近区域的某些特征值。
分类器302用于根据嘴邻近区域处理器304的输出,将由候选人脸区域识别器301已识别出的候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或假人脸。
通常,嘴邻近区域处理器304的输出是由嘴邻近区域选取器303选取出的嘴邻近区域的某些特征值,只要该等特征值对于分类器302而言足以将候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或假人脸。
虽然,图3A和图3B到图3D中示出,将由候选人脸区域识别器301识别出的候选人脸区域输入到分类器302,实际上这样做并不是必需的。重要的是,当分类器302从嘴邻近区域处理器304接收到输出(例如,一个候选人脸区域的特征值)时,分类器302将得知哪一个候选人脸区域被分类。
分类器302的分类结果可用于对图像进行进一步的处理。
应当注意,嘴邻近区域处理器304可将任何处理方法应用于嘴邻近区域,只要嘴邻近区域的处理结果对于分类器302而言,足以将候选人脸区域分类为一种极有可能是真人脸的候选人脸区域,一种极有可能是假人脸的候选人脸区域,真人脸或者假人脸。
图3B示意性示出图3A中所示的嘴邻近区域处理器的内部结构。
如果嘴邻近区域处理器304进行处理时使用边缘信息,嘴邻近区域处理器304将包括至少两个部件,即转换器305和边缘信息计算器306,如图3B所示。
转换器305接收由嘴邻近区域选取器303输出的嘴邻近区域或整个候选人脸区域,并至少将嘴邻近区域转换为边缘图。边缘图已在上面进行了说明。
边缘信息计算器306用于根据由转换器305形成的边缘图计算嘴邻近区域的边缘信息,并向分类器302输出边缘信息。
根据边缘信息的不同类型,边缘信息计算器306具有许多实施方式,其中的两个如图3C和图3D所示。
图3C示意性示出图3B中所示的边缘信息计算器的内部结构。
如图3C所示,边缘信息计算器306包括明亮区域识别器307和大小计算器308。明亮区域识别器307用于在由转换器305形成的边缘图中识别一系列明亮区域,每个明亮区域由特征值大于第一阈值的像素组成。
选择这样的像素的一种独特方法被称为“灰度图二值化”,将在本说明书结尾所描述的四个例子中进行说明。
大小计算器308,用于计算候选人脸区域的大小S1和最大明亮区域的大小S2。如果S2/S1小于第二阈值,分类器302将候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
大小计算器308也可以计算由明亮区域识别器307识别出的一系列明亮区域中的第二大明亮区域的大小S3。然后,如果S3/S2小于第三阈值,并且最大明亮区域的中心不在嘴区域中,则分类器302将该候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。嘴区域是嘴邻近区域中的预定部分,并将在后面参照图4对其进行说明。
如果S3/S2大于第三阈值,并且最大明亮区域的中心在嘴区域中,则分类器302将该候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
如果S3/S2不小于第三阈值,并且前两个最大明亮区域的中心之间的中点不在嘴区域中,则分类器302将候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
如果S3/S2不小于第三阈值,并且前两个最大明亮区域的中心之间的中点在上述嘴区域中,则分类器302将候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
图3D示意性示出图3B中所示的边缘信息计算器的另一内部结构。
如图3D所示,边缘信息计算器306包括边缘强度计算器309,其用于计算嘴邻近区域中的平均边缘强度(I2)和嘴区域中的平均边缘强度(I1)。
如果嘴区域中的平均边缘强度与嘴邻近区域中的平均边缘强度之差(I1-I2)不大于第四阈值,则分类器302将候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
如果嘴区域中的平均边缘强度与嘴邻近区域中的平均边缘强度之差(I1-I2)大于第四阈值,则分类器302将候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
图4示意性示出人脸中嘴邻近区域、嘴区域和眼区域(右眼区域和左眼区域)之间的关系。
标号401表示人脸,标号402表示嘴邻近区域,标号403表示嘴区域,标号404表示眼区域。
人脸401的宽度为W,人脸401的高度为H。
嘴邻近区域402的宽度为W2,嘴邻近区域402的高度为H1。
嘴区域403的宽度为W1,嘴区域403的高度最多为H1。
眼区域404的宽度为W4,眼区域404的高度为H 2。
眼区域404和人脸401的垂直边缘之间的间隔为W3,眼区域404和人脸401的上边缘之间的间隔为H 3。
上列宽度和高度满足下面等式:
H1=H*r1,0.1<r1<0.7
W1=W*r2,0.1<r2<0.7
W2=W*r3,0.2<r3<1
W3=W*r4,0<r4<0.2
W4=W*r5,0.1<r5<0.4
H2=H*r6,0.1<r6<0.4
H3=H*r7,0.2<r7<0.4
优选地,满足下面等式:
r1=0.3,
r2=0.5,
r3=0.7,
r4=0.125,
r5=0.25,
r6=0.25,
r7=0.3。
图1到图3中进行的对嘴邻近区域和嘴区域的选取,可以遵循上面的等式。
图5示出用于解释图1和图2所示方法的两个例子。
例1
如图5所示,首先识别一个候选人脸区域A1。对于候选人脸区域A1的灰度图,应用“索贝尔”算子,得到边缘图A2。这一过程对应于图1中的步骤105或图2中的步骤205。
然后,在边缘图A2中选取嘴邻近区域A7。这一过程对应于图1中的步骤104或图2中的步骤204。如上所述参照图1,步骤104和105的顺序并不重要。
然后,对于嘴邻近区域A7进行被称为“灰度图二值化”的过程。该过程对应于图1中的步骤106。
在该过程中,使用一个预定阈值。该阈值在图1的步骤106中被称为第一阈值。这里,第一阈值可以取固定值。优选地,第一阈值的范围从100到200。但是,根据两个眼区域A4的边缘强度的平均值而选择第一阈值的值更好。
令候选人脸区域A1的宽度为360,候选人脸区域A1的高度为450。常数r1,r2,...,r7取其优选值。则
H1=H*r1=450*0.3=135,
W1=W*r2=360*0.5=180,
W2=W*r3=360*0.7=252,
W3=W*r4=360*0.125=45,
W4=W*r5=360*0.25=90,
H2=H*r6=450*0.25=112.5,以及
H3=H*r7=450*0.3=135。
根据上述常数,得到如图5所示的嘴区域A6,嘴邻近区域A7,眼区域A4和A5。
令“灰度图二值化”的阈值为:
R9=(右眼区域的平均边缘强度
+左眼区域的平均边缘强度)/2×r8。
这里,r8为比例阈值,范围从0.4到13,并优选取值为0.8。
假设右眼区域A4的平均边缘强度为35,且左眼区域A 5的平均边缘强度为31。令r8=0.8。则,r9=(35+31)/2*0.8=26.4。
对嘴邻近区域A7进行“灰度图二值化”后,得到区域A8。
然后,对区域A8执行“标记”过程。“标记”过程用于计算位于区域A8中的明亮区域的个数、中心,以及每个明亮区域的大小。该过程对应于图1中的步骤106。
“标记”过程之后,计算出存在三个明亮区域,即,A9,A10,A11,如图5所示。A9,A10和A11的中心分别为:(165,364),(216,407)以及(180,397)。A9,A10和A11的大小分别为:574,490,728。
然后,判断在该三个明亮区域中是否存在显著明亮区域。A1的大小为S1=360×450=162000。最大明亮区域A11的大小为S2=728。则S2/S1=728/162000=0.00449。令第二阈值为0.003。则,S2/S1大于第二阈值。该过程对应于图1中的步骤107。
然后,判断是否存在最显著明亮区域。在A9,A10和A11中,前两个最大明亮区域为A9和A11,它们的大小分别为574和728。即,S2=728,S3=574。则S3/S2=574/728=0.7885。令第三阈值为0.5。则S3/S2大于第三阈值。该过程对应于图1中的步骤108。
然后,计算前两个最大明亮区域A9和A11的中心之间的中点。由于A9和A11的中心分别为(165,364)和(180,397),因此A9和A11中心之间的中点为((165+180)/2,(364+397)/2)=(172,380)。中点的位置表示为图5中的A12。该过程对应于图1中的步骤110。
由于中点位于嘴区域A6中,所以将候选人脸区域A1分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。该过程对应于图1中的步骤111和113。
例2
又如图5所示,识别候选人脸区域B1。对于候选人脸区域B1的灰度图,应用“索贝尔”算子,得到边缘图B2。
对嘴邻近区域B4执行“灰度图二值化”过程,得到B5。
对区域B5执行“标记”过程,计算出B5中没有明亮区域。
然后,将候选人脸区域B 1分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。该过程对应于图1中的步骤112。
例3
首先,识别候选人脸区域A1。然后,对候选人脸区域A1的灰度图,应用“索贝尔”算子,得到边缘图A2。该过程对应于图2中的步骤203和205。
然后,计算出嘴区域A6和嘴邻近区域A7的平均边缘强度为I1=28和I2=20。该过程对应于图2中的步骤206。
然后,判断I1和I2之差是否大于第四阈值,该阈值优选取值为5。由于I1-I2=28-20=8,其大于5,所以将候选人脸区域A1分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。该过程对应于图2中的步骤207和213。
例4
首先,识别一个候选人脸区域B1。其次,对候选人脸区域B1的灰度图,应用“索贝尔”算子,得到边缘图B2。
然后,计算出嘴区域B6和嘴邻近区域B7的平均边缘强度为I1=0和I2=0。该过程对应于图2中的步骤206。
然后,判断I1和I2之差是否大于第四阈值,该阈值优选取值为5。由于I1-I2=0-0=0,其小于5,所以将候选人脸区域B1分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。该过程对应于图2中的步骤207和213。
图6示意性示出图1和图2所示的每种方法可在其中实现的图像处理系统。图6中所示的图像处理系统包括CPU(中央处理单元)601,RAM(随机存取存储器)602,ROM(只读存储器)603,系统总线604,HD(硬盘)控制器605,键盘控制器606,串行接口控制器607,并行接口控制器608,显示器控制器609,硬盘610,键盘611,照相机612,打印机613和显示器614。在这些部件中,与系统总线604相连的有CPU601、RAM602、ROM603、HD控制器605、键盘控制器606,串行接口控制器607,并行接口控制器608和显示器控制器609。硬盘610与HD控制器605相连,键盘611与键盘控制器606相连,照相机612与串行接口控制器607相连,打印机613与并行接口控制器608相连,以及显示器614与显示器控制器609相连。
图6中每个部件的功能在本技术领域都是众所周知的,并且图6所示的体系结构也是常规的。这种体系结构不仅适用于个人计算机,而且适用于手持设备,诸如掌上电脑,PDA(个人数据助理),数码照相机,等等。在不同的应用中,图6中所示的某些部件可以被省略。例如,如果整个系统是一个数码照相机,并行接口控制器608和打印机613可以被省略,并且该系统可实现为单片机。如果应用软件被存储在EPROM或其他非易失性存储器中,HD控制器605和硬盘610可以被省略。
图6中所示的整个系统由通常作为软件存储在硬盘610中(或如上所述,存储在EPROM或其他非易失性存储器中)的计算机可读指令控制。软件也可从网络(图中未示出)下载。或者存储在硬盘610中,或者从网络下载的软件可被加载到RAM602中,并被CPU601执行,以便完成由软件确定的功能。
对于本领域内的熟练技术人员,无需创造性劳动即可在图1和图2所示的一个或多个流程图的基础上,开发出一种或多种软件。这样开发出的软件将执行如图1和图2所示的图像处理的方法。
在某种意义上,图6中所示的图像处理系统,如果得到根据图1和图2所示的流程图开发出的软件的支持,可以实现如图3A到图3D所示的图像处理装置同样的功能。
虽然,前述说明参照了本发明的特定实施例,但是本领域内熟练的技术人员应当理解,这些仅是举例进行说明,可以对这些实施例作出许多改变而不脱离本发明的原理,本发明的范围由所附权利要求书确定。

Claims (26)

1.一种图像处理方法,包括以下步骤:
识别上述图像中的候选人脸区域;
在上述候选人脸区域中选取嘴邻近区域;
处理上述嘴邻近区域;以及
根据上述处理步骤的结果,将上述候选人脸区域分类。
2.根据权利要求1所述的图像处理方法,其特征在于上述选取步骤选取一个嘴邻近区域,该区域的宽度是上述候选人脸区域宽度的r3倍,该区域的高度是上述候选人脸区域高度的r1倍,其中r3为大于0.2且小于1的常数,r1为大于0.1且小于0.7的常数。
3.根据权利要求2所述的图像处理方法,其特征在于上述r3等于0.7,且上述r1等于0.3。
4.根据权利要求1至3中任一权利要求所述的图像处理方法,其特征在于上述处理步骤包括以下步骤:
形成一张至少与上述嘴邻近区域相对应的边缘图;
根据上述边缘图,计算上述嘴邻近区域的边缘信息;
并且其特征在于上述分类步骤根据上述边缘信息将上述候选人脸区域分类。
5.根据权利要求4所述的图像处理方法,其特征在于上述计算边缘信息的步骤包括以下步骤:
从上述边缘图的对应于上述嘴邻近区域的部分中选取特征值大于第一阈值的象素,得到由如此选取的像素组成的一系列明亮区域;
计算上述候选人脸区域的大小S1和最大明亮区域的大小S2;
并且其特征在于上述分类步骤包括以下步骤:
如果S2/S1小于第二阈值,则将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
6.根据权利要求5所述的图像处理方法,其特征在于上述计算边缘信息的步骤还包括以下步骤:
计算第二大明亮区域的大小S3;
并且其特征在于上述分类步骤还包括以下步骤:
如果S3/S2小于第三阈值并且最大明亮区域的中心不在嘴区域中,这里的嘴区域是上述嘴邻近区域中的预定部分,则将上述候选人脸区域归类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
7.根据权利要求6所述的图像处理方法,其特征在于上述分类步骤还包括以下步骤:
如果S3/S2小于上述第三阈值并且上述最大明亮区域的上述中心在上述嘴区域中,则将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
8.根据权利要求5所述的图像处理方法,其特征在于上述计算边缘信息的步骤还包括以下步骤:
计算第二大明亮区域的大小S3;
并且其特征在于上述分类步骤还包括以下步骤:
如果S3/S2不小于第三阈值并且前两个最大明亮区域的中心之间的中点不在嘴区域中,这里的嘴区域是上述嘴邻近区域中的预定部分,则将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
9.根据权利要求8所述的图像处理方法,其特征在于上述分类步骤还包括以下步骤:
如果S3/S2不小于上述第三阈值并且上述前两个最大明亮区域的上述中心之间的上述中点在上述嘴区域中,则将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
10.根据权利要求4所述的图像处理方法,其特征在于上述计算边缘信息的步骤包括以下步骤:
计算上述嘴邻近区域中的平均边缘强度和嘴区域中的平均边缘强度,上述嘴区域是上述嘴邻近区域中的预定部分;
并且其特征在于上述分类步骤包括以下步骤:
如果上述嘴区域中的上述平均边缘强度与上述嘴邻近区域中的上述平均边缘强度之差不大于第四阈值,则将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
11.根据权利要求10所述的图像处理方法,其特征在于上述分类步骤还包括以下步骤:
如果上述嘴区域中的上述平均边缘强度与上述嘴邻近区域中的上述平均边缘强度之差大于上述第四阈值,则将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
12.根据权利要求6至9以及10至11中任一权利要求所述的图像处理方法,其特征在于上述嘴区域的宽度是上述候选人脸区域宽度的r2倍,且上述嘴区域的高度至多是上述候选人脸区域高度的r1倍,其中r2为大于0.1且小于0.7的常数,r1为大于0.1且小于0.7的常数。
13.根据权利要求12所述的图像处理方法,其特征在于上述r2等于0.5,且上述r1等于0.3。
14.一种图像处理装置,其特征在于包括:
候选区域识别器,用于识别上述图像中的候选人脸区域;
嘴邻近区域选取器,用于在由上述候选区域识别器识别出的上述候选人脸区域中选取嘴邻近区域;
嘴邻近区域处理器,用于处理由上述嘴邻近区域选取器选取的上述嘴邻近区域;以及
分类器,用于根据上述嘴邻近区域处理器的输出,将由上述候选区域识别器识别出的上述候选人脸区域分类。
15.根据权利要求14所述的图像处理装置,其特征在于上述嘴邻近区域选取器选取的嘴邻近区域的宽度是上述候选人脸区域宽度的r3倍,选取的嘴邻近区域的高度是上述候选人脸区域高度的r1倍,其中r3为大于0.2且小于1的常数,r1为大于0.1且小于0.7的常数。
16.根据权利要求15所述的图像处理装置,其特征在于上述r3等于0.7,且上述r1等于0.3。
17.根据权利要求14至16中任一权利要求所述的图像处理装置,其特征在于上述嘴邻近区域处理器包括:
转换器,用于将上述图像中至少覆盖上述嘴邻近区域的部分转换为边缘图;
边缘信息计算器,用于根据上述转换器输出的上述边缘图,计算上述嘴邻近区域的边缘信息;
并且其特征在于上述分类器根据由上述边缘信息计算器计算出的上述边缘信息将上述候选人脸区域分类。
18.根据权利要求17所述的图像处理装置,其特征在于上述边缘信息计算器包括:
明亮区域识别器,用于在上述边缘图中识别一系列明亮区域,每个明亮区域由特征值大于第一阈值的像素组成;
大小计算器,用于计算上述候选人脸区域的大小S1和最大明亮区域的大小S2;
并且其特征在于如果S2/S1小于第二阈值,则上述分类器将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
19.根据权利要求18所述的图像处理装置,其特征在于上述大小计算器还计算第二大明亮区域的大小S3;
并且其特征在于如果S3/S2小于第三阈值并且最大明亮区域的中心不在嘴区域中,则上述分类器将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域,上述嘴区域为上述嘴邻近区域的预定部分。
20.根据权利要求19所述的图像处理装置,其特征在于如果S3/S2小于上述第三阈值并且上述最大明亮区域的上述中心在上述嘴区域中,则上述分类器则将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
21.根据权利要求18所述的图像处理装置,其特征在于上述大小计算器还计算第二大明亮区域的大小S3;
并且其特征在于如果S3/S2不小于第三阈值并且前两个最大明亮区域的中心之间的中点不在嘴区域中,这里上述嘴区域是上述嘴邻近区域的预定部分,则上述分类器将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
22.根据权利要求21所述的图像处理装置,其特征在于如果S3/S2不小于上述第三阈值并且上述前两个最大明亮区域的上述中心之间的上述中点在上述嘴区域中,则上述分类器还将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
23.根据权利要求17所述的图像处理装置,其特征在于上述边缘信息计算器包括:
边缘强度计算器,用于计算上述嘴邻近区域中的平均边缘强度和嘴区域中的平均边缘强度,上述嘴区域为上述嘴邻近区域中的预定部分;
并且其特征在于如果上述嘴区域中的上述平均边缘强度与上述嘴邻近区域中的上述平均边缘强度之差不大于第四阈值,则上述分类器将上述候选人脸区域分类为假人脸,或者一种极有可能是假人脸的候选人脸区域。
24.根据权利要求23所述的图像处理装置,其特征在于如果上述嘴区域中的上述平均边缘强度与上述嘴邻近区域中的上述平均边缘强度之差大于上述第四阈值,则上述分类器还将上述候选人脸区域分类为真人脸,或者一种极有可能是真人脸的候选人脸区域。
25.根据权利要求19至22以及23至24中任一权利要求所述的图像处理装置,其特征在于上述嘴区域的宽度为上述候选人脸区域宽度的r2倍,且上述嘴区域的高度至多是上述候选人脸区域高度的r1倍,其中r2为大于0.1且小于0.7的常数,r1为大于0.1且小于0.7的常数。
26.根据权利要求25所述的图像处理装置,其特征在于上述r2等于0.5,且上述r1等于0.3。
CNB021600163A 2002-12-30 2002-12-30 图像处理方法及装置 Expired - Fee Related CN1282943C (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CNB021600163A CN1282943C (zh) 2002-12-30 2002-12-30 图像处理方法及装置
US10/704,591 US7403636B2 (en) 2002-12-30 2003-11-12 Method and apparatus for processing an image

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CNB021600163A CN1282943C (zh) 2002-12-30 2002-12-30 图像处理方法及装置

Publications (2)

Publication Number Publication Date
CN1512453A true CN1512453A (zh) 2004-07-14
CN1282943C CN1282943C (zh) 2006-11-01

Family

ID=32661105

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB021600163A Expired - Fee Related CN1282943C (zh) 2002-12-30 2002-12-30 图像处理方法及装置

Country Status (2)

Country Link
US (1) US7403636B2 (zh)
CN (1) CN1282943C (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286198B (zh) * 2004-01-27 2010-09-29 佳能株式会社 特征检测装置和特征检测方法
CN103077368A (zh) * 2011-10-25 2013-05-01 上海银晨智能识别科技有限公司 人脸图像的嘴部定位方法与装置、嘴形识别方法及系统
CN109919010A (zh) * 2019-01-24 2019-06-21 北京三快在线科技有限公司 图像处理方法及装置

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1282943C (zh) * 2002-12-30 2006-11-01 佳能株式会社 图像处理方法及装置
JP4242796B2 (ja) * 2004-03-12 2009-03-25 パナソニック株式会社 画像認識方法及び画像認識装置
US7693306B2 (en) * 2005-03-08 2010-04-06 Konami Gaming, Inc. System and method for capturing images from mobile devices for use with patron tracking system
JP2007206833A (ja) * 2006-01-31 2007-08-16 Toshiba Corp 生体照合方法および生体照合装置
US8682029B2 (en) * 2007-12-14 2014-03-25 Flashfoto, Inc. Rule-based segmentation for objects with frontal view in color images
US8411986B2 (en) * 2009-04-13 2013-04-02 Flashfoto, Inc. Systems and methods for segmenation by removal of monochromatic background with limitied intensity variations
US8670615B2 (en) * 2009-09-30 2014-03-11 Flashfoto, Inc. Refinement of segmentation markup
US9311567B2 (en) 2010-05-10 2016-04-12 Kuang-chih Lee Manifold learning and matting
US9536132B2 (en) * 2011-06-24 2017-01-03 Apple Inc. Facilitating image capture and image review by visually impaired users
CN109858384B (zh) * 2019-01-08 2023-10-27 平安科技(深圳)有限公司 人脸图像的捕捉方法、计算机可读存储介质及终端设备
CN111192241B (zh) * 2019-12-23 2024-02-13 深圳市优必选科技股份有限公司 一种人脸图像的质量评估方法、装置及计算机存储介质

Family Cites Families (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5689575A (en) * 1993-11-22 1997-11-18 Hitachi, Ltd. Method and apparatus for processing images of facial expressions
US5835616A (en) * 1994-02-18 1998-11-10 University Of Central Florida Face detection using templates
US5781650A (en) * 1994-02-18 1998-07-14 University Of Central Florida Automatic feature detection and age classification of human faces in digital images
US5512939A (en) * 1994-04-06 1996-04-30 At&T Corp. Low bit rate audio-visual communication system having integrated perceptual speech and video coding
US5852669A (en) * 1994-04-06 1998-12-22 Lucent Technologies Inc. Automatic face and facial feature location detection for low bit rate model-assisted H.261 compatible coding of video
US5870138A (en) * 1995-03-31 1999-02-09 Hitachi, Ltd. Facial image processing
GB2341231A (en) * 1998-09-05 2000-03-08 Sharp Kk Face detection in an image
KR100343223B1 (ko) * 1999-12-07 2002-07-10 윤종용 화자 위치 검출 장치 및 그 방법
JP2001216515A (ja) * 2000-02-01 2001-08-10 Matsushita Electric Ind Co Ltd 人物の顔の検出方法およびその装置
JP2001285787A (ja) * 2000-03-31 2001-10-12 Nec Corp 映像録画方法およびそのシステムとその記録媒体
EP1211640A3 (en) * 2000-09-15 2003-10-15 Canon Kabushiki Kaisha Image processing methods and apparatus for detecting human eyes, human face and other objects in an image
US7092554B2 (en) * 2001-05-01 2006-08-15 Eastman Kodak Company Method for detecting eye and mouth positions in a digital image
US7298412B2 (en) * 2001-09-18 2007-11-20 Ricoh Company, Limited Image pickup device, automatic focusing method, automatic exposure method, electronic flash control method and computer program
US7239726B2 (en) * 2001-12-12 2007-07-03 Sony Corporation System and method for effectively extracting facial feature information
US6879709B2 (en) * 2002-01-17 2005-04-12 International Business Machines Corporation System and method for automatically detecting neutral expressionless faces in digital images
CN1282943C (zh) * 2002-12-30 2006-11-01 佳能株式会社 图像处理方法及装置

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101286198B (zh) * 2004-01-27 2010-09-29 佳能株式会社 特征检测装置和特征检测方法
CN103077368A (zh) * 2011-10-25 2013-05-01 上海银晨智能识别科技有限公司 人脸图像的嘴部定位方法与装置、嘴形识别方法及系统
CN109919010A (zh) * 2019-01-24 2019-06-21 北京三快在线科技有限公司 图像处理方法及装置

Also Published As

Publication number Publication date
CN1282943C (zh) 2006-11-01
US20040131236A1 (en) 2004-07-08
US7403636B2 (en) 2008-07-22

Similar Documents

Publication Publication Date Title
CN1282943C (zh) 图像处理方法及装置
CN1213382C (zh) 用于从多值图象提取划线的设备
CN1139039C (zh) 图象中图形的提取和识别以及异常判定的方法和装置
CN1894703A (zh) 模式识别方法、设备以及程序
CN1276389C (zh) 图形对照装置及其图形对照方法
CN1828632A (zh) 目标检测装置、学习装置、目标检测系统及目标检测方法
CN1920539A (zh) 缺陷检测方法与缺陷检测装置
CN1271575C (zh) 硬币鉴别方法及装置
CN1822027A (zh) 灰度字符的精确分割装置及方法
CN1477852A (zh) 图像处理设备、图像处理方法以及图像处理程序的存储介质
CN101075872A (zh) 注册设备、对照设备、提取方法,和程序
CN1400807A (zh) 图象处理方法和设备,图象处理系统以及存储介质
CN1874418A (zh) 图像处理设备、图像处理方法以及图像处理程序
CN1667355A (zh) 图像识别方法和图像识别装置
CN1195284C (zh) 图像处理设备
CN101030257A (zh) 基于汉字特征的文档图像分割方法
CN1874450A (zh) 用于调节图像亮度的方法和装置
CN1310182C (zh) 用于增强文档图像和字符识别的方法和装置
CN1484165A (zh) 文件信息的输入设备,输入方法,输入程序以及记录介质
CN1288421C (zh) 距离检测装置、气囊控制装置以及距离检测方法
CN1734465A (zh) 用于处理图像的方法、装置和存储介质
CN1763765A (zh) 用于检测图像中的人脸肤色区域的方法、装置和存储介质
CN101052994A (zh) 图像处理装置、图像判断方法及程序
CN1306456C (zh) 图像处理方法和装置
CN1770202A (zh) 图像检查设备、方法、控制程序和计算机可读存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20061101

Termination date: 20151230

EXPY Termination of patent right or utility model