CN1241758A - 图像处理设备和方法,以及计算机可读存储器 - Google Patents

图像处理设备和方法,以及计算机可读存储器 Download PDF

Info

Publication number
CN1241758A
CN1241758A CN99108367A CN99108367A CN1241758A CN 1241758 A CN1241758 A CN 1241758A CN 99108367 A CN99108367 A CN 99108367A CN 99108367 A CN99108367 A CN 99108367A CN 1241758 A CN1241758 A CN 1241758A
Authority
CN
China
Prior art keywords
image
resolution
character
character recognition
identification
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN99108367A
Other languages
English (en)
Other versions
CN1149509C (zh
Inventor
金田北洋
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1241758A publication Critical patent/CN1241758A/zh
Application granted granted Critical
Publication of CN1149509C publication Critical patent/CN1149509C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/248Character recognition characterised by the processing or recognition method involving plural approaches, e.g. verification by template match; Resolving confusion among similar patterns, e.g. "O" versus "Q"
    • G06V30/2504Coarse or fine approaches, e.g. resolution of ambiguities or multiscale approaches

Abstract

一个输入图像被转换为预定格式的图像。一个最佳字符识别分辨率确定元件使用该转换图像确定在执行该输入图像的字符识别时所使用的最佳分辨率。一个字符识别电路在该确定结果的基础上执行字符识别。一个输出装置输出该识别结果。

Description

图像处理设备和方法,以及计算机可读存储器
本发明涉及一种图像处理设备和方法,以及一种计算机可读存储器。
具有字符识别功能的传统图像处理设备基本上可识别给定分辨率的一幅二进制图像。另一方面,字符识别精度与输入图像的分辨率密切相关。
然而,因为传统的图像处理设备只能识别给定分辨率的图像,从识别精度的角度来说,字符识别并不总是在最理想的状况下完成。
考虑到上述问题,本发明的目的在于提供一种能够改进字符识别精度的图像处理设备和方法,以及一种计算机可读存储器。
为了达到上述目的,根据本发明的图像处理设备由以下配置所构成。即:
图像处理设备包括:用于将输入图像转换成预定格式图像的转换装置;确定装置,用于通过该转换装置的转换的图像,确定在执行输入图像的字符识别时所使用的分辨率;识别装置,用于在确定装置的确定结果的基础上执行输入图像的字符识别;以及用于输出该识别装置的识别结果的输出装置。
为了达到上述目的,根据本发明的图像处理方法由以下配置所构成。即:
图像处理方法包括:将输入图像转换成预定格式图像的转换步骤;确定步骤,通过该转换步骤中所转换的图像,确定在执行输入图像的字符识别时所使用的分辨率的确定步骤;在该确定步骤的确定结果的基础上,执行输入图像的字符识别的识别步骤;以及输出该识别步骤的识别结果的输出步骤。
为了达到上述目的,根据本发明的计算机可读存储器由以下配置构成。即:
计算机可读存储器包括:将输入图像转换成预定格式图像的该转换步骤的程序代码;通过该转换步骤所转换的图像,确定在进行输入图像的字符识别时所使用的分辨率的该确定步骤的程序代码;在确定步骤的确定结果的基础上,进行输入图像字符识别的识别步骤的程序代码;以及输出该识别步骤的识别结果的输出步骤的程序代码。
为了达到上述目的,根据本发明的图像处理设备由以下配置构成。即:
图像处理设备包括:输入装置,用于输入包含一组图像的文件数据,这些文件数据是基于一个单一图像而产生,并具有不同的分辨率;确定装置,用于通过由该输入装置输入的该组图像,确定执行字符识别时所使用的分辨率;以及控制装置,用于控制把该分辨率作为确定装置的一个确定结果存储在该文件数据中。
为了达到上述目的,根据本发明的图像处理方法由以下配置构成。即:
图像处理方法包括这些步骤:
输入包含一组图像的文件数据,这些图像基于一个单一图像而产生,并具有不同的分辨率;以及对以下过程进行控制:通过该组图像确定执行字符识别时所使用的分辨率,和将该分辨率作为一个确定结果存储在文件数据中。
为了达到上述目的,根据本发明的计算机可读存储器由以下配置构成。即:
计算机可读存储器包括:输入包含一组图像的文件数据的输入步骤的程序代码,这些图像基于一个单一图像而产生,并具有不同的分辨率;通过该输入步骤输入的该组图像,确定进行字符识别时所使用的分辨率的该确定步骤的程序代码;以及将该分辨率作为确定步骤的一个确定结果存储在该文件数据中的该存储步骤的程序代码。
本发明的其他特点和优点,从以下结合附图的描述,会更加显而易见。其中,同样的参考字符在全部图中代表相同或类似的部件。
图1是一个方框图,显示根据本发明的第一个实施例的一个图像处理设备的功能配置;
图2是一个流程图,显示在本发明的第一个实施例中,由一个最佳字符识别分辨率确定电路执行的处理细节;
图3是一个流程图,显示在本发明的第一个实施例中,由一个字符识别电路执行的处理细节;
图4显示一个结构化图像文件的例子;
图5显示一个结构化图像文件的例子;
图6显示包含一组具有不同分辨率的图像的一个图像文件的例子;
图7显示一个图像分割成拼板状的例子;
图8是一个表格,显示一个图像内容属性集的例子;
图9是一个表格,显示一个子图像头部的例子;
图10是一个方框图,显示根据本发明的图像处理设备的硬件配置;和
图11是一个图表,显示平均相关值的迟滞性。
以下结合附图对本发明的优选实施例给以详细描述。
(第一个实施例)
图1是一个方框图,显示根据本发明的图像处理设备的功能配置。
参看图1,数字2表示一个扫描仪,用于输入一个原始图像。注意:该原始图像不必总是由扫描仪2输入。例如,由数字相机摄取的图像,存储在存储设备中的图像,均可输入。数字4表示一个FlashPix光栅器(rasterizer),用于将扫描仪2输入的图像转换成FlashPix图像,作为图像的一种文件格式。数字6表示一个图像存储器,用于存储由FlashPix光栅器4转换的FlashPix图像。
数字8表示一个最佳字符识别分辨率确定电路,用于确定在存储于图像存储器6中图像的基础上,对字符识别最佳的分辨率。数字10表示一个字符识别电路,用于在该最佳字符识别分辨率确定电路10的确定结果的基础上,对存储在图像存储器6中的图像进行最后的字符识别。数字12表示一个输出电路,用于输出该字符识别电路10的识别结果到一个存储设备,如:打印机、显示器、网络等等。
以下简述FlashPix文件格式的图像文件中(FlashPix是Eastman柯达公司的商品名称),存储在图像头部域中的图像属性信息和图像数据被进一步结构化,并存储成一个图像文件。图4和图5显示了该结构化图像文件。
对图像文件中的属性和图像数据使用“存储仓”和“信息流”来管理,对应于使用MS-DOS时的目录和文件。参看图4和图5,带阴影的方块是“存储仓”,不带阴影的方块是“信息流”。图像数据和图像属性信息存储在信息流中。图像数据按不同的分辨率分等级存储,具有相应分辨率的图像称为子图像,由其分辨率0,1,…,n-1和n表示。对每一分辨率的一个图像而言,读取该图像所必需的信息存储在一个子图像头部,图像数据本身存储在子图像数据中。
属性集按其使用目的和内容分类并定义各种属性信息,包括概要信息属性集,图像信息属性集,图像内容属性集,和扩展列表属性集。
(属性集的解释)
概要信息属性集对于FlashPix而言,并不是唯一的。例如,这个属性集对于微软公司的“结构化存储”是必须的,存储诸如标题、内容、作者、缩微图等该图像文件的信息。
图像内容属性集是描述图像数据存储方法的一个属性。这个属性描述图像数据的层数、宽度、高度、最大分辨率图像的颜色深度,具有相应分辨率的图像的信息,或者使用JPEG时,一个量化表或Huffman表的定义。图8显示该图像内容属性集的一个例子。
图像信息属性集存储了可在使用该图像时应用的有关信息,如表示图像抓取方法的信息,图像使用方法的信息等等。这类信息的一个例子如下:
有关该数字数据抓取/生成方法的信息(文件源)
有关版权的信息(知识产权)
有关图像内容(人物、地点等图像中的类似内容)的信息(内容描述)
有关图像摄取中使用的相机信息(照相机信息)
有关图像摄取时设定的(曝光值、快门速度、焦距、有无使用电子闪光灯等等)相机信息(每张照片相机设定值)
有关对于数字相机和马赛克过滤器而言唯一的分辨率信息(数字相机特征)
有关胶卷的生产商名称、产品名称、类型(正片/负片,彩色/黑白)等信息(胶卷信息)
有关当原始图像是一个文档或打印出的文件时类型和尺寸的信息(原始文档扫描信息)
有关所使用的扫描仪和软件,以及使用扫描仪扫描图像时操作者的信息(扫描设备)
扩展列表属性集是当不包括在FlashPix的基本规格中的信息要加入时所使用的一个域。
图5中显示的FlashPix图像浏览对象是一个图像文件,它存储了在显示图像和图像数据时所使用的一组浏览参考参数。浏览参数是当在图像显示中应用图像旋转,放大/缩小,移动,颜色转换,过滤等操作时所存储的一组处理系数。
来源/结果FlashPix图像对象是FlashPix图像的集合。来源FlashPix图像对象是必须的,而结果FlashPix图像对象是可选的。来源FlashPix图像对象存储原始图像,而结果FlashPix图像对象存储使用该浏览参数处理过的图像。来源/结果描述属性集是用于区别图像数据的属性集,并存储诸如图像ID,变化抑制属性集,最后修改日期等信息。
变形属性集存储诸如旋转、放大/缩小,移动,颜色转换矩阵,对比度调节值,过滤系数等仿射变形系数信息。
以下描述图像数据的处理。
图6显示了包括一组具有不同分辨率图像的图像文件的例子。参看图6,一个具有最大分辨率的图像,其尺寸为C×R(列×行),另一个最大图像的尺寸为C/2×R/2。类似地,重复缩小列和行的尺寸到1/2,直到列和行的尺寸相等或者小于64像素。
作为这种分级的结果,“每个图像文件的层数”,以及前述头部信息和每层图像的图像数据都要求作为一个图像的属性信息。上述图像内容属性集描述有关每个图像文件的层数,具有最大分辨率的图像的宽度和高度,或者具有相应分辨率的图像的宽度、高度、颜色深度,压缩格式等等的信息。如图8所示。
此外,每一分辨率的一个图像被分割成64×64拼板,如图7所示。当一个图像从其左上部分开始被依次分割成64×64拼板时,有些图像会在其右部和下端出现空白拼板。在这种情况下,通过重复插入最右端或最下端图像来构成64×64像素。在FlashPix中,每一拼板中的图像通过JPEG压缩、单一颜色压缩和非压缩中的一种而存储,注意:JPEG压缩是由ISO/IEC JTCl/SC29图标标准化了的方案,此处省略对该方案本身的描述。同样,单一颜色压缩也是一种方案,它是当该拼板由相同颜色构成时,用一种颜色表示给定拼板的颜色,而不记录个别的像素值。这个方案尤其适用于由计算机图形程序生成的图像。
这些分割的图像数据存储在一个子图像数据流中。全部的拼板数,个别拼板的大小,数据开始位置以及压缩方案都存储在子图像头部。图9显示这个子图像头部的一个例子。
以下描述图1所示的配置所进行的操作。
由扫描仪2输入的图像被FlashPix光栅器4转换成FlashPix图像,该FlashPix图像存储在图像存储器6中。最佳字符识别分辨率确定电路8从该图像存储器6读取相应分辨率的图像的预定部分,并执行该读取部分的字符识别。然后,电路8在相应字符识别结果的基础上确定最佳字符识别分辨率。
该字符识别电路10从该图像存储器6读取由该最佳字符识别分辨率确定电路8确定的具有最佳分辨率的一个图像,并执行整个读取图像的字符识别。以后将详细描述该最佳字符识别分辨率确定电路8和字符识别电路10的操作。输出电路12将字符识别电路10的字符识别结果转换成输出格式(文件,打印机,显示器,网络等等),并输出转换的结果。
图10显示根据本发明的图像处理设备的硬件配置。
以下结合附图1对附图10中的相应构件加以描述。数字101表示CPU(中央处理器),它根据存储在存储器(MEM)102和外部存储媒介103中的程序代码执行各种处理。以后将要描述的流程图所示的处理是在CPU101的控制下执行的。FlashPix光栅器4,最佳字符识别分辨率确定电路8和字符识别电路10都由CPU101实施。
数字102表示包括ROM和RAM在内的存储器。存储器102存储从图像输入装置104输入的图像,或是从另一个终端经由通信I/F108相连的通讯网络输入的图像,转换成FlashPix等文件格式的图像数据,字符识别电路10在字符识别中使用的字符词典数据,一个识别结果的候选字符组,在以后将要描述的处理中使用的各种参数,等等。存储器102有一个工作存储区,用于存储正在进行处理的数据。图像存储器6由这个存储器102实施。
数字103表示外部存储媒介,如CD-ROM,CD-R,FD等等,可从本实施例的设备分离。图像,控制程序的程序代码,处理结果的图像文件,文本等等可在或向这些外部存储媒介存储或读取。数字104表示一个图像输入装置,如扫描仪,数字相机等可以光学方式扫描原始图像的装置。扫描仪2与图像输入装置104相对应。数字105表示一个显示器,如CRT,液晶显示器等在处理期间显示图像,文本,消息的装置。同样,显示器105也显示在键盘107和操作窗口输入的数据。
数字106表示一个打印机,如LBP(激光打印机),喷墨打印机等用于记录图像,文本等内容的装置。数字107表示可以输入各种命令,字符代码等由操作员操作时输入的键盘。除键盘107以外,也可配备像鼠标,触摸板这样的坐标输入装置以输入坐标数据。数字108表示一个通讯I/F以经由一个通讯网络(公众网或LAN)与另一个终端交换数据,命令等。数字109表示一条总线,它允许各种构件彼此交换数据,命令等。
以下结合附图2和3详细描述由最佳字符识别分辨率确定电路8和字符识别电路10执行的处理。
图2是一张流程图,显示根据本发明的第一个实施例由最佳字符识别分辨率确定电路执行的处理细节。
在步骤S202中,存储器102存储将要在步骤S204中读取的FlashPix图像的读取分辨率,在该存储器102中的读取分辨率参数被设定成待处理的FlashPix图像的最大分辨率。在步骤S204中,读取具有某个分辨率的图像的预定区域,该分辨率由存储在图像存储器6中的FlashPix图像的读取分辨率参数表示。假定该预定区域在包含图像的文本块中是第一个块。在步骤S206中,读取图像被转换成二进制图像。在步骤S208中,该二进制图像经受一系列包括字符抽取和相关计算在内的,由字符识别电路10执行的字符识别操作。在步骤S210,相应字符的相关值的平均相关值被计算为与在步骤S204中读取的图像有关的字符识别评估值。这个平均相关值可由步骤S208中作为字符识别结果得到的第一个候选字符的所有类似值的叠加,再将总数除以字符数而得到。计算过的平均相关值,与图像分辨率相对应存储在存储器102中。
在步骤S212中检查步骤S204到步骤S210中计算平均相关值的过程是否对于待处理的FlashPix图像的包括最小分辨率在内的所有分辨率的图像都得到处理。如果确定所有分辨率的图像的平均相关值还没有被计算(在步骤S212中是“否”),则流程前进到步骤S214。在步骤S214中,按当前读取分辨率参数设定的分辨率被降低一个等级,并在存储器102中设定。此后,流程返回步骤S204。另一方面,如果确定所有分辨率的图像的平均相关值已经被计算(在步骤S212中是“是”),则流程前进到步骤S216。在步骤S216中,搜索存储在存储器102中的所有分辨率的图像的平均相关值以找出最大值,产生最大值的图像分辨率在存储器102中被设定成一个最佳字符识别分辨率,由此结束处理。
如果由检索找到的最大值小于预存储在存储器102中的一个给定的临界值,即:如果相似性很低,将在步骤S204中读取的区域被转换到另一个区域(如第二个抽取文本块),步骤S202到步骤S216中的过程可以重复。同样,在步骤S216中得到的最佳字符识别分辨率数据也可存储在FlashPix图像中。
附图3是一张流程图,显示根据本发明的第一个实施例由该字符识别电路执行的处理细节。
在步骤S302中,由该最佳字符识别分辨率确定电路8读取存储在存储器102中的最佳字符识别分辨率。在步骤S304中,具有读取最佳字符识别分辨率的FlashPix图像从图像存储器6中被读取。在步骤S306中,字符识别电路10执行从图像存储器6读取的整个图像的字符识别。识别结果的文本可以存储成一个FlashPix图像文件格式,或者由显示器105,打印机106,或通信I/F108输出。
如上所述,根据第一个实施例,该最佳字符识别分辨率确定电路8可以提前确定对字符识别而言最佳的分辨率,使用确定的分辨率的一个FlashPix图像完成字符识别,由此极大提高字符识别精度。
(第二个实施例)
第一个实施例的最佳字符识别分辨率确定电路8抽取一个图像的给定区域,以确定一个最佳字符识别分辨率。然而,本发明并不限于这种特定的方法。例如,如果将被字符识别的图像数据是包含多页的多页图像,可以抽取第一页以确定一个最佳字符识别分辨率,并且可以使用该确定的最佳字符识别分辨率对所有页的图像进行字符识别。
在第一和第二个实施例中,使用了FlashPix图像。然而,本发明不限于这种特定的图像格式。例如,也可使用另一种格式数据,CIFF(佳能图像格式文件),它可存储或生成一组不同分辨率的图像。
在第三个实施例中,该读取分辨率设定为步骤S202中的最大级,降低步骤S214中的分辨率来确定一个最佳字符识别分辨率。然而,本发明并不限于这种特定方法。例如,读取分辨率可以设定为步骤S202中的最低级,可通过逐级提高步骤S214中分辨率级来检查所有的分辨率,由此确定一个最佳字符识别分辨率。
在第一个实施例中,检测从所有分辨率的图像得到的平均相关值的最大值,产生该最大值的分辨率被确定为一个最佳字符识别分辨率。然而,本发明并不限于这种特定的方法。例如,可以控制在相应分辨率得到的平均相关值的迟滞性,当步骤S210中得到的值为峰值时,产生该值的图像的分辨率可以确定为一个最佳字符识别分辨率,计算下一个分辨率的一个图像的相关值的平均值的过程可以停止。附图11显示了当依次从最低分辨率级的图像计算平均相关值时,该平均相关值的迟滞性。当得到一个值1104,确定值1103与一个峰值相对应,并停止计算。
根据第一和第二个实施例,字符识别精度级对于一个相同图像的一组分辨率而言是有区别的,根据该差别结果选择具有最佳分辨率的一个图像,以执行字符识别,由此极大提高字符识别精度。
注意:本发明既可以适用于由一组装置(如一个主机,一个界面装置,一个读取器,一个打印机等等)组成的系统,也可适用于由单一装置(如复印机,传真设备等等)构成的设备。
本发明的目的还通过提供一种存储媒介而达到,该媒介可记录能实现上述实施例中系统或设备功能的软件程序的程序代码,由该系统或设备的计算机(或一个CPU或MPU)读取并执行存储在该存储媒介中的程序代码。上述流程图描述的处理步骤,按照该程序代码,在CPU的控制下得以执行。
在这种情况下,从该存储媒介读取的程序代码本身实现上述实施例的功能,存储该程序代码的存储媒介包含在本发明内。
作为提供程序代码的存储媒介,可以使用软盘,硬盘,光盘,磁光盘,CD-ROM,CD-R,磁带,固定存储卡,ROM等等。
上述实施例的功能不仅可以通过由计算机执行所读取的程序代码来实现,也可通过在该程序代码的指令基础上,由计算机上运行的OS(操作系统)执行的一些或全部实际的处理操作来实现。
此外,上述实施例的功能可以通过由配置在功能扩展板或功能扩展元件(这种扩展板是插在计算机中或与计算机相连,在从存储媒介读取的程序代码被写入该扩展板或元件的存储器中以后)上的CPU等所执行的一些或全部实际的处理操作来实现。
很明显,本发明可以有很多不同的实施例,而不与其精神和范围相分离,应当理解本发明包括但不限于所属权利要求中所限定的特定实施例。

Claims (40)

1.一种图像处理设备,包括:
转换装置,用于将输入图像转换成预定格式图像;
确定装置,用于通过该转换装置的转换的图像,确定在执行输入图像的字符识别时所使用的分辨率;
识别装置,用于在确定装置的确定结果的基础上执行输入图像的字符识别;以及
输出装置,用于输出该识别装置的识别结果。
2.根据权利要求1的设备,其中该转换装置将具有一组不同分辨率的图像转换成输入图像。
3.根据权利要求1的设备,其中该预定格式为FlashPix。
4.根据权利要求1的设备,其中该预定格式为CIFF。
5.根据权利要求1的设备,其中该确定装置以不同分辨率为单位执行该转换图像的字符识别,并在字符识别结果的基础上,确定在执行输入图像的字符识别时所使用的分辨率。
6.根据权利要求1的设备,其中该确定装置在以从字符识别结果得到的识别字符为单位的平均相关值的基础上,确定在执行输入图像的字符识别时所使用的分辨率。
7.根据权利要求1的设备,其中该字符识别装置执行具有由该确定装置确定的分辨率的图像的字符识别。
8.根据权利要求1的设备,其中该确定装置按照图像分辨率的升序执行字符识别,并确定在执行输入图像的字符识别时所使用的分辨率。
9.根据权利要求1的设备,其中该确定装置按照图像分辨率的降序执行字符识别,并确定在执行输入图像的字符识别时所使用的分辨率。
10.根据权利要求1的设备,其中该确定装置在确定从每一字符识别结果得到的相应识别字符的一个平均相关值为峰值时,停止确定。
11.一种图像处理方法,包括:
将输入图像转换成预定格式图像的转换步骤;
确定步骤,通过该转换步骤中所转换的图像,确定在执行输入图像的字符识别时所使用的分辨率的确定步骤;
在该确定步骤的确定结果的基础上,执行输入图像的字符识别的识别步骤;以及
输出该识别步骤的识别结果的输出步骤。
12.根据权利要求11的方法,其中该转换步骤包括将具有一组不同分辨率的图像转换成输入图像的步骤。
13.根据权利要求11的方法,其中该预定格式为FlashPix。
14.根据权利要求11的方法,其中该预定格式为CIFF。
15.根据权利要求11的方法,其中该确定步骤包括以不同分辨率为单位执行该转换图像的字符识别,并在字符识别结果的基础上,确定在执行输入图像的字符识别时所使用的分辨率的步骤。
16.根据权利要求11的方法,其中该确定步骤包括在以从字符识别结果得到的识别字符为单位的平均相关值的基础上,确定在执行输入图像的字符识别时所使用的分辨率的步骤。
17.根据权利要求11的方法,其中该识别步骤包括执行具有由该确定步骤确定的分辨率的图像的字符识别步骤。
18.根据权利要求11的方法,其中该确定步骤包括按照图像分辨率的升序执行字符识别,并确定在执行输入图像的字符识别时所使用的分辨率的步骤。
19.根据权利要求11的方法,其中该确定步骤包括按照图像分辨率的降序执行字符识别,并确定在执行输入图像的字符识别时所使用的分辨率的步骤。
20.根据权利要求11的方法,其中该确定步骤包括在确定从每一字符识别结果得到的相应识别字符的一个平均相关值为峰值时,停止确定的步骤。
21.一种计算机可读存储器,包括:
将输入图像转换成预定格式图像的该转换步骤的程序代码;
通过该转换步骤所转换的图像,确定在进行输入图像的字符识别时所使用的分辨率的该确定步骤的程序代码;
在确定步骤的确定结果的基础上,进行输入图像字符识别的识别步骤的程序代码;以及输出该识别步骤的识别结果的输出步骤的程序代码。
22.一种图像处理设备,包括:
输入装置,用于输入包含一组图像的文件数据,这些文件数据是基于一个单一图像而产生,并具有不同的分辨率;
确定装置,用于通过由该输入装置输入的该组图像,确定执行字符识别时所使用的分辨率;以及
控制装置,用于控制把该分辨率作为确定装置的一个确定结果存储在该文件数据中。
23.根据权利要求22的设备,其中该确定装置通过识别每一图像的一个部分区域中的字符,确定在执行字符识别时所使用的分辨率。
24.根据权利要求22的设备,其中该确定装置通过识别每一图像的一个文本块中的字符,确定在执行字符识别时所使用的分辨率。
25.根据权利要求22的设备,其中该确定装置从包含在该输入装置输入的文件数据中的图像确定在执行字符识别时所使用的图像。
26.根据权利要求22的设备,其中该确定装置以图像为单位执行部分区域的字符识别,并在字符识别结果的基础上,确定在执行字符识别时所使用的分辨率。
27.根据权利要求26的设备,其中当该确定装置确定的字符识别结果小于预定值时,通过执行与已经完成的字符识别区域不同的一个区域的字符识别,确定分辨率。
28.根据权利要求22的设备,还包括:
图像读取装置,用于从该文件数据中读取由该确定装置确定的分辨率的图像;
字符识别装置,用于执行由该图像读取装置读取的图像的字符识别;以及
显示装置,用于显示该字符识别装置的字符识别结果。
29.根据权利要求22的设备,还包括:
图像读取装置,用于从该文件数据中读取由该确定装置确定的分辨率的图像;
字符识别装置,用于执行由该图像读取装置读取的图像的字符识别;以及
喷墨打印机,用于记录该字符识别装置的字符识别结果。
30.根据权利要求22的设备,还包括:
图像读取装置,用于从该文件数据中读取由该确定装置确定的分辨率的图像;
字符识别装置,用于执行由该图像读取装置读取的图像的字符识别;以及
记录装置,用于记录该字符识别装置的字符识别结果。
31.一种图像处理方法,包括以下步骤:
输入包含一组图像的文件数据,这些图像基于一个单一图像而产生,并具有不同的分辨率;以及
控制通过该组图像确定执行字符识别时所使用的分辨率,和将该分辨率作为一个确定结果存储在文件数据中。
32.根据权利要求31的方法,其中在执行字符识别时所使用的分辨率是通过识别每一图像的一个部分区域中的字符来确定。
33.根据权利要求31的方法,其中在执行字符识别时所使用的分辨率是通过识别每一图像的一个文本块中的字符来确定。
34.根据权利要求31的方法,其中在执行字符识别时所使用的分辨率是从包含在该输入装置输入的文件数据中的图像而确定。
35.根据权利要求31的方法,其中一个部分区域的字符识别是以图像为单位而执行的,并在字符识别结果的基础上确定在执行字符识别时所使用的分辨率。
36.根据权利要求35的方法,其中当字符识别结果小于预定值时,通过执行与已经完成的字符识别区域不同的一个区域的字符识别,确定分辨率。
37.根据权利要求31的方法,还包括以下步骤:
从文件数据读取具有确定分辨率的图像,执行该读取图像的字符识别;以及
显示字符识别结果。
38.根据权利要求31的方法,还包括以下步骤:
从文件数据读取具有确定分辨率的图像,执行该读取图像的字符识别;以及
通过喷墨打印机记录字符识别结果。
39.根据权利要求31的方法,还包括以下步骤:
从文件数据读取具有确定分辨率的图像,执行该读取图像的字符识别;以及
记录字符识别结果。
40.一种计算机可读存储器,包括:
输入包含一组图像的文件数据的输入步骤的程序代码,这些图像基于一个单一图像而产生,并具有不同的分辨率;
通过该输入步骤输入的该组图像,确定进行字符识别时所使用的分辨率的该确定步骤的程序代码;以及
将该分辨率作为确定步骤的一个确定结果存储在该文件数据中的该存储步骤的程序代码。
CNB991083679A 1998-06-12 1999-06-11 图像处理设备和方法 Expired - Fee Related CN1149509C (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
JP16530298 1998-06-12
JP165302/1998 1998-06-12
JP131509/1999 1999-05-12
JP13150999A JP4338155B2 (ja) 1998-06-12 1999-05-12 画像処理装置及びその方法、コンピュータ可読メモリ

Publications (2)

Publication Number Publication Date
CN1241758A true CN1241758A (zh) 2000-01-19
CN1149509C CN1149509C (zh) 2004-05-12

Family

ID=26466328

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB991083679A Expired - Fee Related CN1149509C (zh) 1998-06-12 1999-06-11 图像处理设备和方法

Country Status (5)

Country Link
US (1) US6668101B2 (zh)
EP (1) EP0964353B1 (zh)
JP (1) JP4338155B2 (zh)
CN (1) CN1149509C (zh)
DE (1) DE69942165D1 (zh)

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100345158C (zh) * 2001-07-12 2007-10-24 杜莱布斯公司 用于产生涉及几何失真的格式化信息的方法和系统
CN102567947A (zh) * 2012-01-12 2012-07-11 惠州Tcl移动通信有限公司 一种移动终端中图像处理方法及移动终端
CN102750689A (zh) * 2011-04-20 2012-10-24 佳能株式会社 图像处理设备及其控制方法
CN103136559A (zh) * 2011-11-30 2013-06-05 北大方正集团有限公司 可变条码的光栅化方法和装置

Families Citing this family (29)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6891972B2 (en) * 1997-12-19 2005-05-10 Canon Kabushiki Kaisha Communication system and control method thereof, and computer-readable memory
US20010019424A1 (en) * 2000-03-06 2001-09-06 Takenori Idehara Image-forming devices portable telephones, image-processing devices, image-processing methods, and computer program product
FR2827460B1 (fr) * 2001-07-12 2004-10-29 Poseidon Procede et systeme pour fournir, selon un format standard, a des logiciels de traitement d'images des informations liees aux caracteristiques des appareils de capture d'image et/ou des moyens de resti
JP4295612B2 (ja) * 2001-07-12 2009-07-15 ディーエックスオー ラブズ 書式付き情報をイメージ処理手段に供給する方法およびシステム
FR2827459B1 (fr) * 2001-07-12 2004-10-29 Poseidon Procede et systeme pour fournir a des logiciels de traitement d'image des informations formatees liees aux caracteristiques des appareils de capture d'image et/ou des moyens de restitution d'image
US6922487B2 (en) * 2001-11-02 2005-07-26 Xerox Corporation Method and apparatus for capturing text images
US7343052B2 (en) * 2002-04-09 2008-03-11 Sonic Solutions End-user-navigable set of zoomed-in images derived from a high-resolution master image
US20040047519A1 (en) * 2002-09-05 2004-03-11 Axs Technologies Dynamic image repurposing apparatus and method
JP4064196B2 (ja) * 2002-10-03 2008-03-19 株式会社リコー クライアントコンピュータ、サーバコンピュータ、プログラム、記憶媒体、画像データ処理システム及び画像データ処理方法
FR2851357B1 (fr) * 2003-02-19 2005-04-22 Solystic Procede pour la reconnaissance optique d'envois postaux utilisant plusieurs images
US20040210444A1 (en) * 2003-04-17 2004-10-21 International Business Machines Corporation System and method for translating languages using portable display device
JP2005084948A (ja) * 2003-09-09 2005-03-31 Hitachi Ltd 情報処理装置、情報処理方法及び情報処理システム
FR2899359B1 (fr) * 2006-03-28 2008-09-26 Solystic Sas Procede utilisant la multi-resolution des images pour la reconnaissance optique d'envois postaux
US7953295B2 (en) * 2006-06-29 2011-05-31 Google Inc. Enhancing text in images
US8031940B2 (en) * 2006-06-29 2011-10-04 Google Inc. Recognizing text in images using ranging data
US8098934B2 (en) 2006-06-29 2012-01-17 Google Inc. Using extracted image text
JP4986279B2 (ja) * 2006-09-08 2012-07-25 任天堂株式会社 ゲームプログラムおよびゲーム装置
US8000554B2 (en) * 2007-04-04 2011-08-16 Xerox Corporation Automatic dynamic range adjustment in digital imaging
US8611661B2 (en) * 2007-12-26 2013-12-17 Intel Corporation OCR multi-resolution method and apparatus
US8064733B2 (en) * 2008-06-24 2011-11-22 Microsoft Corporation Variable resolution images
US7983512B2 (en) * 2008-06-24 2011-07-19 Microsoft Corporation Embedding large images within one another
US7933473B2 (en) * 2008-06-24 2011-04-26 Microsoft Corporation Multiple resolution image storage
GB201203883D0 (en) * 2012-03-05 2012-04-18 King S College London Method and system to assist 2D-3D image registration
JP6049437B2 (ja) 2012-12-14 2016-12-21 キヤノン株式会社 画像処理装置、画像処理方法、コンピュータプログラム
JP6001008B2 (ja) * 2014-06-06 2016-10-05 キヤノン株式会社 画像読取装置、画像読取装置の制御方法、プログラム、及び記憶媒体
JP6705984B2 (ja) * 2015-03-31 2020-06-03 キヤノンマーケティングジャパン株式会社 情報処理装置と、その処理方法及びプログラム
US10866184B2 (en) * 2015-11-06 2020-12-15 California Institute Of Technology Devices and methods for direct visual detection and readout of single nucleic acid molecules
WO2017109998A1 (ja) 2015-12-25 2017-06-29 株式会社Pfu モバイル端末、画像処理方法、および、プログラム
JP7326779B2 (ja) * 2019-03-11 2023-08-16 富士フイルムビジネスイノベーション株式会社 画像形成装置及びプログラム

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5943480A (ja) * 1982-09-03 1984-03-10 Ricoh Co Ltd 文字認識方法
WO1990001198A1 (en) * 1988-07-20 1990-02-08 Fujitsu Limited Character recognition apparatus
US5361309A (en) * 1989-09-07 1994-11-01 Canon Kabushiki Kaisha Character recognition apparatus and method with low-resolution storage for character extraction
US5309548A (en) * 1989-09-21 1994-05-03 Canon Kabushiki Kaisha Pattern generating method and apparatus
US5214717A (en) * 1990-02-26 1993-05-25 Fujitsu Limited Pattern recognition data processing device using an associative matching method
US5091968A (en) * 1990-12-28 1992-02-25 Ncr Corporation Optical character recognition system and method
US5317654A (en) * 1991-09-26 1994-05-31 Inscerco Mfg. Inc. Selective collating and inserting apparatus
TW222337B (zh) * 1992-09-02 1994-04-11 Motorola Inc
US5337372A (en) * 1992-10-13 1994-08-09 At&T Bell Laboratories Method and apparatus for symbol recognition using multidimensional preprocessing at multiple resolutions
JP2979109B2 (ja) * 1992-12-03 1999-11-15 日本アイ・ビー・エム 株式会社 認識文字の情報作成方法及び装置
JPH06274680A (ja) * 1993-03-17 1994-09-30 Hitachi Ltd 文書認識方法およびシステム
JPH07152865A (ja) 1993-11-30 1995-06-16 Canon Inc 情報認識装置及びその方法
EP0677811A1 (en) * 1994-04-15 1995-10-18 Canon Kabushiki Kaisha Image processing system with on-the-fly JPEG compression
US5970170A (en) * 1995-06-07 1999-10-19 Kodak Limited Character recognition system indentification of scanned and real time handwritten characters
TW347503B (en) * 1995-11-15 1998-12-11 Hitachi Ltd Character recognition translation system and voice recognition translation system
US5784487A (en) * 1996-05-23 1998-07-21 Xerox Corporation System for document layout analysis
JPH1132287A (ja) * 1997-07-08 1999-02-02 Fuji Photo Film Co Ltd 画像ファイル作成方法および装置
US6041143A (en) * 1998-04-14 2000-03-21 Teralogic Incorporated Multiresolution compressed image management system and method

Cited By (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100345158C (zh) * 2001-07-12 2007-10-24 杜莱布斯公司 用于产生涉及几何失真的格式化信息的方法和系统
CN102750689A (zh) * 2011-04-20 2012-10-24 佳能株式会社 图像处理设备及其控制方法
US9405961B2 (en) 2011-04-20 2016-08-02 Canon Kabushiki Kaisha Information processing apparatus, distributing identicial image data in parallel for object detection and resolution conversion
CN102750689B (zh) * 2011-04-20 2016-12-14 佳能株式会社 图像处理设备及其控制方法
CN103136559A (zh) * 2011-11-30 2013-06-05 北大方正集团有限公司 可变条码的光栅化方法和装置
CN103136559B (zh) * 2011-11-30 2016-01-20 北大方正集团有限公司 可变条码的光栅化方法和装置
CN102567947A (zh) * 2012-01-12 2012-07-11 惠州Tcl移动通信有限公司 一种移动终端中图像处理方法及移动终端

Also Published As

Publication number Publication date
EP0964353A3 (en) 2001-05-23
JP4338155B2 (ja) 2009-10-07
JP2000067155A (ja) 2000-03-03
US20020122590A1 (en) 2002-09-05
EP0964353A2 (en) 1999-12-15
CN1149509C (zh) 2004-05-12
DE69942165D1 (de) 2010-05-06
US6668101B2 (en) 2003-12-23
EP0964353B1 (en) 2010-03-24

Similar Documents

Publication Publication Date Title
CN1149509C (zh) 图像处理设备和方法
US7593961B2 (en) Information processing apparatus for retrieving image data similar to an entered image
US8339619B2 (en) System and image processing method and apparatus for re-using and re-editing images
JP4181892B2 (ja) 画像処理方法
US7548916B2 (en) Calculating image similarity using extracted data
US7805022B2 (en) Image processing apparatus, image processing method and computer program
US7596271B2 (en) Image processing system and image processing method
US10477063B2 (en) Character detection and binarization
JP2004265384A (ja) 画像処理システム及び情報処理装置、並びに制御方法及びコンピュータプログラム及びコンピュータ可読記憶媒体
US20080174815A1 (en) Image forming apparatus capable of creating electronic document data with high browsing capability
JP2000306103A (ja) 情報処理装置及び方法
JPH0879536A (ja) 画像処理方法
US6714682B2 (en) Image processing device and method and memory medium
JP2004246577A (ja) 画像処理方法
CN1711558A (zh) 相似图像提取装置、相似图像提取方法以及相似图像提取程序
JP5178490B2 (ja) 画像処理装置、画像処理方法、コンピュータプログラム
US20090290797A1 (en) Image processing for storing objects separated from an image in a storage device
JP4569162B2 (ja) 画像処理方法、画像処理プログラムおよび画像処理装置
TW200811726A (en) Method and apparatus for processing image with picture and characters
JP2006134042A (ja) 画像処理システム
JP4310176B2 (ja) 画像処理装置、画像処理方法およびプログラム
JP2002024766A (ja) 文字認識装置及び方法
JP2000187670A (ja) 画像処理装置及びその方法、コンピュータ可読メモリ
JP2002236921A (ja) 文書画像認識方法、文書画像認識装置及び記録媒体
Arora Digitisation: Methods, Tools and Technology

Legal Events

Date Code Title Description
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C06 Publication
PB01 Publication
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20040512

Termination date: 20150611

EXPY Termination of patent right or utility model