CN1046624A - 数据识别设备 - Google Patents

数据识别设备 Download PDF

Info

Publication number
CN1046624A
CN1046624A CN90103625A CN90103625A CN1046624A CN 1046624 A CN1046624 A CN 1046624A CN 90103625 A CN90103625 A CN 90103625A CN 90103625 A CN90103625 A CN 90103625A CN 1046624 A CN1046624 A CN 1046624A
Authority
CN
China
Prior art keywords
local mode
data
character
input pattern
stroke
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN90103625A
Other languages
English (en)
Other versions
CN1021937C (zh
Inventor
杉山光正
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Canon Inc
Original Assignee
Canon Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Canon Inc filed Critical Canon Inc
Publication of CN1046624A publication Critical patent/CN1046624A/zh
Application granted granted Critical
Publication of CN1021937C publication Critical patent/CN1021937C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/24Character recognition characterised by the processing or recognition method
    • G06V30/242Division of the character sequences into groups prior to recognition; Selection of dictionaries

Landscapes

  • Engineering & Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Discrimination (AREA)

Abstract

一数据识别设备包括用于输入模式数据的输入装置,在输入模式数据中识别局部模式数据和选择用于输入模式数据识别的备用局部模式数据的选择装置。该设备还包括两个比较装置。第一比较装置将被选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较。第二比较装置根据由第一比较装置得出的比较结果将备用局部模式数据与输入模式数据中的局部模式数据部分进行比较。该设备此外还包括判断在根据第一和第二比较装置的比较结果选出的备用局部模式数据中的识别结果的判断装置。

Description

本发明涉及一种数据识别设备,特别涉及一种书写数据,例如:手写的字符、符号,图形等的设备。
通常这类设备使用的方法是在数据板等上输入笔尖的坐标和笔尖的上-下数据,然后识别书写在数据板上的字符。对于在线的数字符识别,为了应付中文识别的处理容量的增加,对于上述方法已提出了在将输入数据的特征与字典的字符数据比较之前根据中文的偏旁或部首先进行局部模式的识别,选出待比较的字符数据并且将输入数据与较少数目的字符数据进行比较,因此,缩短识别时间的要求。
但是,在上述的常规系统中,是对整个字符进行比较,因此还不能有效地缩短识别时间。具体来说,即使给定的字符已知还不可能识别,直到处理过程一直进行到整个字符的比较完了为止才行,因此耗费了时间。
本发明是针对上述情况的。其目的是提供一种数据识别设备。该设备通过以更高的效率执行识别操作,缩短了识别时间。
为了解决上述问题和实现上述目的,本发明的数据识别设备其特征为一输入装置输入模式数据;一选择装置,在输入的模式数据中识别局部模式数据并且选择出为识别输入模式数据所使用的备用局部模式数据;第一比较装置,将选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较;第二比较装置,将根据由第一比较装置得出的比较结果选出的备用局部模式数据与输入模式数据中的局部模式数据部分进行比较以及判断装置,判断在如上所述根据由第一和第二比较装置得出的结果选出的备用局部模式数据中的识别结果。
如上所述,本发明的目的是提供一数据处理设备,该设备中的输入装置输入模式数据,选择装置识别在输入的模式数据中的局部模式数据的一部分并且选择用于识别输入模式数据的备用局部模式数据,第一比较装置将选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较,第二比较装置将根据由第一比较装置得出的比较结果选出的备用局部模式数据与输入模式数据中的局部模式数据部分进行比较,判断装置判断在根据第一和第二比较装置得出的结果选出的备用局部模式数据中的识别结果。
如上所述,本发明更进一步的目的是提供一数据识别设备,该设备包括提取与输入部分的位置坐标和上-下数据有关的输入模式的特征的提取装置,存储模式数据的字典装置,存储局部模式数据的局部模式字典装置和限制根据被提取装置提取的模式的特征和存储在局部模式字典装置中的局部模式数据而将要与模式特征进行比较并且将存储在局部模式字典装置中的模式数据的装置。
图1为表示现行实施例的数据识别设备的构成的方框图;
图2到图4示出了现行实施例的局部模式字典的内容;
图5示出了字符字典8的内容;
图6为现行实施例的整个字符识别过程各步骤的流程图。
图7为现行实施例的局部模式识别过程各步骤的流程图。
图8为现行实施例的字符识别过程各步骤的流程图;
图9是说明比较过程的改进实施例的流程图。
下面参看附图对本发明的最佳实施例进行详细的描述。对于现行实施例的数据识别设备,将汉字或中文字符的识别作为书写数据。
图1是表明现行实施例的数据识别设备的构成的方框图而图2到图4示出了现行实施例的局部模式字典7中的内容。在图中,1代表检测坐标位置和输入书写数据的数据板,数据板1使用压敏导电橡胶(或者超声数字转换器)。2代表在数据板1上标明坐标位置的输入笔,3代表特征提取器,该特征提取器3归一化一个字符的书写数据(输入模式)的位置和大小并且提取诸如笔划数,每一笔划末端的坐标,每一笔工的形状特性等特征。4代表局部模式识别器、该局部模式识别器4已通过数据板1输入的一个汉字的书写数据,就是说,根据输入模式与汉字的偏旁或部首相应的局部模式的形状。7代表局部模式字典7,该局部模式字典7寄存用于识别局部模式识别器4中的如图2所示的局部模式的形状的局部模式,局部模式与局部模式码相对应。在局部模式字典7中寄存有对应于局部模式码的给定的局部模式的笔划数和位置码(图3)。就该位置码而言,“1”表示字符书写开始的局部模式,“2”表示字符书写结束的局部模式。例如,当局部模式具有偏旁“亻”时。局部模式码为“1”(图2)笔划数为“2”位置码为“亻”。对于局部模式字典7,当偏旁是“亻”时,如图4所示,相应于局部模式码“1”第一笔划的开始点坐标(30,92)结束点坐标(5,46),第二笔划的开始点坐标(21,63)结束点坐标(22,3)作为“亻”的位置坐标来储存,并且当局部模式“亻”寄存在局部模式字典7中时,存储偏差阈值56来识别输入模式。该阈值是一与输入模式的笔划和寄存在局部模式字典7中的偏旁“亻”的局部模式之间的间距之和进行比较的数值。
5代表字符识别器,该字符识别器识别字符的与由局部模式识别器识别的局部模式不同的那部分并且根据这种识别结果,输入模式的形状被识别为字符。8代表字符字典,字符识别器识别字符所用的字符数据,如图5所示存储在该字符字典中。
图5示出了字符字典8的内容。在图5中,100代表局部模式的笔划数的项目表,101是例如存储了10笔划的局部模式的局部模式项目表,102代表存储了具有局部模式“亻”的汉字的汉字项目表,103代表存储了汉字“倍”(读作“bai”意为“两倍”)的字符码和组成汉字“倍”的每一笔划的开始点和结束点的位置坐标(X,Y)的笔划数据项目表。在该笔划项目表103中,坐标的位置根据笔顺存储。局部模式字典7和字符字典8在此合并称为字典6。
下面描述现行实施例的字符识别过程。
图6为现行实施例的整个字符识别过程各步骤的流程图。
当在数据板1输入一字符模式时,特征提取器3提取输入模式的特征(步骤S1,步骤S2)。局部模式识别器4根据提取的特征对输入模式的局部模式进行识别(步骤S3)。然后在字符识别器5中根据已识别的局部模式对具有较小偏差的字符进行识别(步骤S4)和在显示器9上显示上述识别结果(步骤S5)。
下面更详细地描述上述步骤S3的局部模式识别过程和步骤S4的字符识别过程。
首先描述局部模式识别过程。
图7为现行实施例的局部模式识别过程各步骤的流程图。
在步骤S301中从由特征提取器3根据存储在局部模式字典7中的笔划数和位置码提取出的输入笔划中分离出对应于局部模式的笔划(步骤S301)并且获得所分离笔划的开始点和结束点与局部模式之间间距之和(步骤S302)。由此获得的局部模式和对应于这一局部模式的笔划之间的间距与这一局部模式所储存的阈值进行比较(步骤S303),如果这一间距小于该阈值,则将在此时间点上已跟输入笔划进行了比较的局部模式的局部模式码送往下一级的字符识别器5(步骤S304)。从步骤S301开始的上述处理步骤不断重复直到与所有应进行比较的局部模式的比较完了为止(步骤S305)。如果在步骤S303中局部模式和对应于这一局部模式的笔划之间的间距被判别为大于阈值,则返回到步骤S301并重复相同的处理。
在上述局部模式处理过程中,虽然没有在上面说明,但可以使当对一给定的输入模式的局部模式识别不可能时,判断输入为错误输入而中止处理过程。
下面描述字符识别过程。
图8为现行实施例的字符识别过程各步骤的流程图。
首先进行予置,定出表明最小差值的参数能够设定的最大电平值(步骤S401)。然后根据由局部模式识别器4发送过来的第一个备用局部模式,获得对应于在字符字典8中项目表102上的字符的项目地址和字符数目(步骤S402)。再存储备用局部模式的位置码和笔划数(步骤S403)。
然后将输入笔划中非局部模式部分的笔划与项目表102上的第一个字符进行比较,并获得上述笔划的开始点和结束点和第一个字符的开始点和结束点之间的间距(步骤S404),如此获得的间距之和作为“剩余模式间距”(步骤S405)。然后比较前面获得的最小差值参数和在步骤S405获得的剩余模式间距值(步骤S406)。到目前步骤为止,因为是第一轮比较,最小差值定为较大电平,因此剩余模式间距被判别为较小值(步骤S407)。因此到达步骤S408,根据在步骤S403,存储的备用局部模式的位置码和笔划数一个笔划一个笔划地获得字符和已进行了比较的那部分局部模式之间的间距,然后这样就获得了笔划到笔划间距之和值并且该值被认作局部模式间距(步骤S409)。
然后分别在步骤S405和步骤S409获得的剩余模式间距和局部模式间距被求和并且该值被认作被比较的字符的差值(步骤S410)。比较前面的最小差值和在步骤S410获得的差值(步骤S411),结果就是与输入笔划的形状偏差较小的字符被作为具有最小差值的字符来存储(步骤S412)。这时在当前比较中使用的字符被作为具有最小差值的字符来存储。如上所述,当一个字符数据的比较结束时,从步骤S404开始的各步骤不断重复直到与在同一备用局部模式中的所有字符的比较完毕为止(步骤S413)。第二次比较以及根据输入模式和字典中的字符,先前的最小差值与在步骤S407处理的剩余模式间距进行比较具有先前的最小差值的字符的偏差与在步骤S412处理的字符的偏差进行比较。
如上所述,当备用局部模式的比较完毕(步骤S413)并且如果还有备用模式的话(步骤S414),则返到步骤S402并重复上述处理步骤。当对所有备用局部模式的比较都已结束(步骤S414),则具有最小偏差的字符被确认为识别的结果并在显示器9上输出(步骤S415)。
如上所述,根据现行实施例,通过更有效地完成识别过程可以缩短识别时间。
在上述实施例中,当与输入模式比较的字符的剩余模式间距大于先前的最小差值时,输入模式的特征与字典中正进行比较的字符的比较中断,但本发明不局限于此种情形,比较可以以如下的方式中断。
图9为说明比较过程的改进实例的流程图。
此时,每组局部模式的局部模式笔划的平均位置数据存储在字符字典8中项目表101的每一局部模式的上部。在局部模式识别过程中,对于输入模式和字典中局部模式的比较(图7的步骤S302),首先获得输入模式的每一笔划和局部模式的每一笔划的平均位置数据之间的间距,并且这些间距之和被作为平均位置数据的差值。作为字符识别的方法,这就意味着对已在上述实施例的例子中进行了描述的图8中流程的步骤S409进行改进。当过程根据这种方法进行到步骤S408时,如图9所示就获得了局部模式的每一笔划和存储在字典中的字符的每一笔划之间的间距之和值,该和值称为局部模式间距l1(步骤S501)。然后从当前最小差值中减去平均位置数据的差值。上述减去的结果称为l2(步骤S502)。仅当局部模式间距l1大于通过从当前最小差值减去平均位置数据的差值获得的值l2时,过程才到达图8所示的步骤S413,与当前进行比较的字符的比较中止。如果局部模式间距l1小于通过从当前最小差值减去平均位置数据的差值获得的值l2时,则过程从图8所示的步骤S410开始继续进行(步骤S503)。
即使应用这种方法,也可获得与在上述实施例的例子中获得的相同的功能和效果。
或者,系统可以这样设置使得在输入模式和字符字典8中的字符数据的比较中,当剩余模式间距大小由输入模式的笔划或字符数据的笔划确定的某一值时,中止后面的输入模式特征和字符数据的比较。
此外,在上述实施例的例子中,字符字典8中相对于输入模式的非局部模式的每一笔划具有最小笔划-笔划间距的笔划被认作对应笔划,但是可以这样改进,通过将局部模式的笔划数和位置码作为
输入模式,使和非局部模式中的输入模式的具有最小笔划-笔划间距的输入笔划可被认作对应笔划。例如在“倍”(读作“bai”意为“两倍”)和输入数据的特征的比较中,对“倍”的非局部模式部分的每一笔划,得到输入数据的非前两笔的笔划和笔划-笔划间距并且具有最小笔划-笔划间距的输入笔划被认作对应笔划。
在上述实施例的例子中,在显示器9上输出字符识别的结果,但是也可在例如打印机这样的设备上输出字符识别结果,这是不言而喻的。
如上所述,根据本发明,通过更有效地执行识别过程可缩短识别时间。

Claims (2)

1、数据识别设备,包括:
用于输入模式数据的装置;
用于在输入模式数据中识别局部模式数据和选择用于输入模式数据的识别的备用局部模式数据的选择装置;
用于将被选出的备用局部模式数据与输入模式数据中的非局部模式数据部分进行比较的第一比较装置;
用于根据由第一比较装置得出的比较结果将被选出的备用局部模式与输入模式数据中的局部模式数据部分进行比较的第二比较装置;以及
用于判断在根据由第一比较装置和第二比较装置得出的比较结果选出的备用局部模式数据中的识别结果的判断装置。
2、数据识别设备,包括:
用于提取与输入部分的位置坐标和上一下数据有关的输入模式的特征的提取装置;
用于存储模式数据的字典装置;
用于存储局部模式数据的局部模式字典装置;
以及用于限制根据被提取装置提取的模式特征和存储在局部模式字典装置中的局部模式数据而将要与模式特征进行比较并且将存储在字典装置中的模式数据的装置。
CN90103625A 1989-04-06 1990-04-06 数据识别设备 Expired - Fee Related CN1021937C (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
JP085655/89 1989-04-06
JP1085655A JP2651009B2 (ja) 1989-04-06 1989-04-06 情報認識装置
JP89-085655 1989-04-06

Publications (2)

Publication Number Publication Date
CN1046624A true CN1046624A (zh) 1990-10-31
CN1021937C CN1021937C (zh) 1993-08-25

Family

ID=13864842

Family Applications (1)

Application Number Title Priority Date Filing Date
CN90103625A Expired - Fee Related CN1021937C (zh) 1989-04-06 1990-04-06 数据识别设备

Country Status (3)

Country Link
US (1) US5588074A (zh)
JP (1) JP2651009B2 (zh)
CN (1) CN1021937C (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511983A (zh) * 2014-10-09 2016-04-20 佳能株式会社 作业处理装置及控制作业处理装置的方法

Families Citing this family (20)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6850252B1 (en) 1999-10-05 2005-02-01 Steven M. Hoffberg Intelligent electronic appliance system and method
US6400996B1 (en) 1999-02-01 2002-06-04 Steven M. Hoffberg Adaptive pattern recognition based control system and method
US10361802B1 (en) 1999-02-01 2019-07-23 Blanding Hovenweep, Llc Adaptive pattern recognition based control system and method
US5903454A (en) 1991-12-23 1999-05-11 Hoffberg; Linda Irene Human-factored interface corporating adaptive pattern recognition based controller apparatus
US8352400B2 (en) 1991-12-23 2013-01-08 Hoffberg Steven M Adaptive pattern recognition based controller apparatus and method and human-factored interface therefore
US6418424B1 (en) 1991-12-23 2002-07-09 Steven M. Hoffberg Ergonomic man-machine interface incorporating adaptive pattern recognition based control system
DE4406919A1 (de) * 1994-02-28 1995-08-31 Licentia Gmbh Mustererkennungssystem mit N-Prozessoren
US5940534A (en) * 1995-07-17 1999-08-17 Nippon Telegraph And Telephone Corporation On-line handwritten character recognition using affine transformation to maximize overlapping of corresponding input and reference pattern strokes
JPH09223195A (ja) * 1996-02-06 1997-08-26 Hewlett Packard Co <Hp> 文字認識方法
JPH09319828A (ja) * 1996-05-30 1997-12-12 Nec Corp オンライン文字認識装置
US7904187B2 (en) 1999-02-01 2011-03-08 Hoffberg Steven M Internet appliance system and method
JP3604993B2 (ja) * 2000-03-16 2004-12-22 シャープ株式会社 画像符号化装置、画像符号化方法、画像復号装置、および画像復号方法
SE519014C2 (sv) * 2001-03-07 2002-12-23 Decuma Ab Ideon Res Park Metod och anordning för igenkänning av ett handskrivet mönster
EP1407602A1 (en) * 2001-07-05 2004-04-14 Koninklijke Philips Electronics N.V. System with macro commands
JP2003162687A (ja) * 2001-11-28 2003-06-06 Toshiba Corp 手書き文字入力装置、手書き文字認識プログラム
TWI410878B (zh) * 2008-05-09 2013-10-01 Princeton Technology Corp 影像辨別裝置及其方法
US8306328B2 (en) * 2009-01-26 2012-11-06 Mitsubishi Electric Research Laboratories Method for converting outline characters to stylized stroke characters
JP2014215877A (ja) * 2013-04-26 2014-11-17 株式会社デンソー 物体検出装置
US10725650B2 (en) * 2014-03-17 2020-07-28 Kabushiki Kaisha Kawai Gakki Seisakusho Handwritten music sign recognition device and program
CN113837305B (zh) * 2021-09-29 2022-09-23 北京百度网讯科技有限公司 目标检测及模型训练方法、装置、设备和存储介质

Family Cites Families (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPS5517988B2 (zh) * 1974-06-05 1980-05-15
JPS5998283A (ja) * 1982-11-27 1984-06-06 Hitachi Ltd パターン切出しおよび認識方法、ならびにそのシステム
US4561105A (en) * 1983-01-19 1985-12-24 Communication Intelligence Corporation Complex pattern recognition method and system
JPS6079485A (ja) * 1983-10-06 1985-05-07 Sharp Corp 手書き文字認識処理装置
JPS60136892A (ja) * 1983-12-26 1985-07-20 Hitachi Ltd オンライン手書き図形認識装置
JPH0650538B2 (ja) * 1984-03-28 1994-06-29 株式会社日立製作所 手書き文字・図形認識の認識モード指定方法
JPS60217477A (ja) * 1984-04-12 1985-10-31 Toshiba Corp 手書き文字認識装置
US4672677A (en) * 1984-11-19 1987-06-09 Canon Kabushiki Kaisha Character and figure processing apparatus
JPS6282486A (ja) * 1985-10-08 1987-04-15 Hitachi Ltd オンライン手書き図形認識装置
JPH07107708B2 (ja) * 1986-09-26 1995-11-15 株式会社日立製作所 パタ−ン認識方法
US4703511A (en) * 1986-10-09 1987-10-27 Paul Conoval Writing input and dynamics regeneration device
US4827330A (en) * 1987-07-20 1989-05-02 Litton Industrial Automation Systems, Inc. Automatic document image revision
US4953225A (en) * 1987-10-16 1990-08-28 Sharp Kabushiki Kaisha Handwritten character-recognizing apparatus for automatically generating and displaying character frames

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN105511983A (zh) * 2014-10-09 2016-04-20 佳能株式会社 作业处理装置及控制作业处理装置的方法
US10110770B2 (en) 2014-10-09 2018-10-23 Canon Kabushiki Kaisha Image forming apparatus for selectively storing print data and displaying alerts to a user

Also Published As

Publication number Publication date
CN1021937C (zh) 1993-08-25
US5588074A (en) 1996-12-24
JPH02266485A (ja) 1990-10-31
JP2651009B2 (ja) 1997-09-10

Similar Documents

Publication Publication Date Title
CN1021937C (zh) 数据识别设备
JP3105967B2 (ja) 文字認識方法及び装置
US4685142A (en) Method and device for handwritten letter recognition
US5038382A (en) Multi-scale recognizer for hand drawn strokes
EP0632403B1 (en) Handwritten symbol recognizer and method for recognising handwritten symbols
AU699966B2 (en) A real time handwriting recognition system
Ogawa et al. Preprocessing for Chinese character recognition and global classification of handwritten Chinese characters
US5005205A (en) Handwriting recognition employing pairwise discriminant measures
CN1123844C (zh) 识别手写字符的装置和方法
WO1990016042A1 (en) Object recognition system
Chen et al. Word recognition in a segmentation-free approach to OCR
US5659633A (en) Character recognition method utilizing compass directions and torsion points as features
Murase et al. Online hand-sketched figure recognition
Al-Taani An efficient feature extraction algorithm for the recognition of handwritten arabic digits
KR20070090188A (ko) 수기 패턴을 인식하기 위한 방법 및 장치
EP1010128B1 (en) Method for performing character recognition on a pixel matrix
CN1041050A (zh) 联机手写字符识别装置
KR940007934B1 (ko) 온라인 문자인식을 위한 획분할 및 문자분류방법
Ahmed et al. A novel intelligent system for defining similar symbols
CN1096110A (zh) 微机汉字手写输入设备
KR960013818B1 (ko) 다중획인식을 이용한 한글조합인식장치
KR930012141B1 (ko) 온라인 필기체 문자인식방법
CN1471042A (zh) 用于中文手写汉字识别的预分类方法及系统
LEE Chinese character recognition in Taiwan
KR940001739B1 (ko) 스트로크인식을 통한 온라인 필기체 문자인식방법

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
C15 Extension of patent right duration from 15 to 20 years for appl. with date before 31.12.1992 and still valid on 11.12.2001 (patent law change 1993)
OR01 Other related matters
C19 Lapse of patent right due to non-payment of the annual fee
CF01 Termination of patent right due to non-payment of annual fee