CN1892642A - 处理表格的方法和系统 - Google Patents

处理表格的方法和系统 Download PDF

Info

Publication number
CN1892642A
CN1892642A CNA2006101002512A CN200610100251A CN1892642A CN 1892642 A CN1892642 A CN 1892642A CN A2006101002512 A CNA2006101002512 A CN A2006101002512A CN 200610100251 A CN200610100251 A CN 200610100251A CN 1892642 A CN1892642 A CN 1892642A
Authority
CN
China
Prior art keywords
filled
paper spare
data item
template
unified
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2006101002512A
Other languages
English (en)
Other versions
CN1892642B (zh
Inventor
E·卡尔宁
A·盖娃
E·瓦拉赫
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN1892642A publication Critical patent/CN1892642A/zh
Application granted granted Critical
Publication of CN1892642B publication Critical patent/CN1892642B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06QINFORMATION AND COMMUNICATION TECHNOLOGY [ICT] SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES; SYSTEMS OR METHODS SPECIALLY ADAPTED FOR ADMINISTRATIVE, COMMERCIAL, FINANCIAL, MANAGERIAL OR SUPERVISORY PURPOSES, NOT OTHERWISE PROVIDED FOR
    • G06Q10/00Administration; Management
    • G06Q10/10Office automation; Time management

Abstract

一种用于在计算机系统中处理表格的方法,所述方法包括从操作者处接收包括数据字段和相应属性的统一表格模板的设计。根据所述统一表格模板自动地产生纸件表格和电子表格(e表格)。从所述计算机系统的客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包括由所述客户填入所述相应数据字段的数据项。响应于所述统一表格模板从所述已填写的纸件表格和所述已填写的电子表格提取所述数据项。

Description

处理表格的方法和系统
技术领域
本发明一般地涉及表格处理系统,并且具体地说,涉及用于共同设计和处理纸件表格与电子表格的方法和系统。
背景技术
许多类型的组织都使用表格从客户处获得数据,以便提供服务和开展业务。此类组织通常运行计算机化的数据库和其他计算机化的系统来存储和以其他方式处理表格中表达的信息。通常,此类系统处理大量表格并将其转化为计算机可读信息。
某些应用使用客户填写和提交的纸件表格。例如,IBM公司(阿蒙克,纽约)提出了智能表格处理(IFP)系统,该系统使从大量纸件表格捕获数据变得自动化。有关IFP系统的更多详细信息,请参见www2.clearlake.ibm.com/GOV/ifp/。
其他应用使用客户电子地填写的电子表格(e表格)。例如,AdobeSystems Inc.(圣何塞,加利福尼亚)提出了用于处理称为Adobe XML的电子表格的体系结构。有关此产品的更多详细信息,请参见www.adobe.com/enterprise/xml.html。
若干种用于设计和处理表格的方法和系统在本领域中是公知的。例如,欧洲专利EP0451485描述了一种用于使用交互显示进行屏幕上表格设计的表格发布工具包。用户界面允许非程序员设计和处理电子表格和纸件表格。
美国专利6,600,482描述了一种根据表格中手工做出的标记的位置来自动标识预先印制的表格的系统。所述系统标识标记的存在和位置并根据此位置来标识预先印制的表格。
美国专利6,816,630描述了一种使用传统的字处理和数据库计算机程序来创建和处理数据表格的系统。所述系统可以从填写好的表格提取数据。提取的数据然后可以被存储在可从市场上购买的数据库中以供处理。
美国专利5,619,635描述了一种表格准备系统。所述系统将基于图形的表格生成器与嵌入的、表格特定的逻辑相集成并提供表格规格说明报告作为输出。所述系统以交互方式运行,允许用户在表格逐步形成期间查看对表格的修改。完成之后,表格中将包含控制高速打印操作所需的规格说明。
美国专利5,317,646描述了一种协助操作者创建电子模板的表格识别系统。该方法允许操作者在图形显示器上查看主表格或空白表格的电子位图。操作者使用指点设备在位图区域中选择一个点,然后自动确定代表该区域的坐标。
美国专利申请公开2003/0188260 A1描述了一种用于设计、创建数据并将数据导入可查看的表格的数据处理系统。日本专利公开JP2004005519A2描述了另一种用于设计表格布局的系统。
发明内容
因此,根据本发明的一个实施例提供了一种用于在计算机系统中处理表格的方法,所述方法包括从操作者处接收包含数据字段和相应属性的统一表格模板的设计。根据所述统一表格模板来自动产生纸件表格和电子表格(e表格)。然后从所述计算机系统的客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包含由所述客户填入所述相应数据字段的数据项。响应地将所述数据项从所述已填写的纸件表格和已填写的电子表格提取到所述统一表格模板。还提供了用于处理表格的计算机化的系统和计算机软件产品。
根据本发明的一个实施例,还提供了用于设计表格的装置,所述装置包括用户界面,所述用户界面被布置成与操作者交互,以便接收包含数据字段和相应属性的统一表格模板的设计。表格处理器被布置成根据所述统一表格模板来自动产生纸件表格和电子表格(e表格),以便允许计算机化的表格处理系统从客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包含由所述客户填入所述相应数据字段的数据项,以及允许响应地将所述数据项从所述已填写的纸件表格和已填写的电子表格提取到所述统一表格模板。
附图说明
从以下结合附图对本发明的实施例的详细说明,可以更充分地理解本发明,这些附图是:
图1是示意性地示出了根据本发明的一个实施例的涉及表格处理的计算机系统的方块图;
图2是示意性地示出了根据本发明的一个实施例的用于处理表格的方法的流程图;以及
图3是示意性地示出了根据本发明的一个实施例的表格设计工具的用户界面的图。
具体实施方式
                         概述
在许多应用中,希望表格处理计算机系统接受和处理纸件表格和电子表格(e表格)两者。尽管电子表格更易于处理并且通常减少了系统的运行成本,但是许多客户更原意使用纸件表格。客户可能出于方便、习惯和传统,缺乏计算机知识或很少使用计算机等原因,更喜欢纸件表格而不是电子表格。
在许多情况下,纸件表格和电子表格可以被看作用于提供相同信息的不同数据输入方法。然而,在传统的表格处理系统中,纸件表格和电子表格之间通常没有内在的关联或同步。在这些系统中,纸件表格和电子表格通常执行单独的设计过程。在现有纸件表格的基础上设计电子表格,或者执行相反的操作,通常是一种繁重、耗时且易于出错的手工过程。当客户填写并提交此类表格时,对于纸件表格和电子表格,数据捕获和验证过程通常也是分开的。贯穿表格的生命周期,纸件表格和电子表格之间的分离导致不必要的资源消耗,降低了系统性能并使维护配置控制的任务变得复杂。
鉴于传统表格处理系统的这些缺点,本发明的实施例提供了共同设计、维护和处理纸件表格和电子表格的方法和系统。在某些实施例中,操作者(通常为表格设计者)执行产生统一表格模板的单一设计过程。所述统一模板构成了纸件表格和电子表格的基础,包括表格设计的所有视觉和布局相关的方面以及所有逻辑的内容相关的方面。在设计和产生所述统一表格模板之后,系统可以在没有来自设计者的更多输入的情况下自动产生纸件表格和电子表格。
通常使用表格设计工具和用户界面(它们将在以下详细说明)来执行所述设计过程。
在某些实施例中,所述统一模板定义了表格的各种数据字段。对于每个数据字段,所述模板定义了与纸件表格、电子表格或两者相关的属性。所述统一模板还定义了验证规则,以便验证客户填入表格的数据字段内的数据项。在某些实施例中,从所述统一模板得出单独的纸件表格模板和电子表格模板。
在某些实施例中,所述统一表格模板的属性和验证规则用来训练用于纸件表格的数据捕获的光学字符识别(OCR)处理并提高其性能。因此,所述表格处理系统无需先前的手工训练便可开始处理新设计的纸件表格。
在另一个实施例中,所述验证规则和属性用于检验和验证纸件表格和电子表格两者的捕获的信息。
                         系统说明
图1是示意性地示出了根据本发明的一个实施例的涉及表格处理的计算机系统20的方块图。系统20可以例如属于使用表格从个人收集个人信息的政府办公室。系统20可以替代地包括处理来自客户的订单表格的电子商务(e商务)系统。进而,可替代地,系统20可以包括任何其他使用表格从客户收集信息的计算机化的系统。(术语“客户”在本专利申请中用于表示任何与系统交互的个人,无论此交互的性质是商业的还是非商业的。)
系统20的客户22通过填写和提交表格来向系统提供信息。表格可以包括客户通过手写或键入填写的纸件表格,也可以包括以计算机可读格式电子地填写并提交给系统的电子表格(e表格)。尽管电子表格更易于处理并且通常减少了系统20的运行成本,但是许多客户更原意使用纸件表格。某些客户出于方便、习惯或传统,缺乏计算机知识或需要提交表格时找不到计算机等原因而更喜欢纸件表格。此外,在某些应用中,需要提供客户的可识别签名作为表格的一部分。因此,在许多应用中,希望系统20同时接受纸件表格和电子表格。
某些客户22填写纸件表格24并将其提交给系统20。纸件表格24包括一个或多个以特定布局排列的数据字段以便输入相应的数据项。可以通过手写、键入或打印来填写纸件表格。可以通过传真、扫描纸件、使用电子邮件发送经过扫描的纸件表格,或使用任何其他适合的传送方法来将表格提交给系统20。纸件表格捕获模块30捕获纸件表格中表达的信息并将其转换为适合的计算机可读格式。因此,模块30用作接受纸件表格的输入设备。在某些实施例中,模块30使用各种本领域中公知的光学字符识别(OCR)方法将纸件表格中的字母数字信息转换为适合的如ASCII之类的计算机可读格式。
在处理纸件表格的传统系统中,必须为每种新类型的表格手工“训练”OCR系统以标识信息。通常,所述训练过程需要操作者向OCR系统标识纸件表格中每个字段的布局、内容和结构。此过程是一种繁重、耗时且易于出错的手工过程。本发明的实施例提供了在没有任何手工训练或其他人为干涉的情况下自动向模块30的OCR系统提供必需的信息的方法和工具。下面将详细描述此过程。
对于每种类型的纸件表格,产生纸件表格模板31。模板31定义了到模块30中的OCR处理的表格的各种数据字段。所述数据字段定义包括与视觉或布局相关的方面有关的属性,以及与字段的逻辑内容有关的属性。例如,布局相关的属性可以包括纸件表格中字段的位置坐标和字段的大小。内容相关的属性可以包括字段中预期的字符集(例如,数字、字母数字或包括特定符号的字符集)。
纸件表格模板31中的数据字段定义还可以包含用于验证字段中所提供的信息的验证规则。使用所述验证春规则,可以提高模块30中的OCR系统的识别准确度。所述OCR系统还可以使用验证规则来标识潜在的识别错误。例如,邮政编码字段的验证规则可以要求字段恰好包含5个数字。对于社会安全号码字段,所述验证规则还可以包括校验和验证公式,如果在编号惯例中使用此类校验和的话。通常,某些属性和/或验证规则还可以应用于多个数据字段,或者应用于整个表格。
在许多情况下,可以以协助模块30中的OCR处理并提高其识别性能的方式来预先设计纸件表格的布局。可以在此阶段应用本领域内公知的用于设计纸件表格的“OCR友好”的方法。例如,数字字段(如邮政编码或社会安全号码字段)可以包括用于每个位的单独且确切标记的子字段。字段边界、分隔符和基准线可以以受传送表格的扫描仪或传真抑制的不同颜色来打印。
系统20的其他客户22可以填写和提交电子表格26。类似于纸件表格,电子表格包含一个或多个数据字段以便由客户输入相应的数据项,在某些实施例中,使用客户终端或计算机和适合的客户软件或标准编辑器来填写电子表格。填入电子表格中的信息以适合的计算机可读格式来表示并被传送给系统20中的电子表格传送模块32。模块32用作将电子表格接受到系统20中的输入设备并且可以包括任何适合的传送装置。在某些实施例中,使用永久性或临时网络连接(如因特网连接)将用户终端或计算机连接到系统20。还可以使用电子邮件或通过物理提交计算机可读介质来传送表格。可替代地,可以使用任何其他适合的方法来填写和提交电子表格。
根据电子表格模板33来定义每种类型的电子表格,模板33指定了电子表格的各个数据字段。电子表格模板中的数据字段定义可以包含如以上在纸件表格模板的说明中描述的属性和/或验证规则。在传统的电子表格处理系统中,通常在现有纸件表格的基础上由操作者以手工方式产生所述电子表格模板。本发明的实施例作为表格设计过程的一部分自动地产生所述电子表格模板。此过程将在下面进行详细描述。
模块30从纸件表格24提取数据项并使用纸件表格模板31对其进行验证。类似地,模块32从电子表格26提取数据项并使用电子表格模板33对其进行验证。然后将所述数据项提供给应用系统28。应用系统可以将数据项存储在数据库中,根据所提供的信息为客户提供各种服务,或者根据系统20的特定功能的要求以其他方式处理数据项。
在某些实施例中,对于每种类型的表格,系统20将纸件表格24和电子表格26视为提供相同信息的两种不同的数据输入方法。一旦已使用模块30或模块32从表格提取了数据项,系统20便无法再了解这些数据项是源自纸件表格还是源自电子表格。在许多实际情况下,许多字段定义、属性和验证规则对于纸件表格模板和电子表格模板都是通用的。在某些备选实施例中,纸件表格的数据字段与电子表格的数据字段之间可能存在某些差异,尽管它们都用于收集相似的信息。
因此,与传统的表格处理方法相比,本发明的实施例使得共同设计和维护纸件表格和电子表格的模板并且利用两者之间的共性成为可能。在此描述的方法和工具可用于产生共同定义了电子表格和纸件表格两者的统一表格模板29,该模板包括每个数据字段的布局相关的属性、内容相关的属性和验证规则。通常,许多属性和验证规则都是定义纸件表格和电子表格两者所通用的。
需要设计新的类型的表格或更新现有表格时,使用表格设计工具34。表格设计工具包含用于执行下面描述的各种设计功能的表格处理器36,以及用于与设计者40交互的用户界面38。界面38通常包含诸如拖放式界面之类的图形用户界面(GUI)。下面的图3中示出了示例性的用户界面。表格设计工具产生统一表格模板29并且从此模板导出对应的纸件表格模板31和电子表格模板33。后两个模板然后用于提交、捕获和验证纸件表格和电子表格。一旦定义了统一表格模板,系统就可以在没有设计者的更多输入的情况下自动产生纸件表格和电子表格。
通常,表格设计工具34包括通用计算机,该计算机在软件上编程为执行在此描述的功能。例如,软件可以通过网络以电子形式下载到计算机,或者替代地通过诸如CD-ROM之类的有形介质提供给计算机。此外,可替代地,可以使用硬件和软件元素的组合来实现工具34。表格设计工具可以是独立的单元,或者替代地可以与系统20的其他计算平台集成。
                         表格处理方法描述
图2是示意性地示出了根据本发明的一个实施例的用于处理表格的方法的流程图。新的表格的生命周期开始于设计者40在模板设计步骤50设计统一表格模板29。原则上,设计者使用产生统一表格模板的表格设计工具34来执行单一设计过程。所述统一模板然后用作纸件表格和电子表格两者的基础。所述设计过程通常包括视觉设计和内容相关的设计。
在视觉设计中,设计者使用用户界面38来确定将用于产生纸件表格24的表格的布局和图形方面。设计者安排新的表格的各种数据字段并确定每个数据字段的坐标、大小和其他布局相关的属性。设计者还确定表格的图形外观。作为视觉设计的一部分,可以添加协助如上所述的OCR处理的图形功能。以适合的可打印和可查看格式来表示视觉设计。以适合的计算机可读格式来存储布局相关的属性。
在某些实施例中,可以使用传统的表格设计工具来实现视觉设计阶段。例如,Adobe System Inc.(圣何塞,加利福尼亚)推出了称为AdobeLiveCycleTM Designer的可视表格设计工具。有关此产品的详细信息,可访问http://www.adobe.com/products/server/adobedesigner/main.html。
在内容相关的设计中,设计者适当地输入每个数据字段所需的属性和/或验证规则。这些属性将在以后用于增强纸件表格和电子表格的数据捕获过程并用于检验和验证从表格提取的数据项。
步骤50的结果是统一表格模板29,其包括与新设计的表格有关的全部信息。以下一系列步骤52-58描述了与根据模板29来处理纸件表格相关的方法步骤。以下一系列步骤62-66描述了与电子表格相关的方法步骤。可以以任意顺序来实现这两个系列的步骤。
首先描述与处理纸件表格相关的方法步骤。工具34的表格处理器36在纸件模板生成步骤52根据统一模板29来产生纸件表格模板31。在某些实施例中,处理器将模板29简化为仅包含与处理纸件表格相关的视觉设计、属性以及验证规则。具体地说,将可用于改进OCR处理的验证规则(有时称为“训练规则”)包括在纸件表格模板中。出于此原因,所述纸件表格模板有时还被称为“训练模板”。在其他实施例中,省略了生成单独的纸件表格模板。在这些实施例中,OCR处理和数据验证过程直接使用统一模板的相关属性和验证规则。基于纸件表格模板,可以印制空白的纸件表格并将其分发给客户。
当客户填写并提交纸件表格时所述方法在纸件传送步骤54继续。在纸件捕获步骤56捕获纸件表格承载的信息。模块30通常使用OCR处理来捕获所述信息。在某些实施例中,模块30使用模板31的某些属性和验证规则来提高OCR处理的性能。例如,所述OCR处理可以检验在某些数据字段中识别的字符与由此字段的属性定义的预期字符集是否匹配。所述OCR处理还可以只在特定坐标范围(如属性中所定义的)中查找特定的数据字段。如上所述,OCR直接使用模板31中的信息,无需任何种类的手工训练。
捕获表格信息之后,模块30在纸件验证步骤58重新构建纸件表格中的不同数据项并且检验和验证这些数据项。通常,模块30使用在模板31中定义的属性和验证规则以便检验和验证所述数据项。例如,考虑其中客户填写其街道地址作为纸件表格一部分的应用。在上面的纸件捕获步骤56,已使用OCR处理从所述表格提取了客户的街道名称和邮政编码。验证所述街道地址可以包括查询邮政数据库,以便证实该街道名称确实是属于所提取的邮政编码区域的有效街道名称。
如果在验证过程中发现错误,则系统20可以采取某些错误处理措施。特定的错误处理措施被认为在本专利申请的范围之外。一般而言,错误的数据项可以被丢弃或标记为错误,当发现错误时,可以通知应用系统28。在某些情况下,可能要求客户重新提交表格。在检验和验证数据项后,在数据提交步骤60将数据提供给应用系统28。
现在描述与处理电子表格相关的方法步骤。在电子表格模板生成步骤62,工具34的表格处理器36根据统一模板29来产生电子表格模板33。在某些实施例中,处理器将模板29简化为仅包含与处理电子表格相关的属性和验证规则。具体地说,视觉和图形设计通常不是电子表格模板的一部分。在其他实施例中,省略了生成单独的电子表格模板,并且数据验证过程直接使用统一模板的属性和验证规则。可以以适合的计算机可读格式来表示电子表格模板并将其分发给客户。
当客户在电子传送步骤64填写并提交电子表格时所述方法继续。客户通常使用模板33在电子表格的相应数据字段中输入不同的数据项。在某些实施例中,在将客户输入的数据项传送到系统20之前,可以使用模板33的某些验证规则来验证所述数据项。例如,如果客户使用适合的客户端软件或专用的客户终端来填写电子表格,则可以将某些验证规则分发到所述软件或终端以验证输入的信息。在其他实施例中,数据验证被推迟到后面的阶段,在将电子表格提交给系统之后进行。
在电子表格验证步骤66,模块32接受并验证提交的电子表格。模块32从表格的相应数据字段提取数据项,然后使用模板33的属性和验证规则来验证和检验所述数据项。
在某些实施例中,数据验证过程包括数据库查找操作。例如,考虑在统一模板中分类为姓氏字段的数据字段。在数据验证过程(上述的步骤58或步骤66)中,系统可以使用提取的数据项来查询有效姓氏的数据库,以便验证从表格提取的姓名。
提取并验证数据项之后,在数据提交步骤60将数据提供给应用系统28。
图3是示意性地示出了根据本发明的一个实施例的表格设计工具34的用户界面38的图。该图源自发明者进行实现时工具34的示例性屏幕截图。窗口80示出了正在设计的应用表格的一部分。窗口示出了部分视觉设计,例如若干数据字段的标题和布局。数据字段标记有限定每个字符的预期位置的分隔符。
在本实例中,当前正在定义或编辑邮政编码数据字段82。窗口84示出了邮政编码数据字段的属性。例如,规定邮政编码具有5个数字字符(具有预定大小和间距)。
尽管此处描述的方法和系统主要解决了共同设计和处理纸件表格和电子表格的问题,但是本发明的原理还可以用于其他应用。因此,将理解,通过实例的方式引用了上述实施例,并且本发明并不限于上文已具体示出并描述的内容。相反,本发明的范围包括上述各种功能的组合和子组合,以及在阅读以上描述后本领域的技术人员所想到的并且在现有技术中没有披露的本发明的各种变化和修改。

Claims (20)

1.一种用于在计算机系统中处理表格的方法,所述方法包括:
从操作者处接收包括数据字段和相应属性的统一表格模板的设计;
根据所述统一表格模板自动地产生纸件表格和电子表格;
从所述计算机系统的客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包括由所述客户填入所述相应数据字段的数据项;以及
响应于所述统一表格模板从所述已填写的纸件表格和所述已填写的电子表格提取所述数据项。
2.根据权利要求1的方法,其中所述统一表格模板包括为填入所述数据字段中的至少一部分数据字段的所述数据项定义有效性准则的验证规则,并且其中提取所述数据项包括响应于所述验证规则而验证所述已填写的纸件表格和所述已填写的电子表格中的所述数据项中的至少一部分数据项。
3.根据权利要求2的方法,其中所述统一表格模板中的所述验证规则中的至少一些验证规则是所述纸件表格和所述电子表格通用的。
4.  根据权利要求2的方法,其中验证所述数据项中的至少一部分数据项包括使用所述数据项来查询数据库以便在有效数据项列表中查找所述数据项。
5.根据权利要求2的方法,其中接受所述已填写的电子表格包括在所述客户填写一个或多个所述数据项之后立即对其进行验证。
6.根据权利要求2的方法,其中从所述纸件表格提取所述数据项包括将光学字符识别处理应用于所述表格,以便将所述数据项转换成计算机可读格式,并且其中应用所述光学字符识别处理包括使用一个或多个所述验证规则以便提高所述光学字符识别处理的识别性能。
7.根据权利要求6的方法,其中所述统一表格模板的设计包括协助所述光学字符识别处理的图形特征,并且其中自动产生所述纸件表格包括印制其上印制有所述图形特征的空白纸件表格。
8.根据权利要求1的方法,其中所述统一表格模板中的所述属性中的至少一些属性是所述纸件表格和所述电子表格共有的。
9.根据权利要求1的方法,其中接受所述已填写的纸件表格包括通过传真发送所述表格、扫描所述表格以及通过网络发送所述表格的扫描图像中的至少一项。
10.根据权利要求1的方法,其中接受所述已填写的电子表格包括通过永久性网络连接发送所述表格、通过临时网络连接发送所述表格、通过电子邮件发送所述表格以及物理地提交包含所述表格的计算机可读介质中的至少一项。
11.根据权利要求1的方法,其中所述统一表格模板包括定义所述表格的图形外观和所述表格中的所述数据字段的物理布局的视觉设计,并且其中所述属性包括布局相关的属性和内容相关的属性中的至少一个属性。
12.一种用于处理表格的计算机化的系统,所述系统包括:
用户界面,所述用户界面被安排为与操作者交互以便接收包括数据字段和相应属性的统一表格模板的设计;
表格处理器,所述表格处理器被安排为根据所述统一表格模板自动地产生纸件表格和电子表格;以及
至少一个输入设备,所述输入设备被安排为从所述计算机系统的客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包括由所述客户填入所述相应数据字段的数据项,以及被安排为响应于所述统一表格模板从所述已填写的纸件表格和所述已填写的电子表格提取所述数据项。
13.根据权利要求12的系统,其中所述统一表格模板包括为填入所述数据字段中的至少一部分数据字段的所述数据项定义有效性准则的验证规则,并且其中所述至少一个输入设备被安排为响应于所述验证规则而验证所述已填写的纸件表格和所述已填写的电子表格中的所述数据项中的至少一部分数据项。
14.根据权利要求13的系统,其中所述统一表格模板中的所述验证规则中的至少一些验证规则是所述纸件表格和所述电子表格通用的。
15.根据权利要求13的系统,其中所述至少一个输入设备被安排为查询有效数据项的列表以便验证所述数据项中的所述至少一部分数据项。
16.根据权利要求13的系统,其中所述至少一个输入设备被安排为将光学字符识别处理应用于所述纸件表格,以便将所述纸件表格中的所述数据项转换成计算机可读格式,并且被安排为使用一个或多个所述验证规则以便提高所述光学字符识别处理的识别性能。
17.根据权利要求12的系统,其中所述统一表格模板中的所述属性中的至少一些属性是所述纸件表格和所述电子表格共有的。
18.根据权利要求12的系统,其中所述统一表格模板包括定义所述表格的图形外观和所述表格中的所述数据字段的物理布局的视觉设计,并且其中所述属性包括布局相关的属性和内容相关的属性中的至少一个属性。
19.一种用于设计表格的装置,所述装置包括:
用户界面,所述用户界面被安排为与操作者交互以便接收包括数据字段和相应属性的统一表格模板的设计;
表格处理器,所述表格处理器被安排为根据所述统一表格模板自动地产生纸件表格和电子表格,以便使得计算机化的表格处理系统能够从客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包括由所述客户填入所述相应数据字段的数据项,并且使得所述表格处理系统能够响应于所述统一表格模板从所述已填写的纸件表格和所述已填写的电子表格提取所述数据项。
20.一种用于设计表格的计算机软件产品,所述产品包括其中存储有程序指令的计算机可读介质,当被计算机读取时,所述指令导致所述计算机与操作者交互以便接收包括数据字段和相应属性的统一表格模板的设计,并且导致所述计算机根据所述统一表格模板自动地产生纸件表格和电子表格,以便使得计算机化的表格处理系统能够从客户处接受已填写的纸件表格和已填写的电子表格,所述已填写的表格包括由所述客户填入所述相应数据字段的数据项,并且使得所述表格处理系统能够响应于所述统一表格模板从所述已填写的纸件表格和所述已填写的电子表格提取所述数据项。
CN2006101002512A 2005-07-06 2006-07-05 处理表格的方法和系统 Expired - Fee Related CN1892642B (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US11/176,503 2005-07-06
US11/176,503 US7607078B2 (en) 2005-07-06 2005-07-06 Paper and electronic recognizable forms

Publications (2)

Publication Number Publication Date
CN1892642A true CN1892642A (zh) 2007-01-10
CN1892642B CN1892642B (zh) 2011-01-12

Family

ID=37597517

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2006101002512A Expired - Fee Related CN1892642B (zh) 2005-07-06 2006-07-05 处理表格的方法和系统

Country Status (2)

Country Link
US (1) US7607078B2 (zh)
CN (1) CN1892642B (zh)

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685499A (zh) * 2008-09-22 2010-03-31 因特伟特公司 用于纠正字符识别错误的技术
CN101794280A (zh) * 2010-03-11 2010-08-04 北京中科辅龙计算机技术股份有限公司 一种基于表格模板集的表格自动生成方法及系统
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN101373464B (zh) * 2008-09-24 2011-04-20 金蝶软件(中国)有限公司 自动调用表格设置的方法、装置及系统
CN102262615A (zh) * 2010-05-24 2011-11-30 株式会社Pfu 表单制作装置以及表单制作方法
CN101702242B (zh) * 2009-11-23 2012-07-04 中兴通讯股份有限公司 一种自动填写固定格式文件的方法及终端
CN102637190A (zh) * 2011-01-24 2012-08-15 微软公司 将已捕捉图像数据与电子表格相关联
CN102654874A (zh) * 2011-03-02 2012-09-05 顾菊林 单据数据管理方法及系统
CN108196850A (zh) * 2018-01-29 2018-06-22 上海法顿印刷有限公司 一种应用于可变信息印刷的自动数据处理与拼版方法
CN109219809A (zh) * 2016-03-13 2019-01-15 瓦特博克有限公司 基于电子文档的自动生成报告数据的方法和系统
CN109710344A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 信息录入指引方法、装置、设备及可读存储介质

Families Citing this family (41)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7283274B2 (en) * 2001-10-26 2007-10-16 Hewlett-Packard Development Company, L.P. Method and system for printing user data to form documents
US20070198910A1 (en) * 2002-03-26 2007-08-23 Aatrix Software, Inc. Method and apparatus for creating and filing forms
US7171615B2 (en) 2002-03-26 2007-01-30 Aatrix Software, Inc. Method and apparatus for creating and filing forms
US7581169B2 (en) * 2005-01-14 2009-08-25 Nicholas James Thomson Method and apparatus for form automatic layout
GB0506508D0 (en) * 2005-03-31 2005-05-04 Ibm Method, system and software tool for processing an electronic form
US7734590B2 (en) 2005-09-30 2010-06-08 Rockwell Automation Technologies, Inc. Incremental association of metadata to production data
JP2007279828A (ja) * 2006-04-03 2007-10-25 Toshiba Corp 帳票処理装置、帳票様式作成装置、帳票、帳票処理用のプログラム、帳票様式作成用のプログラム
US8032822B1 (en) * 2006-07-28 2011-10-04 Intuit Inc. Method and system for explaining dependencies on a document
US8140589B2 (en) * 2007-03-28 2012-03-20 International Business Machines Corporation Autonomic updating of templates in a content management system
US7900132B2 (en) * 2007-06-05 2011-03-01 Adobe Systems Incorporated Method and system to process an electronic form
US20100050069A1 (en) * 2008-08-22 2010-02-25 International Business Machines Corporation System and method for customizing documentation with constraint-controlled custom values
US7930447B2 (en) 2008-10-17 2011-04-19 International Business Machines Corporation Listing windows of active applications of computing devices sharing a keyboard based upon requests for attention
US8250026B2 (en) * 2009-03-06 2012-08-21 Peoplechart Corporation Combining medical information captured in structured and unstructured data formats for use or display in a user application, interface, or view
JP5192468B2 (ja) * 2009-09-29 2013-05-08 株式会社エヌ・ティ・ティ・ドコモ データ処理装置及びプログラム
US20170147577A9 (en) * 2009-09-30 2017-05-25 Gennady LAPIR Method and system for extraction
EP2574211A1 (en) * 2010-03-09 2013-04-03 David Schnitt Unified electronic forms management system
US10769554B2 (en) 2011-08-01 2020-09-08 Intuit Inc. Interactive technique for using a user-provided image of a document to collect information
WO2013058846A1 (en) 2011-10-18 2013-04-25 Dotloop, Llc Systems, methods and apparatus for form building
US20130268881A1 (en) * 2012-03-06 2013-10-10 Drew Charles Bartkiewicz Letter Generation, Communication, And Management
US20140298151A1 (en) * 2012-05-11 2014-10-02 FitzForm LLC Creation and distribution of forms
US11631265B2 (en) * 2012-05-24 2023-04-18 Esker, Inc. Automated learning of document data fields
US8949321B2 (en) * 2012-09-28 2015-02-03 Interactive Memories, Inc. Method for creating image and or text-based projects through an electronic interface from a mobile application
US9218331B2 (en) * 2013-02-06 2015-12-22 Patientordersets.Com Ltd. Automated generation of structured electronic representations of user-fillable forms
US10826951B2 (en) 2013-02-11 2020-11-03 Dotloop, Llc Electronic content sharing
US9870352B2 (en) * 2013-03-07 2018-01-16 Ricoh Company, Ltd. Creating a dashboard for tracking a workflow process involving handwritten forms
US20140258825A1 (en) * 2013-03-08 2014-09-11 Tuhin Ghosh Systems and methods for automated form generation
US9575622B1 (en) 2013-04-02 2017-02-21 Dotloop, Llc Systems and methods for electronic signature
US9384180B2 (en) * 2013-04-10 2016-07-05 Xerox Corporation Methods and systems for processing filled forms
US9652445B2 (en) * 2013-05-29 2017-05-16 Xerox Corporation Methods and systems for creating tasks of digitizing electronic document
US20150134555A1 (en) * 2013-11-08 2015-05-14 Tracker Corp Document error resolution
US10552525B1 (en) 2014-02-12 2020-02-04 Dotloop, Llc Systems, methods and apparatuses for automated form templating
RU2651144C2 (ru) 2014-03-31 2018-04-18 Общество с ограниченной ответственностью "Аби Девелопмент" Ввод данных с изображений документов с фиксированной структурой
US10733364B1 (en) 2014-09-02 2020-08-04 Dotloop, Llc Simplified form interface system and method
US9934432B2 (en) 2015-03-31 2018-04-03 International Business Machines Corporation Field verification of documents
US10551989B2 (en) * 2015-06-01 2020-02-04 Nextiva, Inc. System and method of a customer management system
CN105955944A (zh) * 2016-05-09 2016-09-21 杭州艺豆网络科技有限公司 一种尺码表的生成方法
CN106126491B (zh) * 2016-06-29 2018-12-28 江苏中威科技软件系统有限公司 一种纸质表单转换为网页表单的方法及系统
CN108549621B (zh) * 2018-03-19 2022-02-18 华迪计算机集团有限公司 一种基于bs架构无缝集成电子文档的方法及系统
US11861302B2 (en) * 2019-02-04 2024-01-02 Aatrix Software, Inc. AUF XML specification compiler
US11250206B2 (en) 2019-09-20 2022-02-15 Microsoft Technology Licensing, Llc Conversion of forms to action cards
CN111241955B (zh) * 2020-01-03 2023-05-16 北京一览群智数据科技有限责任公司 一种票据信息提取方法及系统

Family Cites Families (23)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4809220A (en) * 1984-03-30 1989-02-28 Wang Laboratories, Inc. Electronic processing system using printer and microprocessor to create forms template with pre-printed forms
EP0451485A3 (en) 1990-04-11 1992-12-30 International Business Machines Corporation A form authoring toolkit
US5490243A (en) * 1990-12-13 1996-02-06 F3 Software Corporation Data processing system for multi-platform print control and electronic data fill
US5317656A (en) * 1991-05-17 1994-05-31 Texas Instruments Incorporated Fiber optic network for multi-point emissivity-compensated semiconductor wafer pyrometry
US5317646A (en) * 1992-03-24 1994-05-31 Xerox Corporation Automated method for creating templates in a forms recognition and processing system
CN1023732C (zh) * 1992-12-04 1994-02-09 黄尚廉 复杂表格智能处理方法
US6522770B1 (en) * 1999-05-19 2003-02-18 Digimarc Corporation Management of documents and other objects using optical devices
US7124302B2 (en) * 1995-02-13 2006-10-17 Intertrust Technologies Corp. Systems and methods for secure transaction management and electronic rights protection
US6003007A (en) * 1996-03-28 1999-12-14 Dirienzo; Andrew L. Attachment integrated claims system and operating method therefor
US5889932A (en) * 1996-05-03 1999-03-30 Barco Graphics N.V. Method of checking graphical data for conformity to graphical design rules
US7139999B2 (en) * 1999-08-31 2006-11-21 Accenture Llp Development architecture framework
US6600482B1 (en) * 2000-01-11 2003-07-29 Workonce Wireless Corporation Method and system for form recognition and digitized image processing
US20020050982A1 (en) * 2000-04-05 2002-05-02 Petter Ericson Data form having a position-coding pattern detectable by an optical sensor
US6816630B1 (en) * 2000-05-22 2004-11-09 Electro-Sensors, Inc. System and method for creating and processing data forms
AU7182701A (en) * 2000-07-06 2002-01-21 David Paul Felsher Information record infrastructure, system and method
WO2002021405A1 (en) * 2000-09-07 2002-03-14 Closingguard.Com, Inc. System and method of managing financial transactions over an electronic network
US6581020B1 (en) * 2000-10-10 2003-06-17 Velquest Corporation Process-linked data management system
WO2002037391A2 (en) * 2000-11-03 2002-05-10 Myetribute, Inc. System and method for conducting pet, death, dna and other related transactions over a computer network
US20020120582A1 (en) * 2001-02-26 2002-08-29 Stephen Elston Method for establishing an electronic commerce account
WO2003019331A2 (en) * 2001-08-24 2003-03-06 American Bio Medica Corporation Method of conducting and documenting analyte screening tests
US7171615B2 (en) * 2002-03-26 2007-01-30 Aatrix Software, Inc. Method and apparatus for creating and filing forms
JP2004005519A (ja) 2002-03-27 2004-01-08 Kokuyo Co Ltd 用紙レイアウト設計装置及び用紙レイアウト設計プログラム
US20040237040A1 (en) * 2003-05-19 2004-11-25 Malkin Wayne Allan System and method of processing an electronic form using layered aspects

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101685499A (zh) * 2008-09-22 2010-03-31 因特伟特公司 用于纠正字符识别错误的技术
CN101685499B (zh) * 2008-09-22 2016-10-12 因特伟特公司 用于纠正字符识别错误的技术
CN101373464B (zh) * 2008-09-24 2011-04-20 金蝶软件(中国)有限公司 自动调用表格设置的方法、装置及系统
CN101702242B (zh) * 2009-11-23 2012-07-04 中兴通讯股份有限公司 一种自动填写固定格式文件的方法及终端
CN101794280A (zh) * 2010-03-11 2010-08-04 北京中科辅龙计算机技术股份有限公司 一种基于表格模板集的表格自动生成方法及系统
CN102262615A (zh) * 2010-05-24 2011-11-30 株式会社Pfu 表单制作装置以及表单制作方法
US9047265B2 (en) 2010-05-24 2015-06-02 Pfu Limited Device, method, and computer readable medium for creating forms
CN101923643B (zh) * 2010-08-11 2012-11-21 中科院成都信息技术有限公司 通用表格识别方法
CN101923643A (zh) * 2010-08-11 2010-12-22 中科院成都信息技术有限公司 通用表格识别方法
CN102637190A (zh) * 2011-01-24 2012-08-15 微软公司 将已捕捉图像数据与电子表格相关联
CN102637190B (zh) * 2011-01-24 2016-03-16 微软技术许可有限责任公司 将已捕捉图像数据与电子表格相关联
US9697193B2 (en) 2011-01-24 2017-07-04 Microsoft Technology Licensing, Llc Associating captured image data with a spreadsheet
CN102654874A (zh) * 2011-03-02 2012-09-05 顾菊林 单据数据管理方法及系统
CN109219809A (zh) * 2016-03-13 2019-01-15 瓦特博克有限公司 基于电子文档的自动生成报告数据的方法和系统
CN108196850A (zh) * 2018-01-29 2018-06-22 上海法顿印刷有限公司 一种应用于可变信息印刷的自动数据处理与拼版方法
CN109710344A (zh) * 2018-08-17 2019-05-03 深圳壹账通智能科技有限公司 信息录入指引方法、装置、设备及可读存储介质

Also Published As

Publication number Publication date
CN1892642B (zh) 2011-01-12
US20070009158A1 (en) 2007-01-11
US7607078B2 (en) 2009-10-20

Similar Documents

Publication Publication Date Title
CN1892642B (zh) 处理表格的方法和系统
US11868717B2 (en) Multi-page document recognition in document capture
US8520889B2 (en) Automated generation of form definitions from hard-copy forms
US7529408B2 (en) System and method for electronically processing document images
US20050289182A1 (en) Document management system with enhanced intelligent document recognition capabilities
US7668372B2 (en) Method and system for collecting data from a plurality of machine readable documents
US8781229B2 (en) System and method for localizing data fields on structured and semi-structured forms
US20070033118A1 (en) Document Scanning and Data Derivation Architecture.
EP2317458A1 (en) Orthogonal technology for multi-line character recognition
CN101542504A (zh) 后光学字符识别处理中的形状聚类
CN102855243A (zh) 用于提取文档结构的方法和装置
CN112508011A (zh) 一种基于神经网络的ocr识别方法及设备
CN111753717B (zh) 用于提取文本的结构化信息的方法、装置、设备及介质
US20080235263A1 (en) Automating Creation of Digital Test Materials
CN109858373A (zh) 一种基于深度学习的发票识别验真方法及系统
US11908215B2 (en) Information processing apparatus, information processing method, and storage medium
CN109726369A (zh) 一种基于标准文献的智能模板化题录技术实现方法
CN102637256B (zh) 后光学字符识别处理中的形状聚类
CN109214362A (zh) 单据处理方法及相关设备
US7532368B2 (en) Automated processing of paper forms using remotely-stored form content
JP2005234790A (ja) 手書き帳票処理システム、手書き帳票処理方法
CN111241955B (zh) 一种票据信息提取方法及系统
JP3872923B2 (ja) 情報処理型郵便区分システム
CN1153358A (zh) 中英文表单的识别系统及识别方法
JP2007072882A (ja) 帳票読取装置、プログラム及び帳票読取システム

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110112

Termination date: 20200705