CN101324902A - 实时数据入库 - Google Patents

实时数据入库 Download PDF

Info

Publication number
CN101324902A
CN101324902A CNA200810137940XA CN200810137940A CN101324902A CN 101324902 A CN101324902 A CN 101324902A CN A200810137940X A CNA200810137940X A CN A200810137940XA CN 200810137940 A CN200810137940 A CN 200810137940A CN 101324902 A CN101324902 A CN 101324902A
Authority
CN
China
Prior art keywords
record
data
entity
database
expression
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CNA200810137940XA
Other languages
English (en)
Inventor
杰佛里·詹姆斯·乔纳斯
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
International Business Machines Corp
Original Assignee
International Business Machines Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by International Business Machines Corp filed Critical International Business Machines Corp
Publication of CN101324902A publication Critical patent/CN101324902A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/25Integrating or interfacing systems involving database management systems
    • G06F16/254Extract, transform and load [ETL] procedures, e.g. ETL data flows in data warehouses
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F17/00Digital computing or data processing equipment or methods, specially adapted for specific functions
    • G06F17/40Data acquisition and logging

Abstract

本发明涉及实时数据入库。具体地,公开了一种用于对进入数据库的数据和数据库中的数据并进行处理,并检索所处理的数据的方法和系统。该数据包括多个实体的多个标识。该方法和系统包括:(a)对进入数据库的数据以及数据库中的数据进行处理,(b)在数据库中进行存储之前对接收数据进行增强,(c)根据接收数据和没有任何数据丢失的现有数据中的记录之间的关联确定并匹配记录,(d)根据用户定义的警告规则和关联启动警告,(e)当用于匹配记录的标识随后被确定为公共交叉实体而不是一般特有实体时自动停止另外的匹配并分离先前匹配的记录,(f)接收用于检索存储在数据库中的处理后数据的数据查询,(g)利用相同的算法处理这些查询,以及(h)将处理后的数据传送给使用同一算法的另一数据库。

Description

实时数据入库
本申请是2002年12月27日提交的、发明名称为“实时数据入库”的中国专利申请No.02828375.9的分案申请。
技术领域
本发明总体上涉及用于处理和检索数据仓库中的数据的方法、程序和系统,更具体地,涉及用于处理进入数据仓库的数据和数据仓库内的数据、查询数据仓库中的数据以及分析数据仓库中的数据的方法、程序和系统。
背景技术
数据仓库是基于计算机的数据库,设计为存储记录并对通常来自多个源的查询进行响应。这些记录与诸如个人、机构和财产等的实体相对应。每条记录包括该实体的标识,例如个人的姓名、地址或帐户信息。
遗憾的是,由于创建、维持和/或提高一定的数据质量、完整性和性能等方面的某些局限,当前的数据仓库系统的有效性不高。这些局限还增大了实施、校正和维护这些系统所需的风险、成本和时间。
这些问题和局限性包括但不限于以下各项:(a)与源自各种数据源的不同格式或冲突格式相关的难题,(b)由于在接收时丢失的信息而导致的不完整数据,(c)由于(通常较少)误差或拼写错误而导致的反映同一实体的多条输入记录,(d)识别多条记录是否反映同一实体和/或在多条记录之间是否存在某种关联的能力不足,(e)当合并被确定为反映同一实体的两条记录或者丢弃一条记录时发生的数据丢失,(f)当合并后的记录后来被确定为反映两个独立实体时随后分离记录的能力不足,(g)根据用户定义的警告规则实时地发出警告的能力不足,(h)从利用与用于处理所接收数据的算法或转换处理不同的算法或转换处理进行的查询中获得的不适当的结果,以及(i)不能根据预定的标准(例如,在特定时间段内)来保持持续的查询。
例如,当接收个人的标识并将其存储在数据库中时:(a)可以以逗号分隔的格式获得来自一个源的记录,而以另一种数据格式接收另一个源的记录;(b)可能会丢失来自各种记录的数据,例如电话号码、地址或一些其它的识别信息;或者(c)由于一条记录对应于当前姓名而另一条记录对应于婚前姓名,所以可能会无察觉地接收反映同一个人的两条记录。在后一情况下,系统可能确定应该合并这两条记录或者丢弃一条记录(该记录可能来自于可靠性较低的源)。但是,在合并处理中,当前系统通常会丢弃数据,这就使系统不具备随后在确定这两条记录反映两个独立实体时将两条记录分开的能力。
另外,当接收标识并将其存储在数据库中时,计算机可以在将数据加载到数据库中之前执行转换和增强(enhancing)处理。但是,当前系统的查询工具使用很少的(如果有的话)用于接收并处理所接收数据的转换和增强处理,造成这些查询的结果不一致,因此不适当、不充分并潜在地存在错误。
类似地,当前的数据仓库系统不具有充分识别实体之间的关联或实时地确定这些实体是否反映同一实体的必要工具。例如,一个人可以具有与第二个人相同的地址,而第二个人可以具有与第三个人相同的电话号码。在这种情况下,确定第一个人与第三个人存在某种关联的可能性是很有利的,尤其是实时确定。
此外,当前数据仓库系统在识别实体间的不适当或冲突关系以及根据用户定义的警告规则实时地提供警告方面的能力有限。这种有限的能力出于几个因素,包括但不限于不能有效地识别如上所述的关联性。
另外,当前的数据仓库系统不能首先转换和增强记录,并且随后在预定的时间中保持持续的查询。在各种情况(包括但不限于罪犯调查中识别人名的情况)下,持续查询是很有利的。识别任何与该人相符的匹配的查询可能最初找不到结果并且实际上在当前系统中会抛弃已查询到的数据。但是,以与所接收数据(其中已查询到的数据可以用于匹配其它接收数据或查询,并可提供更好的结果)相同的方式加载查询是很有利的。
因此,当前数据仓库系统的任何或所有问题和局限性(不管在此是否区分)都降低了数据仓库的准确性、可靠性和及时性,并极大地降低了性能。实际上,这些问题可能会导致不适当的结果和基于这些结果的不正确判断。
提供本发明以解决这些和其它问题。
发明内容
本发明的目的是提供一种处理进入数据库的数据和数据库中的数据的方法、程序和系统。该方法优选地包括以下步骤:(a)接收多个实体的数据,(b)利用一算法处理所接收的数据,(c)在数据库中存储经处理的数据,(d)接收用于检索存储在数据库中的数据的数据查询,以及(e)利用相同的算法处理这些查询。
所述数据包括具有表示一个或更多个实体的一个或更多个标识的一个或更多条记录。这些实体可以是个人、财产、机构、蛋白质或者能够由标识数据表示的其它事物。
所述算法包括接收已转换成标准消息格式的数据,并保留这些标识的属性,例如源系统、源系统的唯一标识值、查询系统和/或用户。
算法处理包括在存储到数据库中或在数据库中进行查询之前分析数据,其中该分析步骤可以包括:(a)将一个或更多个标识与用户定义的标准或数据库、列表或其它电子格式中的一个或更多个数据集进行比较,(b)根据用户定义的标准对标识进行格式化,(c)在进行存储或查询之前,通过在其它数据库(这些数据库可以具有与第一数据库相同的算法并以级联的方式继续查找)或列表中的一个或多个数据集中查询附加标识,以使用任何附加标识来补充所接收的数据,由此来增强数据,(d)生成标识的散列键(hash key),以及(d)根据用户定义的标准(例如规定的时间段)存储处理后的查询。
进一步的,该方法、程序和系统包括:(a)利用一算法来处理数据并匹配记录,其中该算法处理包括:(i)从数据库中检索一组记录,该组记录包括与所接收数据中的标识相似的标识,(ii)对所检索到的记录组进行分析以匹配所接收的数据,(iii)将所接收的数据与被确定为反映同一实体的检索记录进行匹配,(iv)分析是否有任何新的标识被添加到任何匹配的记录中,(v)重新查询所检索到的记录组的其它记录以与任何匹配记录进行匹配,以及(b)在数据库中存储匹配记录。另外,该算法可以包括:(a)从数据库中检索一组附加记录,该组附加记录包括与匹配记录中的标识相似的标识,(b)重复这些步骤:检索记录、匹配分析、匹配相同的实体记录、分析新的标识、重新查找所检索到的记录直到找不到其它匹配为止,以及(c)将持续键(persistent key)分配给这些记录。可以分批地或实时地执行这些处理。
进一步地,该方法、程序和系统包括:确定特定的标识是多个实体之间公共的还是某一实体特有的,并且如果用于匹配这些记录的特定标识后来被确定为是多个实体之间公共的而不是某一实体特有的,则分离先前匹配的记录。这种确定和分离步骤可以实时地或分批地执行。该确定和分离步骤可以包括:根据被确定为在多个实体之间是公共的而不是某一实体特有的标识而停止任何另外的匹配,以及重新处理任何所分离的记录。
进一步地,将所接收的数据与至少一个其它先前存储的记录进行比较,以确定多个实体之间的关联性,并且为存在关联的每两个实体创建一条关联记录。该关联记录可以包括一个或多个置信度指示符,用于表示两个实体之间关联的可能性或者两个实体相同的可能性。关联记录也可以对于接收数据中包含的各个实体具有参考作用,或者是指定的。对这些关联记录进行分析以根据用户定义的标准来确定是否存在任何先前未知的关联记录。这些关联记录反映了第一分离程度,其可分析为仅包括那些符合预定标准的记录,例如,分离程度测试的最大次数或者最小关联程度和/或相似性置信度指示符。可以根据用户定义的警告规则发出识别关联记录组的警告。可以通过各种电子通信装置(例如电子邮件消息、电话、个人数字助理或传呼机消息)来传送该警告。
进一步地,该方法包括:(a)在一个或更多个数据库中复制这些关联记录,(b)根据工作负荷标准将所接收的数据分配给一个或更多个附加数据库以进行分析,以及(c)从这些附加数据库中发出任何警告。
进一步地,该方法和系统包括:将所存储的数据传送到另一个数据库,该数据库使用与第一数据库相同的算法。可以实时地或分批地执行处理和传送步骤。
下面将参照附图和说明书对本发明的这些和其它方面与特征进行说明。
附图说明
图1是根据本发明的系统的方框图;
图2是在图1所示系统模块中处理数据的流程图;
图3是图2所示的处理算法模块的流程图;以及
图4是图3所示的用于分析所存储的已分析记录的模块的流程图。
具体实施方式
尽管本发明易于以许多不同的形式实施,但在附图中所示并将在此详细说明的是本发明的具体实施例,应该理解的是,本公开被认为是本发明原理的范例,而并不旨在将本发明限定为所示的具体实施例。
在图1-4中示出了用于处理进入数据库的数据和数据库中的数据以及用于检索处理后的数据的数据处理系统10。系统10包括至少一个具有处理器14和存储器16的传统计算机12。存储器16用于存储可执行软件以操作系统10,以及用于存储数据库和随机存取存储器中的数据。但是,可以将软件存储或设置在任何其它计算机可读介质(例如CD、DVD或软盘)上。计算机12可以从多个源181-18n接收输入。
数据包括具有一个或更多个标识的一个或更多条记录,该一个或更多个标识表示一个或更多个实体。这些实体可以是个人、机构、财产、蛋白质、化学物质或有机化合物、生物统计或原子结构或者可以由标识数据表示的其它事物。个人型实体的标识可以包括个人姓名、(一个或多个)地址、(一个或多个)电话号码、(一个或多个)信用卡号、社会保险号、职业信息、飞行常客(frequent flyer)或其它忠诚计划(loyalty program)或者帐户信息。一般特有标识是特定实体所特有的那些标识,例如个人实体的社会保险号。
系统10从多个源181-18n接收数据,并利用算法22处理所接收的数据20。该算法存储在存储器16中,并由处理器14进行处理或执行。
接收数据20,包括但不限于接收数据的属性(例如,源系统标识),可以类似地以多种数据格式进行接收。在由算法22进行处理之前,将接收数据20转换成标准化消息格式24,例如通用消息格式(Universal Message Format)。
此后,如图3所示,算法22接收标准化数据26并在通过以下步骤在数据库中进行存储或查询之前分析28所接收的数据26:(a)将所接收的数据26与用户定义的标准或规则进行比较以执行多个功能,这些功能包括但不限于:(i)名称标准化30(例如,对照根名(rootname)列表),(ii)地址规范化(hygiene)32(例如,对照邮政编码),(iii)字段测试或转换34(例如,比较性别字段以确定M/F或者将Male转换成M等),(iv)用户定义的格式化36(例如,以999-99-9999格式对所有的社会保险号进行格式化),(b)通过使系统10访问一个或更多个数据库40(数据库40可以包括与第一数据库相同的算法,由此使该系统以级联的方式访问附加数据库)来增强数据38,以查找可以对所接收的数据26进行补充42的附加信息(该信息可以作为接收数据20提交),以及(c)创建分析后的数据44的散列键。可将任何新的、修改后的或增强后的数据存储在新创建的字段中以保持原始数据的完整性。例如,如果以标准化格式26接收到姓名“Bobby Smith”,则可以对照根名列表30将姓名“Bobby”标准化成姓名“Robert”,并存储在新创建的标准姓名字段中。另外,如果接收到Bobby Smith的姓名和地址26,则系统10可访问传统的基于因特网的人员查找数据库40,以获取Bobby Smith的电话号码,随后可以根据用户定义的标准36以标准方式对该电话号码进行格式化。此外,可以将地址字段对照地址列表32,以将文字“Street”添加到标准化地址的结尾处。然后根据增强后的数据创建44散列键并将其存储在新创建的字段中。
系统10还从多个源181-18n接收查询46,并利用相同的算法22分析和处理所接收的查询46。例如,如果接收到对“Bobby Smith”的查询46,则将所接收的姓名“Bobby”标准化为姓名“Robert”的相同算法22也将查询姓名“Bobby”标准化为查询姓名“Robert”。实际上,系统10加载并存储与接收数据20相同的接收查询46,保持查询系统和用户的全部属性。因此,当系统10处理接收查询46时,算法22可以搜索其它数据库40(例如,公共记录数据库),以查找丢失的信息。查询结果94可以比精确匹配更宽泛,并且可以包括多个关联匹配。例如,如果查询的是“Bobby Smith”,则查询结果94可以包括那些曾使用过Bobby Smith的信用卡或者曾居住在Bobby Smith的地址的人的记录。
算法22还在接收到任何接收数据26时执行以下的功能:(a)确定在数据库中是否存在与对应于该接收数据的实体相匹配的现有记录,以及(b)如果存在,则将所接收的数据与该现有记录相匹配。例如,算法从数据库中检索一组记录48(该组记录包括与所接收的数据中的标识相似的标识)来找到可能的候选项,并根据一般特有标识52对所检索到的记录组进行分析,以找出标识了与接收数据相对应的已存储记录的匹配50。如果识别到匹配54,则该算法分析该匹配记录是否包含任何新的或先前未知的标识56。如果存在新的或先前未知的标识56,则算法22将分析该新的或先前未知的标识58,并根据该匹配记录中的新的或先前未知的标识来添加或更新候选列表/关联记录70,并确定是否存在任何另外的匹配50。重复该处理直到找不到其它匹配为止。然后该匹配处理为所有的匹配记录60分配相同的持续键。另外,如果对于任何记录都没有找到匹配,则为不匹配记录分配其自己的持续键62。这些记录保留了数据的全部属性并且匹配处理不会由于合并、清除或删除功能而丢失任何数据。
例如,如果记录#1具有个人姓名、电话号码和地址,而记录#2具有相同的姓名和信用卡号。不知道他们是否是同一个人,所以必须将这两条记录保持分离。然后接收到记录#3的数据,包括个人姓名(与记录#1相同)、地址(与记录#1相同)、电话号码(与记录#1相同)和信用卡号。因为#1和#3的姓名、电话号码和地址匹配,所以系统10可以确定#1和#3描述的是同一个人,所以该算法将#1的数据与#3的数据进行匹配。随后系统10重新运行该算法,将匹配记录#1与候选列表的其它记录或包括与该匹配记录相似的标识的附加记录进行比较。因为匹配记录#1的姓名和信用卡号码与记录#2的姓名和信用卡号码匹配,所以这两条记录也匹配。然后再次将匹配记录与候选列表或检索到的附加记录进行比较以查找匹配54,直到不能获得匹配为止。
有时,系统10可能确定两条记录是错误地匹配。例如,社会保险号被认为是个人的一般特有标识,所以往往根据相同的社会保险号来匹配记录。但是,在某些情况下,该编号可能随后被确定为是多个实体之间公共的而不是某一实体特有的。例如,考虑一数据输入操作,其具有作为必需字段的社会保险号的记录字段,但不知道这些个人的社会保险号的数据输入操作员仅仅为每个人输入号码“123-45-6789”。
在这种情况下,社会保险号在这些个人型实体之间将是公共的,并且不再是这些个人的一般特有标识。因此:(a)将当前已知的公共标识添加到公共标识的列表中,并且所有进一步的处理将不尝试检索候选列表的记录或者不根据该已知的公共标识来生成关联记录70,由此停止所有进一步的匹配64,并且(b)必须分离所有基于该错误的社会保险号匹配的记录以反映匹配前的数据,由此要求先前的数据没有丢失。为了实现后一目的,系统10根据数据的全部属性,将根据错误假设66产生的任何匹配分离为该错误假设之前的点,而不丢失任何数据。因此,如果“Bobby Smith”(其已经标准化成“Robert Smith”)的记录#1已经与“Robert Smith”的记录#2匹配,并且随后确定这是两个不同的个人,并且需要将它们分离为原始的记录#1和2,则该算法将认识到记录#1的标准化“Robert Smith”是“Bobby”。此外,可以实时地或分批地执行确定和分离步骤。而且,可以重新提交分离后的记录作为要在系统中进行处理的新的接收数据。
存在需要对关联(甚至是不太明显的关联)进行评估68的情况。例如,个人#1和#2可以分别与机构#3存在关联。因此可能(很有可能)在个人#1和#2之间存在关联。该关联可扩展到多个分离程度。因此,系统10将所有的接收数据与存储数据中的所有记录进行比较,并为各个实体之间存在某种关联的每一对记录创建关联记录70。该关联记录70可以包括关联类型(例如,父亲、共事者)、置信度指示符(该置信度指示符是表示两个实体的关联强度的分值)72和所分配的持续键60或62。例如,置信度指示符72可以包括关联分值和相似性分值。关联分值是例如在1到10之间的指示符,表示个人#1和个人#2之间存在关联的可能性。相似性分值也是例如在1到10之间的指示符,表示个人#1与个人#2是同一个人。在以上所述的匹配处理的过程中可以识别置信度指示符72。
系统10还对接收数据20和查询46进行分析,以根据具有大于预定值的置信度指示符的关联记录和/或小于预定数值的分离程度的关联记录来确定是否存在满足用户定义警告规则74的标准的情况(例如,两个实体间的不适当关联或者特定形式的行为)。例如,系统10可以包括欺骗性信用卡的列表,该列表可以用于确定任何接收数据或查询是否包含欺骗性信用卡号列表中的信用卡号。另外,用户定义警告规则74可以对接收数据和查询进行报告。例如,在输入新经销商的数据时,如果确定该新经销商与当前雇员具有相同的地址,则可能存在一个警告规则,表示雇主可能想要调查的经销商和雇员之间存在关联。一旦确定要触发用户定义警告规则的情况,系统10就发出警告74,该警告可通过各种媒介(例如,通过电子邮件的消息)传送,或传送到便携通信装置,例如字符数字传呼机、个人数字助理或者电话。
例如,根据用户定义的警告规则,对于具有大于7的关联可能性置信度指示符76的所有记录,对于最大6级的分离程度78,系统10将:(a)从个人#1开始,(b)查找与#1相关的具有大于7的置信度指示符76的所有其它个人80,(c)分析所有的第一级分离个人80,并确定置信度指示符84大于7的与第一级分离个人80相关的所有个人82,并且(d)重复该处理直到满足这6级分离参数为止78。该系统将以电子方式向相关个人或分离系统发送警告74(该警告可以包括根据用户定义标准获得的所有记录),以使得能够进行进一步的操作。
另外,关联记录70可以在几个数据库上进行复制。当接收到接收数据20时,系统将对各个其它数据库的工作负荷特性进行系统评估,并将匹配的/相关的/已分析记录分配给最可能有效分析所存储的已分析记录68的数据库。然后根据源自其它数据库的任何结果发出任何警告74。
最后,可以以实时或分批处理的方式,根据可利用相同算法92的级联数据库公布列表86将处理后的数据传送88给附加数据库。通过这种方式,随后可将所传送的数据88用于与附加数据库和任何后续数据库中的数据(可包括不同的数据)进行匹配,以识别这些数据的关联、匹配或处理。例如,可以将根据本地数据库中的置信度指示符的匹配记录传送88到区域数据库,以与利用相同算法92的数据进行比较和匹配。此后,可以将从该区域数据库获得的处理数据传送88到国家局(national office)。通过在各个步骤中合并所处理的数据,尤其是实时地合并,机构或系统用户将能够确定不适当的或冲突的数据,以提示进一步的操作。
可使用传统的软件代码来实现上述方法、程序和系统的多个功能方面。该代码可以设置在任何计算机可读介质上,以由单个计算机或诸如互联网的分布式计算机网络使用。
通过以上说明,可以知道在不背离本发明的精神和范围的情况下可以进行多种变化和修改。应该理解,对于在此所述的具体设备并不旨在限定的目的,也不应推断为限定的目的。显然,所附权利要求涵盖了落入其范围内的所有这样的修改。

Claims (21)

1.一种分离先前匹配的记录的方法,该方法包括以下步骤:
确定表示至少一个实体的至少一条记录中的特定标识是否是以下各项之一:
表示至少两个不同实体的公共交叉记录,和
表示特定实体的一般特有记录;以及
如果特定的标识被确定为表示至少两个不同实体的公共交叉记录而不是表示特定实体的一般特有记录,则分离先前基于该特定标识而匹配的记录。
2.根据权利要求1所述的方法,还包括如果特定标识被确定为表示多个实体的公共交叉记录而不是表示一个实体的一般特有记录,则禁止基于该特定标识对记录进行任何另外的匹配。
3.根据权利要求1所述的方法,还包括重新处理所分离的记录的步骤。
4.根据权利要求1所述的方法,其中确定特定标识是表示至少两个不同实体的公共交叉记录还是表示特定实体的一般特有记录的步骤是实时执行的。
5.根据权利要求1所述的方法,其中确定特定标识是表示至少两个不同实体的公共交叉记录还是表示特定实体的一般特有记录的步骤是分批执行的。
6.一种处理数据库中的数据的方法,该方法包括以下步骤:
接收数据,该数据包括具有至少一个标识的至少一条记录,各条记录表示多个实体中的至少一个实体;
实时地比较接收数据和数据库中所存储的至少一条记录以确定是否存在关联;
实时地为数据库中所存储的被确定为与接收数据的至少一部分存在关联的各条记录创建关联记录;以及
在所述数据库中存储各条关联记录;
该方法还包括为了分离先前匹配的记录的而执行的以下步骤:
确定表示至少一个实体的至少一条记录中的特定标识是否是以下各项之一:
表示至少两个不同实体的公共交叉记录,和
表示特定实体的一般特有记录;以及
如果特定的标识被确定为表示至少两个不同实体的公共交叉记录而不是表示特定实体的一般特有记录,则分离先前基于该特定标识而匹配的记录。
7.根据权利要求6所述的方法,还包括实时地为各条关联记录创建至少一个置信度指示符的步骤。
8.根据权利要求7所述的方法,其中至少一个置信度指示符表示以下两者之间的关联的可能性:
由与接收数据的所述部分存在关联的特定记录表示的实体,以及
由接收数据的所述部分表示的实体。
9.根据权利要求7所述的方法,其中至少一个置信度指示符表示以下的可能性:
由与接收数据的所述部分存在关联的特定记录表示的实体,和
由接收数据的所述部分表示的实体是相同的。
10.根据权利要求6或7所述的方法,还包括分析所述关联记录以确定这些关联记录是否反映至少一个先前未确定的关联的步骤。
11.根据权利要求10所述的方法,其中分析所述关联记录的步骤包括对反映至少一个级别的分离程度的关联记录进行分析。
12.根据权利要求11所述的方法,其中对反映至少一个级别的分离程度的关联记录进行分析的步骤包括对满足至少一个用户定义标准的关联记录进行分析。
13.根据权利要求12所述的方法,其中对满足至少一个用户定义标准的关联记录进行分析的步骤包括将所分析的关联记录限定为最大级别的分离程度。
14.根据权利要求12所述的方法,其中对满足至少一个用户定义标准的关联记录进行分析的步骤包括将所分析的关联记录限定为具有大于一个最小至的置信度指示符的关联记录。
15.根据权利要求10所述的方法,还包括根据至少一个用户定义的警告规则发出警告的步骤。
16.根据权利要求15所述的方法,其中根据至少一个用户定义的警告规则发出警告的步骤包括通过电子通信装置传送所述警告。
17.根据权利要求16所述的方法,其中所述电子通信装置包括电子邮件系统。
18.根据权利要求16所述的方法,其中所述电子通信装置包括电话。
19.根据权利要求16所述的方法,其中所述电子通信装置包括传呼机。
20.根据权利要求16所述的方法,其中所述电子通信装置包括个人数字助理。
21.根据权利要求15所述的方法,还包括以下步骤:
在至少一个次级数据库上复制所述关联记录;
根据工作负荷标准将接收数据分配给所述至少一个次级数据库以进行分析;以及
从所述至少一个次级数据库中发出满足用户定义警告规则的标准的警告。
CNA200810137940XA 2001-12-28 2002-12-27 实时数据入库 Pending CN101324902A (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US34406701P 2001-12-28 2001-12-28
US60/344,067 2001-12-28

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNB028283759A Division CN100483333C (zh) 2001-12-28 2002-12-27 实时数据入库

Publications (1)

Publication Number Publication Date
CN101324902A true CN101324902A (zh) 2008-12-17

Family

ID=23348900

Family Applications (2)

Application Number Title Priority Date Filing Date
CNB028283759A Expired - Lifetime CN100483333C (zh) 2001-12-28 2002-12-27 实时数据入库
CNA200810137940XA Pending CN101324902A (zh) 2001-12-28 2002-12-27 实时数据入库

Family Applications Before (1)

Application Number Title Priority Date Filing Date
CNB028283759A Expired - Lifetime CN100483333C (zh) 2001-12-28 2002-12-27 实时数据入库

Country Status (14)

Country Link
US (2) US8452787B2 (zh)
EP (1) EP1470475A4 (zh)
JP (3) JP2006501529A (zh)
KR (3) KR100850255B1 (zh)
CN (2) CN100483333C (zh)
AU (1) AU2002367376A1 (zh)
BR (1) BR0215411A (zh)
CA (1) CA2471940C (zh)
EA (1) EA200400873A1 (zh)
IL (1) IL162746A0 (zh)
MX (1) MXPA04006390A (zh)
PL (1) PL374305A1 (zh)
WO (1) WO2003058427A1 (zh)
ZA (1) ZA200405141B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748582A (zh) * 2011-08-24 2014-04-23 国际商业机器公司 基于与共同实体的关系的实体解析
CN109086574A (zh) * 2018-08-16 2018-12-25 国家卫生计生委科学技术研究所 疾病相关蛋白数据库

Families Citing this family (156)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
EA200400873A1 (ru) * 2001-12-28 2005-12-29 Джеффри Джэймс Джонас Хранилище данных реального времени
US7200619B2 (en) * 2002-05-31 2007-04-03 International Business Machines Corporation Method and process to optimize correlation of replicated with extracted data from disparate data sources
EP1563628A4 (en) 2002-11-06 2010-03-10 Ibm COMMON USE OF CONFIDENTIAL DATA AND RESOLUTION OF ANONYTE ENTITIES
US7346927B2 (en) 2002-12-12 2008-03-18 Access Business Group International Llc System and method for storing and accessing secure data
US8620937B2 (en) * 2002-12-27 2013-12-31 International Business Machines Corporation Real time data warehousing
CN100541443C (zh) * 2002-12-31 2009-09-16 国际商业机器公司 用于处理数据的方法和系统
EP1631908A4 (en) * 2003-03-24 2012-01-25 Ibm SECURE COORDINATED IDENTIFICATION METHOD, SYSTEM AND PROGRAM
US7069308B2 (en) * 2003-06-16 2006-06-27 Friendster, Inc. System, method and apparatus for connecting users in an online computer system based on their relationships within social networks
US7747638B1 (en) * 2003-11-20 2010-06-29 Yahoo! Inc. Techniques for selectively performing searches against data and providing search results
US7571174B2 (en) * 2003-12-31 2009-08-04 Thomson Reuters Global Resurces Systems, methods, interfaces and software for automated collection and integration of entity data into online databases and professional directories
US8572221B2 (en) 2004-05-26 2013-10-29 Facebook, Inc. System and method for managing an online social network
US8010458B2 (en) 2004-05-26 2011-08-30 Facebook, Inc. System and method for managing information flow between members of an online social network
US7788260B2 (en) * 2004-06-14 2010-08-31 Facebook, Inc. Ranking search results based on the frequency of clicks on the search results by members of a social network who are within a predetermined degree of separation
US10373173B2 (en) * 2004-06-14 2019-08-06 Facebook, Inc. Online content delivery based on information from social networks
US7478078B2 (en) * 2004-06-14 2009-01-13 Friendster, Inc. Method for sharing relationship information stored in a social network database with third party databases
US8161184B2 (en) * 2004-06-25 2012-04-17 Apple Inc. Method and apparatus for facilitating long-lived DNS queries
US8302164B2 (en) 2004-07-22 2012-10-30 Facebook, Inc. Authorization and authentication based on an individual's social network
US7606687B2 (en) 2004-09-14 2009-10-20 Friendster, Inc. Proximity search methods using tiles to represent geographical zones
US20060085373A1 (en) * 2004-09-30 2006-04-20 Dhillion Jasjit S Method and apparatus for creating relationships over a network
US7451161B2 (en) 2005-04-28 2008-11-11 Friendster, Inc. Compatibility scoring of users in a social network
US9792351B2 (en) * 2005-06-10 2017-10-17 International Business Machines Corporation Tolerant and extensible discovery of relationships in data using structural information and data analysis
WO2007030685A2 (en) * 2005-09-09 2007-03-15 Robert Howe Pinckney Method and system for message storage and retrieval
CN100396002C (zh) * 2005-11-23 2008-06-18 华为技术有限公司 一种利用关联查询进行鉴权的系统及其方法
US8204831B2 (en) 2006-11-13 2012-06-19 International Business Machines Corporation Post-anonymous fuzzy comparisons without the use of pre-anonymization variants
US10452763B2 (en) * 2007-03-08 2019-10-22 Oath Inc. Autocomplete for integrating diverse methods of electronic communication
US9372909B2 (en) * 2007-05-15 2016-06-21 Paypal, Inc. Defining a set of data across mutiple databases using variables and functions
US8156158B2 (en) * 2007-07-18 2012-04-10 Famillion Ltd. Method and system for use of a database of personal data records
DE102007057248A1 (de) * 2007-11-16 2009-05-20 T-Mobile International Ag Verbindungsschicht für Datenbanken
US10733223B2 (en) * 2008-01-08 2020-08-04 International Business Machines Corporation Term-driven records file plan and thesaurus design
CN101277272B (zh) * 2008-05-16 2010-12-15 北京航空航天大学 一种海量广播数据入库的实现方法
WO2010063311A1 (en) * 2008-12-02 2010-06-10 Telefonaktiebolaget L M Ericsson (Publ) System and method for matching entities
US8359337B2 (en) * 2008-12-09 2013-01-22 Ingenix, Inc. Apparatus, system and method for member matching
US9910875B2 (en) * 2008-12-22 2018-03-06 International Business Machines Corporation Best-value determination rules for an entity resolution system
US8732176B2 (en) * 2009-04-28 2014-05-20 Palo Alto Research Center Incorporated Web-based tool for detecting bias in reviews
US9727842B2 (en) 2009-08-21 2017-08-08 International Business Machines Corporation Determining entity relevance by relationships to other relevant entities
US8423525B2 (en) 2010-03-30 2013-04-16 International Business Machines Corporation Life arcs as an entity resolution feature
US9110968B2 (en) 2010-04-14 2015-08-18 At&T Intellectual Property I, L.P. Removal of invisible data packages in data warehouses
US8751521B2 (en) 2010-04-19 2014-06-10 Facebook, Inc. Personalized structured search queries for online social networks
US8185558B1 (en) 2010-04-19 2012-05-22 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US8868603B2 (en) 2010-04-19 2014-10-21 Facebook, Inc. Ambiguous structured search queries on online social networks
US8732208B2 (en) 2010-04-19 2014-05-20 Facebook, Inc. Structured search queries based on social-graph information
US9275101B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Search queries with previews of search results on online social networks
US9223838B2 (en) 2010-04-19 2015-12-29 Facebook, Inc. Sponsored search queries on online social networks
US8180804B1 (en) 2010-04-19 2012-05-15 Facebook, Inc. Dynamically generating recommendations based on social graph information
US9633121B2 (en) 2010-04-19 2017-04-25 Facebook, Inc. Personalizing default search queries on online social networks
US8572129B1 (en) 2010-04-19 2013-10-29 Facebook, Inc. Automatically generating nodes and edges in an integrated social graph
US9275119B2 (en) 2010-04-19 2016-03-01 Facebook, Inc. Sharing search queries on online social network
US8918418B2 (en) 2010-04-19 2014-12-23 Facebook, Inc. Default structured search queries on online social networks
US9092485B2 (en) 2010-04-19 2015-07-28 Facebook, Inc. Dynamic suggested search queries on online social networks
US9262482B2 (en) 2010-04-19 2016-02-16 Facebook, Inc. Generating default search queries on online social networks
US10402419B1 (en) 2010-04-19 2019-09-03 Facebook, Inc. Search queries with previews of search results on online social networks
US8782080B2 (en) 2010-04-19 2014-07-15 Facebook, Inc. Detecting social graph elements for structured search queries
CN102314460B (zh) * 2010-07-07 2014-05-14 阿里巴巴集团控股有限公司 数据分析方法、系统及服务器
US8468119B2 (en) * 2010-07-14 2013-06-18 Business Objects Software Ltd. Matching data from disparate sources
CN102214228B (zh) * 2011-06-24 2013-03-13 国电南瑞科技股份有限公司 大电网分布式实时数据库系统的数据管理方法
US8943059B2 (en) * 2011-12-21 2015-01-27 Sap Se Systems and methods for merging source records in accordance with survivorship rules
US8812542B1 (en) * 2012-03-30 2014-08-19 Emc Corporation On-the-fly determining of alert relationships in a distributed system
US20130339186A1 (en) * 2012-06-15 2013-12-19 Eventbrite, Inc. Identifying Fraudulent Users Based on Relational Information
US8935255B2 (en) 2012-07-27 2015-01-13 Facebook, Inc. Social static ranking for search
US9398104B2 (en) 2012-12-20 2016-07-19 Facebook, Inc. Ranking test framework for search results on an online social network
US9223826B2 (en) 2013-02-25 2015-12-29 Facebook, Inc. Pushing suggested search queries to mobile devices
US9910887B2 (en) 2013-04-25 2018-03-06 Facebook, Inc. Variable search query vertical access
US9330183B2 (en) 2013-05-08 2016-05-03 Facebook, Inc. Approximate privacy indexing for search queries on online social networks
US9223898B2 (en) 2013-05-08 2015-12-29 Facebook, Inc. Filtering suggested structured queries on online social networks
US9305322B2 (en) 2013-07-23 2016-04-05 Facebook, Inc. Native application testing
US9317614B2 (en) 2013-07-30 2016-04-19 Facebook, Inc. Static rankings for search queries on online social networks
US9514230B2 (en) 2013-07-30 2016-12-06 Facebook, Inc. Rewriting search queries on online social networks
US9460215B2 (en) 2013-12-19 2016-10-04 Facebook, Inc. Ranking recommended search queries on online social networks
US9336300B2 (en) 2014-01-17 2016-05-10 Facebook, Inc. Client-side search templates for online social networks
US9477760B2 (en) 2014-02-12 2016-10-25 Facebook, Inc. Query construction on online social networks
US9798832B1 (en) 2014-03-31 2017-10-24 Facebook, Inc. Dynamic ranking of user cards
US9794359B1 (en) 2014-03-31 2017-10-17 Facebook, Inc. Implicit contacts in an online social network
US11169773B2 (en) 2014-04-01 2021-11-09 TekWear, LLC Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device
WO2015153779A1 (en) * 2014-04-01 2015-10-08 TekWear, LLC Systems, methods, and apparatuses for agricultural data collection, analysis, and management via a mobile device
US9646055B2 (en) 2014-04-03 2017-05-09 Facebook, Inc. Blending search results on online social networks
US9679078B2 (en) 2014-05-21 2017-06-13 Facebook, Inc. Search client context on online social networks
US10268763B2 (en) 2014-07-25 2019-04-23 Facebook, Inc. Ranking external content on online social networks
US10255244B2 (en) 2014-08-01 2019-04-09 Facebook, Inc. Search results based on user biases on online social networks
US9871714B2 (en) 2014-08-01 2018-01-16 Facebook, Inc. Identifying user biases for search results on online social networks
US9792364B2 (en) 2014-08-08 2017-10-17 Facebook, Inc. Blending search results on online social networks
US10120909B2 (en) 2014-08-22 2018-11-06 Facebook, Inc. Generating cards in response to user actions on online social networks
US9754037B2 (en) 2014-08-27 2017-09-05 Facebook, Inc. Blending by query classification on online social networks
US9703859B2 (en) 2014-08-27 2017-07-11 Facebook, Inc. Keyword search queries on online social networks
US10255365B2 (en) 2014-08-29 2019-04-09 Facebook, Inc. Priming search results on online social networks
US10740412B2 (en) 2014-09-05 2020-08-11 Facebook, Inc. Pivoting search results on online social networks
US9507876B2 (en) 2014-10-06 2016-11-29 Facebook, Inc. Constructing queries using query filters on online social networks
US9703870B2 (en) 2014-11-05 2017-07-11 Facebook, Inc. Social-based optimization of web crawling for online social networks
US10409873B2 (en) 2014-11-26 2019-09-10 Facebook, Inc. Searching for content by key-authors on online social networks
US10552759B2 (en) 2014-12-01 2020-02-04 Facebook, Inc. Iterative classifier training on online social networks
US9679024B2 (en) 2014-12-01 2017-06-13 Facebook, Inc. Social-based spelling correction for online social networks
US9990441B2 (en) 2014-12-05 2018-06-05 Facebook, Inc. Suggested keywords for searching content on online social networks
US10102273B2 (en) 2014-12-30 2018-10-16 Facebook, Inc. Suggested queries for locating posts on online social networks
US10061856B2 (en) 2015-01-29 2018-08-28 Facebook, Inc. Multimedia search using reshare text on online social networks
US20160224993A1 (en) * 2015-02-03 2016-08-04 Bank Of America Corporation System for determining relationships between entities
US10997257B2 (en) 2015-02-06 2021-05-04 Facebook, Inc. Aggregating news events on online social networks
US10095683B2 (en) 2015-04-10 2018-10-09 Facebook, Inc. Contextual speller models on online social networks
US10049099B2 (en) 2015-04-10 2018-08-14 Facebook, Inc. Spell correction with hidden markov models on online social networks
US10628636B2 (en) 2015-04-24 2020-04-21 Facebook, Inc. Live-conversation modules on online social networks
US10298535B2 (en) 2015-05-19 2019-05-21 Facebook, Inc. Civic issues platforms on online social networks
US10397167B2 (en) 2015-06-19 2019-08-27 Facebook, Inc. Live social modules on online social networks
US10509832B2 (en) 2015-07-13 2019-12-17 Facebook, Inc. Generating snippet modules on online social networks
US10268664B2 (en) 2015-08-25 2019-04-23 Facebook, Inc. Embedding links in user-created content on online social networks
US10810217B2 (en) 2015-10-07 2020-10-20 Facebook, Inc. Optionalization and fuzzy search on online social networks
US9602965B1 (en) 2015-11-06 2017-03-21 Facebook, Inc. Location-based place determination using online social networks
US10795936B2 (en) 2015-11-06 2020-10-06 Facebook, Inc. Suppressing entity suggestions on online social networks
US10270868B2 (en) 2015-11-06 2019-04-23 Facebook, Inc. Ranking of place-entities on online social networks
US10534814B2 (en) 2015-11-11 2020-01-14 Facebook, Inc. Generating snippets on online social networks
US10387511B2 (en) 2015-11-25 2019-08-20 Facebook, Inc. Text-to-media indexes on online social networks
CN106817390B (zh) 2015-12-01 2020-04-24 阿里巴巴集团控股有限公司 一种用户数据共享的方法和设备
US10740368B2 (en) 2015-12-29 2020-08-11 Facebook, Inc. Query-composition platforms on online social networks
US10853335B2 (en) 2016-01-11 2020-12-01 Facebook, Inc. Identification of real-best-pages on online social networks
US10262039B1 (en) 2016-01-15 2019-04-16 Facebook, Inc. Proximity-based searching on online social networks
US10162899B2 (en) 2016-01-15 2018-12-25 Facebook, Inc. Typeahead intent icons and snippets on online social networks
US10740375B2 (en) 2016-01-20 2020-08-11 Facebook, Inc. Generating answers to questions using information posted by users on online social networks
US10242074B2 (en) 2016-02-03 2019-03-26 Facebook, Inc. Search-results interfaces for content-item-specific modules on online social networks
US10270882B2 (en) 2016-02-03 2019-04-23 Facebook, Inc. Mentions-modules on online social networks
US10216850B2 (en) 2016-02-03 2019-02-26 Facebook, Inc. Sentiment-modules on online social networks
US10157224B2 (en) 2016-02-03 2018-12-18 Facebook, Inc. Quotations-modules on online social networks
US10452671B2 (en) 2016-04-26 2019-10-22 Facebook, Inc. Recommendations from comments on online social networks
US10659299B1 (en) 2016-06-30 2020-05-19 Facebook, Inc. Managing privacy settings for content on online social networks
US10635661B2 (en) 2016-07-11 2020-04-28 Facebook, Inc. Keyboard-based corrections for search queries on online social networks
US10223464B2 (en) 2016-08-04 2019-03-05 Facebook, Inc. Suggesting filters for search on online social networks
US10282483B2 (en) 2016-08-04 2019-05-07 Facebook, Inc. Client-side caching of search keywords for online social networks
US10726022B2 (en) 2016-08-26 2020-07-28 Facebook, Inc. Classifying search queries on online social networks
US10534815B2 (en) 2016-08-30 2020-01-14 Facebook, Inc. Customized keyword query suggestions on online social networks
US10102255B2 (en) 2016-09-08 2018-10-16 Facebook, Inc. Categorizing objects for queries on online social networks
US10645142B2 (en) 2016-09-20 2020-05-05 Facebook, Inc. Video keyframes display on online social networks
US10026021B2 (en) 2016-09-27 2018-07-17 Facebook, Inc. Training image-recognition systems using a joint embedding model on online social networks
US10083379B2 (en) 2016-09-27 2018-09-25 Facebook, Inc. Training image-recognition systems based on search queries on online social networks
US10579688B2 (en) 2016-10-05 2020-03-03 Facebook, Inc. Search ranking and recommendations for online social networks based on reconstructed embeddings
US10311117B2 (en) 2016-11-18 2019-06-04 Facebook, Inc. Entity linking to query terms on online social networks
US10650009B2 (en) 2016-11-22 2020-05-12 Facebook, Inc. Generating news headlines on online social networks
US10162886B2 (en) 2016-11-30 2018-12-25 Facebook, Inc. Embedding-based parsing of search queries on online social networks
US10313456B2 (en) 2016-11-30 2019-06-04 Facebook, Inc. Multi-stage filtering for recommended user connections on online social networks
US10235469B2 (en) 2016-11-30 2019-03-19 Facebook, Inc. Searching for posts by related entities on online social networks
US10185763B2 (en) 2016-11-30 2019-01-22 Facebook, Inc. Syntactic models for parsing search queries on online social networks
US11223699B1 (en) 2016-12-21 2022-01-11 Facebook, Inc. Multiple user recognition with voiceprints on online social networks
US10607148B1 (en) 2016-12-21 2020-03-31 Facebook, Inc. User identification with voiceprints on online social networks
US10535106B2 (en) 2016-12-28 2020-01-14 Facebook, Inc. Selecting user posts related to trending topics on online social networks
US10489472B2 (en) 2017-02-13 2019-11-26 Facebook, Inc. Context-based search suggestions on online social networks
US10614141B2 (en) 2017-03-15 2020-04-07 Facebook, Inc. Vital author snippets on online social networks
US10769222B2 (en) 2017-03-20 2020-09-08 Facebook, Inc. Search result ranking based on post classifiers on online social networks
US11379861B2 (en) 2017-05-16 2022-07-05 Meta Platforms, Inc. Classifying post types on online social networks
US10248645B2 (en) 2017-05-30 2019-04-02 Facebook, Inc. Measuring phrase association on online social networks
US10268646B2 (en) 2017-06-06 2019-04-23 Facebook, Inc. Tensor-based deep relevance model for search on online social networks
US10489468B2 (en) 2017-08-22 2019-11-26 Facebook, Inc. Similarity search using progressive inner products and bounds
US10776437B2 (en) 2017-09-12 2020-09-15 Facebook, Inc. Time-window counters for search results on online social networks
US10678786B2 (en) 2017-10-09 2020-06-09 Facebook, Inc. Translating search queries on online social networks
US10810214B2 (en) 2017-11-22 2020-10-20 Facebook, Inc. Determining related query terms through query-post associations on online social networks
US10963514B2 (en) 2017-11-30 2021-03-30 Facebook, Inc. Using related mentions to enhance link probability on online social networks
US10129705B1 (en) 2017-12-11 2018-11-13 Facebook, Inc. Location prediction using wireless signals on online social networks
US11604968B2 (en) 2017-12-11 2023-03-14 Meta Platforms, Inc. Prediction of next place visits on online social networks
CN110019274B (zh) 2017-12-29 2023-09-26 阿里巴巴集团控股有限公司 一种数据库系统以及查询数据库的方法和装置
CN108509182A (zh) * 2018-02-27 2018-09-07 北京航空航天大学 将非结构化大数据进行结构化处理并融合的软件技术
JP7012879B2 (ja) * 2019-11-06 2022-01-28 アリペイ (ハンジョウ) インフォメーション テクノロジー カンパニー リミテッド 誤り訂正符号に基づく共有されたブロックチェーンデータの記憶のコンセンサス
CN114969041B (zh) * 2022-05-27 2023-06-30 河北省科学技术情报研究院(河北省科技创新战略研究院) 一种多源主附实体同一性甄别及数据自补的处理方法

Family Cites Families (111)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US579424A (en) * 1897-03-23 Edwakd c
US599175A (en) * 1898-02-15 Washing-machine
US1261167A (en) * 1917-10-25 1918-04-02 Robert C Russell Index.
US3659085A (en) * 1970-04-30 1972-04-25 Sierra Research Corp Computer determining the location of objects in a coordinate system
US4232313A (en) * 1972-09-22 1980-11-04 The United States Of America As Represented By The Secretary Of The Navy Tactical nagivation and communication system
US5010478A (en) * 1986-04-11 1991-04-23 Deran Roger L Entity-attribute value database system with inverse attribute for selectively relating two different entities
JPS63282838A (ja) 1987-05-14 1988-11-18 Fujitsu Ltd 名寄せ処理方式
JPH0212563A (ja) * 1988-06-30 1990-01-17 Nec Corp 情報管理方式
US5345587A (en) * 1988-09-14 1994-09-06 Digital Equipment Corporation Extensible entity management system including a dispatching kernel and modules which independently interpret and execute commands
JPH0317792A (ja) 1989-06-14 1991-01-25 Mitsubishi Plastics Ind Ltd カードの記録方法
JPH03177972A (ja) * 1989-12-07 1991-08-01 Nec Corp データベースシステム
US4981370A (en) * 1990-01-29 1991-01-01 Dziewit Halina S Document authentication apparatus
US5555409A (en) * 1990-12-04 1996-09-10 Applied Technical Sysytem, Inc. Data management systems and methods including creation of composite views of data
JPH04237373A (ja) * 1991-01-22 1992-08-25 Toshiba Corp キーワード入力方式
US5560006A (en) * 1991-05-15 1996-09-24 Automated Technology Associates, Inc. Entity-relation database
US5229764A (en) * 1991-06-20 1993-07-20 Matchett Noel D Continuous biometric authentication matrix
JP2922347B2 (ja) * 1991-11-07 1999-07-19 富士通株式会社 異種データベース間のデータ結合装置及びデータ結合方法
JPH05250416A (ja) * 1992-03-06 1993-09-28 Toshiba Eng Co Ltd データベースの登録・検索装置
DE69332633T2 (de) * 1992-07-20 2003-11-06 Compaq Computer Corp Verfahren und Sytem um, auf Bescheinigung gestützt, Alias zu entdecken
US5403639A (en) * 1992-09-02 1995-04-04 Storage Technology Corporation File server having snapshot application data groups
US5454101A (en) * 1992-09-15 1995-09-26 Universal Firmware Industries, Ltd. Data storage system with set lists which contain elements associated with parents for defining a logical hierarchy and general record pointers identifying specific data sets
US5742806A (en) * 1994-01-31 1998-04-21 Sun Microsystems, Inc. Apparatus and method for decomposing database queries for database management system including multiprocessor digital data processing system
US5764977A (en) * 1994-03-30 1998-06-09 Siemens Stromberg-Carlson Distributed database architecture and distributed database management system for open network evolution
US5848373A (en) * 1994-06-24 1998-12-08 Delorme Publishing Company Computer aided map location system
JPH0863382A (ja) * 1994-08-19 1996-03-08 Fujitsu Ltd 分散システムにおけるデータ整合性確認方法及びデータ整合性確認装置
US5675785A (en) * 1994-10-04 1997-10-07 Hewlett-Packard Company Data warehouse which is accessed by a user using a schema of virtual tables
US5873093A (en) * 1994-12-07 1999-02-16 Next Software, Inc. Method and apparatus for mapping objects to a data source
US5799309A (en) * 1994-12-29 1998-08-25 International Business Machines Corporation Generating an optimized set of relational queries fetching data in an object-relational database
JPH08305662A (ja) * 1995-05-02 1996-11-22 Fujitsu Ltd クライアント認証システムおよび方法
US5659731A (en) * 1995-06-19 1997-08-19 Dun & Bradstreet, Inc. Method for rating a match for a given entity found in a list of entities
US5758343A (en) * 1995-12-08 1998-05-26 Ncr Corporation Apparatus and method for integrating multiple delegate directory service agents
US6035300A (en) * 1995-12-15 2000-03-07 International Business Machines Corporation Method and apparatus for generating a user interface from the entity/attribute/relationship model of a database
US5991733A (en) * 1996-03-22 1999-11-23 Hartford Fire Insurance Company Method and computerized system for managing insurance receivable accounts
US5878416A (en) * 1996-06-14 1999-03-02 Electronic Data Systems Corporation Automated system and method for matching an item of business property to a recipient
US5778375A (en) * 1996-06-27 1998-07-07 Microsoft Corporation Database normalizing system
US6052693A (en) * 1996-07-02 2000-04-18 Harlequin Group Plc System for assembling large databases through information extracted from text sources
US5819263A (en) * 1996-07-19 1998-10-06 American Express Financial Corporation Financial planning system incorporating relationship and group management
US5781911A (en) * 1996-09-10 1998-07-14 D2K, Incorporated Integrated system and method of data warehousing and delivery
US5892828A (en) * 1996-10-23 1999-04-06 Novell, Inc. User presence verification with single password across applications
US6076167A (en) * 1996-12-04 2000-06-13 Dew Engineering And Development Limited Method and system for improving security in network applications
US5845285A (en) * 1997-01-07 1998-12-01 Klein; Laurence C. Computer system and method of data analysis
JP4268690B2 (ja) * 1997-03-26 2009-05-27 ソニー株式会社 認証システムおよび方法、並びに認証方法
JP4027455B2 (ja) * 1997-03-31 2007-12-26 富士通株式会社 データベース管理システム
CA2286097C (en) * 1997-04-16 2006-11-07 British Telecommunications Public Limited Company Data summariser
US6272495B1 (en) * 1997-04-22 2001-08-07 Greg Hetherington Method and apparatus for processing free-format data
US5794246A (en) * 1997-04-30 1998-08-11 Informatica Corporation Method for incremental aggregation of dynamically increasing database data sets
US6032158A (en) * 1997-05-02 2000-02-29 Informatica Corporation Apparatus and method for capturing and propagating changes from an operational database to data marts
US5991765A (en) * 1997-05-06 1999-11-23 Birdstep Technology As System and method for storing and manipulating data in an information handling system
US6202151B1 (en) * 1997-05-09 2001-03-13 Gte Service Corporation System and method for authenticating electronic transactions using biometric certificates
US5991408A (en) * 1997-05-16 1999-11-23 Veridicom, Inc. Identification and security using biometric measurements
JP3547069B2 (ja) * 1997-05-22 2004-07-28 日本電信電話株式会社 情報関連づけ装置およびその方法
US5991758A (en) * 1997-06-06 1999-11-23 Madison Information Technologies, Inc. System and method for indexing information about entities from different information sources
US6122757A (en) * 1997-06-27 2000-09-19 Agilent Technologies, Inc Code generating system for improved pattern matching in a protocol analyzer
US6092199A (en) * 1997-07-07 2000-07-18 International Business Machines Corporation Dynamic creation of a user account in a client following authentication from a non-native server domain
US6073140A (en) * 1997-07-29 2000-06-06 Acxiom Corporation Method and system for the creation, enhancement and update of remote data using persistent keys
US6523041B1 (en) * 1997-07-29 2003-02-18 Acxiom Corporation Data linking system and method using tokens
US5995973A (en) * 1997-08-29 1999-11-30 International Business Machines Corporation Storing relationship tables identifying object relationships
US6044378A (en) * 1997-09-29 2000-03-28 International Business Machines Corporation Method and system for a federated digital library by managing links
US6357004B1 (en) * 1997-09-30 2002-03-12 Intel Corporation System and method for ensuring integrity throughout post-processing
US6014670A (en) * 1997-11-07 2000-01-11 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6339775B1 (en) * 1997-11-07 2002-01-15 Informatica Corporation Apparatus and method for performing data transformations in data warehousing
US6035306A (en) * 1997-11-24 2000-03-07 Terascape Software Inc. Method for improving performance of large databases
US6041410A (en) * 1997-12-22 2000-03-21 Trw Inc. Personal identification fob
US6263446B1 (en) * 1997-12-23 2001-07-17 Arcot Systems, Inc. Method and apparatus for secure distribution of authentication credentials to roaming users
JPH11184884A (ja) 1997-12-24 1999-07-09 Ntt Data Corp 同一人判定システムおよび方法
US5933831A (en) * 1998-01-09 1999-08-03 Lsi Logic Corporation Viewing entity relationship diagrams using hyperlinks
US6418450B2 (en) * 1998-01-26 2002-07-09 International Business Machines Corporation Data warehouse programs architecture
US6845453B2 (en) * 1998-02-13 2005-01-18 Tecsec, Inc. Multiple factor-based user identification and authentication
US6049805A (en) * 1998-02-24 2000-04-11 Microsoft Corporation Dynamic event mechanism for objects with associational relationships
GB2336007B (en) * 1998-04-01 2003-01-29 Mitel Corp Agent-based data mining and warehousing
JP3437441B2 (ja) * 1998-04-08 2003-08-18 日本電信電話株式会社 検索方法、検索装置、および検索プログラムを記録した記録媒体
US6167517A (en) * 1998-04-09 2000-12-26 Oracle Corporation Trusted biometric client authentication
US6160903A (en) * 1998-04-24 2000-12-12 Dew Engineering And Development Limited Method of providing secure user access
US6684334B1 (en) * 1998-05-27 2004-01-27 Trusted Security Solutions, Inc. Secure establishment of cryptographic keys using persistent key component
US6208990B1 (en) * 1998-07-15 2001-03-27 Informatica Corporation Method and architecture for automated optimization of ETL throughput in data warehousing applications
US6185557B1 (en) * 1998-07-31 2001-02-06 Unisys Corporation Merge join process
US6743022B1 (en) * 1998-12-03 2004-06-01 Oded Sarel System and method for automated self measurement of alertness equilibrium and coordination and for ventification of the identify of the person performing tasks
US6931392B1 (en) * 1998-12-07 2005-08-16 Vitria Technology, Inc. Real-time decision support system
US6819797B1 (en) * 1999-01-29 2004-11-16 International Business Machines Corporation Method and apparatus for classifying and querying temporal and spatial information in video
US6317834B1 (en) * 1999-01-29 2001-11-13 International Business Machines Corporation Biometric authentication system with encrypted models
AU2523300A (en) 1999-04-07 2000-10-12 Reclaim Technologies And Sservices, Ltd. A system for identification of selectively related database records
US20020038308A1 (en) * 1999-05-27 2002-03-28 Michael Cappi System and method for creating a virtual data warehouse
US6697947B1 (en) * 1999-06-17 2004-02-24 International Business Machines Corporation Biometric based multi-party authentication
US6385604B1 (en) * 1999-08-04 2002-05-07 Hyperroll, Israel Limited Relational database management system having integrated non-relational multi-dimensional data store of aggregated data elements
JP2001118103A (ja) * 1999-10-15 2001-04-27 Oki Electric Ind Co Ltd ゲート管理装置
EP1226555B1 (en) * 1999-10-19 2008-10-08 Stamps.Com Address matching system and method
JP2001117940A (ja) 1999-10-20 2001-04-27 Just Syst Corp 情報検索装置、情報検索方法およびその方法をコンピュータに実行させるプログラムを記録したコンピュータ読み取り可能な記録媒体
US7003560B1 (en) * 1999-11-03 2006-02-21 Accenture Llp Data warehouse computing system
NZ543166A (en) * 2000-04-07 2006-12-22 Procter & Gamble Monitoring the effective velocity of items through a store or warehouse for predicting stock levels
JP2001325425A (ja) 2000-05-15 2001-11-22 Fujitsu Ltd 名寄せ処理システム
GB2366160B (en) * 2000-08-09 2004-03-17 Michaelhouse Man Ltd Information routing
US7302582B2 (en) * 2000-08-21 2007-11-27 United States Postal Service Delivery point validation system
US6675476B2 (en) * 2000-12-05 2004-01-13 Hewlett-Packard Development Company, L.P. Slotted substrates and techniques for forming same
US6757689B2 (en) * 2001-02-02 2004-06-29 Hewlett-Packard Development Company, L.P. Enabling a zero latency enterprise
US6886747B2 (en) * 2001-03-22 2005-05-03 United States Postal Service System and method for standardizing a mailing address
US7856420B2 (en) * 2001-04-19 2010-12-21 Hewlett-Packard Development Company, L.P. Zero latency enterprise enriched publish/subscribe
US7092951B1 (en) * 2001-07-06 2006-08-15 Ncr Corporation Auxiliary relation for materialized view
US20030030733A1 (en) * 2001-08-08 2003-02-13 Seaman Mark D. System and method for synchronization of media data
US6912549B2 (en) * 2001-09-05 2005-06-28 Siemens Medical Solutions Health Services Corporation System for processing and consolidating records
US7370044B2 (en) * 2001-11-19 2008-05-06 Equifax, Inc. System and method for managing and updating information relating to economic entities
EA200400873A1 (ru) * 2001-12-28 2005-12-29 Джеффри Джэймс Джонас Хранилище данных реального времени
WO2003077075A2 (en) * 2002-03-06 2003-09-18 United States Postal Service A method for correcting a mailing address
WO2003081440A1 (en) * 2002-03-21 2003-10-02 Snapp Robert F Method and system for storing and retrieving data using hash-accessed multiple data stores
US7096213B2 (en) * 2002-04-08 2006-08-22 Oracle International Corporation Persistent key-value repository with a pluggable architecture to abstract physical storage
US6968338B1 (en) 2002-08-29 2005-11-22 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Extensible database framework for management of unstructured and semi-structured documents
US7159119B2 (en) * 2002-09-06 2007-01-02 United States Postal Service Method and system for efficiently retrieving secured data by securely pre-processing provided access information
EP1563628A4 (en) * 2002-11-06 2010-03-10 Ibm COMMON USE OF CONFIDENTIAL DATA AND RESOLUTION OF ANONYTE ENTITIES
US20040099313A1 (en) * 2002-11-26 2004-05-27 Gotthelf Jeffrey Bryan Fluid flow pressure regulator
CN100541443C (zh) * 2002-12-31 2009-09-16 国际商业机器公司 用于处理数据的方法和系统
US7200602B2 (en) * 2003-02-07 2007-04-03 International Business Machines Corporation Data set comparison and net change processing
EP1631908A4 (en) 2003-03-24 2012-01-25 Ibm SECURE COORDINATED IDENTIFICATION METHOD, SYSTEM AND PROGRAM

Cited By (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103748582A (zh) * 2011-08-24 2014-04-23 国际商业机器公司 基于与共同实体的关系的实体解析
CN103748582B (zh) * 2011-08-24 2016-12-21 国际商业机器公司 基于与共同实体的关系的实体解析
CN109086574A (zh) * 2018-08-16 2018-12-25 国家卫生计生委科学技术研究所 疾病相关蛋白数据库
CN109086574B (zh) * 2018-08-16 2022-01-07 国家卫生健康委科学技术研究所 疾病相关蛋白数据库

Also Published As

Publication number Publication date
WO2003058427A1 (en) 2003-07-17
KR100850255B1 (ko) 2008-08-19
JP2009059372A (ja) 2009-03-19
KR20070112422A (ko) 2007-11-23
US8452787B2 (en) 2013-05-28
AU2002367376A1 (en) 2003-07-24
KR100877461B1 (ko) 2009-01-07
US20060010119A1 (en) 2006-01-12
PL374305A1 (en) 2005-10-03
KR20040088036A (ko) 2004-10-15
CA2471940A1 (en) 2003-07-17
MXPA04006390A (es) 2005-06-08
US20030154194A1 (en) 2003-08-14
JP4366433B2 (ja) 2009-11-18
JP4456646B2 (ja) 2010-04-28
KR100856771B1 (ko) 2008-09-05
IL162746A0 (en) 2005-11-20
EP1470475A4 (en) 2009-04-22
EP1470475A1 (en) 2004-10-27
JP2009059371A (ja) 2009-03-19
US8615521B2 (en) 2013-12-24
JP2006501529A (ja) 2006-01-12
CN100483333C (zh) 2009-04-29
ZA200405141B (en) 2005-11-21
WO2003058427A8 (en) 2005-06-02
CA2471940C (en) 2019-03-05
CN1656442A (zh) 2005-08-17
KR20070112423A (ko) 2007-11-23
EA200400873A1 (ru) 2005-12-29
BR0215411A (pt) 2005-09-06

Similar Documents

Publication Publication Date Title
CN100483333C (zh) 实时数据入库
US8620937B2 (en) Real time data warehousing
US8768914B2 (en) System and method for searching and matching databases
US20040133561A1 (en) System and method for identifying alternate contact information
JP2006501529A5 (zh)
CN110659282A (zh) 数据路由的构建方法、装置、计算机设备和存储介质
CN112506925A (zh) 一种基于区块链的数据检索系统及方法
CN111930794A (zh) 统计指标编码规范化管理系统及方法
CN116032741A (zh) 一种设备识别方法、装置、电子设备和计算机存储介质
CN112612817A (zh) 数据处理方法、装置、终端设备及计算机可读存储介质
CN111695031A (zh) 基于标签的搜索方法、装置、服务器及存储介质
CN116938999B (zh) 一种基于grpc的多方信息传递及状态同步方法、系统及介质
CN111695000B (zh) 一种多源大数据加载方法及系统
CN115934556A (zh) 基于脑图结构的数值计算系统
US7191166B2 (en) Method and system for comparing information contents
CN110609959A (zh) 基于项目生命周期的检索方法、存储介质及电子设备
CN117131267A (zh) 消息推送系统及方法
CN115794765A (zh) 一种元数据服务方法、装置、设备及存储介质

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C12 Rejection of a patent application after its publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20081217