CN1325513A - 具有知识生成能力的文档语义分析/选择 - Google Patents

具有知识生成能力的文档语义分析/选择 Download PDF

Info

Publication number
CN1325513A
CN1325513A CN99813079A CN99813079A CN1325513A CN 1325513 A CN1325513 A CN 1325513A CN 99813079 A CN99813079 A CN 99813079A CN 99813079 A CN99813079 A CN 99813079A CN 1325513 A CN1325513 A CN 1325513A
Authority
CN
China
Prior art keywords
sao
request
expression
candidate documents
document
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN99813079A
Other languages
English (en)
Inventor
瓦莱里M·楚里科夫
利奥尼德S·巴奇洛
伊戈尔V·索夫佩尔
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Invention Machine Corp
Original Assignee
Invention Machine Corp
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Invention Machine Corp filed Critical Invention Machine Corp
Publication of CN1325513A publication Critical patent/CN1325513A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/3331Query processing
    • G06F16/334Query execution
    • G06F16/3344Query execution using natural language analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/205Parsing
    • G06F40/221Parsing markup language streams
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/20Natural language analysis
    • G06F40/279Recognition of textual entities
    • G06F40/284Lexical analysis, e.g. tokenisation or collocates
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F40/00Handling natural language data
    • G06F40/30Semantic analysis
    • G06F40/35Discourse or dialogue representation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation

Abstract

一种基于计算机的软件系统和方法,用于在语义上处理用户输入的自然语言请求,以识别(16)和存储(18)语言的主语-动作-宾语(SAO)结构,采用这个结构作为关键词/短语(24)来搜索(30)本地和基于万维网的数据库,以便下载(12)候选自然语言文档,将候选文档文本在语义上处理为候选文档SAO结构,并只选择和存储其SAO结构包括与所存储的请求SAO结构的匹配的相关文档。进一步的特征包括分析在相关文档SAO结构之间的关系,并根据这种关系生成可以产生新的知识概念和思想以供显示给用户的新的SAO结构(20),并根据相关文档SAO结构产生和显示自然语言概要(22,26)。

Description

具有知识生成能力的文档语义分析/选择
本申请要求1998年9月9日申请的美国临时申请No.60/099,641的利益。
本发明涉及用于在语义上分析、选择和总结包含特定内容或主题的候选文档的基于计算机的设备和方法。
已知有基于计算机的文档搜索处理器用于对因特网和万维网上的出版物执行关键词搜索。现在,信息所有者和服务提供者正使他们的数据库适应个人口味和需求。例如,Boston based Agents,Inc.在网络上为音乐迷提供个人化的业务通讯,从而阻止古典音乐爱好者接收Rap音乐广告,反之亦然。香港的KD,Inc.已经开发出一个在搜索网络的同时考虑在感觉上类似的词的系统。现在,用户可以通过输入词“Screen”从网络下载10,000个报纸。由KD,Inc.设计的搜索系统询问用户是否他/她正在寻找关于计算机屏幕、电视屏幕或视窗屏幕的报纸。在这种情况下,无关报纸的数目将被彻底减少。
基于软件的搜索处理器能够记录单个用户的请求并在网络上进行个人化的不间断搜索。因此,当用户在早晨醒来时,他/她发现与他/她所感兴趣的领域有关的几个新网络报纸的索引和摘要。在1997年,在实际上,所有基础技术出版物、期刊、杂志以及所有工业国家的专利都变得可在网络上得到,即可以以电子形式得到。
虽然以关键词搜索网络给用户提供很大的价值,但它也已经产生并且将继续产生不利地影响这个价值的实质问题-具体地说,因为在网上可用信息的巨大数量,所以关键词搜索处理器产生太多的下载信息,而其绝大多数是与用户所想要的信息无关的或不重要的。在响应于用户所考虑的对仅与一特定请求相关的那几篇文章的请求而给出几百篇文章时,许多用户在失败中放弃。
这个问题在科学和工程的技术领域也存在,特别是因为有越来越多的图书馆、政府专利局、大学、政府研究中心以及其他用于网络访问的大量技术和科学信息的增加。工程师、科学家和学者被太多的文章、报纸、专利以及关于他们所感兴趣的主题的一般信息所淹没。另外,用户在检查下载文章以确定其与用户方案的相关性时目前只有两个选择。他/她可以读取作者摘要和/或浏览全文的各段以确定是否保存或打印出该特定文档。由于作者摘要不全面,所以它常常省略对用户所感兴趣的特定主题的引用或以不全面的方式论述该主题。因此,浏览摘要和浏览全文可能几乎没有价值并需要用户花费过多的时间。
已经有各种尝试想要提高选择的查全率和准确度,例如这里作为参考的美国专利No.5,774,833和5,794,050,但这些方法仅仅依赖于利用基于关键词的变化或原文短语的所称理解的各种选择技术进行的关键词或短语搜索。这些现有技术可能提高了查全率,但仍然需要太多的体力和精神努力和时间来确定为什么选择该文档以及相关部分是什么。这是从在没有概要或概念产生的情况下而展示的摘要的整个文档产生的。
依据本发明原理的基于计算机的软件系统和方法解决了上述问题,具有的能力是,以关键词执行对万维网上或其他网络上所有数据库的不间断搜索以及在语义上为特定技术功能和特定物理效果处理候选文档,使得只有满足搜索条件的非常少的优先或一单个文章被展示或识别给用户。
进一步地,依据本发明原理的基于计算机的软件系统捕获这些非常少的高度相关的文档,并生成由搜索条件指定的精确技术物理方面的一个压缩的简短概述。
本发明的另一个方面包括使用所选择文档的语义分析结果来生成知识概念的新思想。系统通过分析文档中所提到的主语、动作和宾语并将这些表示重新组织成这些要素的新的和/或不同的简档(profile)来完成这一点。如同下面将要进一步说明的,这些重新组织的在这些要素之间的关系的一些集合可能包括以前任何人从未想到过的新概念。
依据本发明的一个方面,所述方法和设备开始于用户输入与用户希望获取出版物或文档的任务或概念相关的自然语言文本。系统分析这个请求文本,并自动以表明词本身的类型的代码对每个词进行标记。一旦该请求中的所有词都被标记,则系统执行一个语义分析,在一个例子中,该语义分析包括确定和存储在请求的第一句中的动词组,然后确定和存储在请求的该句中的名词组。对请求中的所有句子重复这个过程。
接着,系统以一个分层算法将每个请求句子语法分析成一个充分表明句子含义的编码框架。该系统包括各种类型的数据库,以帮助产生编码框架,例如文法规则、语法分析规则、词典同义词等等。一旦存储了语法分析过的句子代码,系统就识别并存储每个句子内的主语-动作-宾语(SAO)提取。一个句子可以具有一个、两个或多个SAO提取,下面将会详细描述。通过根据下述的特定规则来处理提取,将每个提取标准化成一个SAO结构。因此,在该请求文本上执行的语义分析例程的结果是表明该请求的内容的一系列SAO结构。这些请求SAO结构被应用到(1)下述的用于比较候选文档的SAO结构的比较模块以及(2)识别关键词和关键词组合及其同义词以便为候选文档搜索因特网、内部网和本地数据库的搜索请求和关键词发生器。任何合适的搜索引擎、例如Alta Vista可以用于基于所产生的关键词来识别、选择和下载候选文档。
应该理解,如上所述,关键词搜索产生过多的候选文档。然而,依据本发明的原理,系统在每个候选文档上执行与在用户输入搜索请求上执行的实质相同的语义分析。也就是说,系统为每个候选文档的每个句子产生一个SAO结构,并将其传送到比较单元,在比较单元,将请求SAO结构与候选文档SAO结构进行比较。将那些具有与请求SAO结构简档大致匹配的SAO结构的少量候选文档放进一个检索文档单元,在该单元中将文档按相关性排序。系统然后通过合成与请求SAO结构匹配的文档的这些SAO结构来概括每个检索文档的本质(essence),并存储这个概要,以供用户显示或打印。用户可以在以后读取该概要并决定显示或打印或删除整个检索文档及其SAO。
如上所述,将每个恢复文档的每个句子的SAO结构存储在依据本发明的系统中。依据本发明的知识生成方面,系统分析所有这些存储的结构,识别公共或等效主语和宾语所在的地方,并重新组织、产生、合成新的SAO结构或新的SAO结构串以供用户考虑。这些新的结构或结构串中的一些可能是唯一的,并且包括对与用户所请求的主体有关的问题的新的解决方案。例如,如果存储了两个结构S1-A1-O1和S2-A2-O2,并且本系统认识到S2与O1等效或同义或具有其他一些相关性,则系统将产生并存储一个概要S1-A1-S2-A2-O2,以供用户访问。如果系统存储了在S1和A2之间的一个关联,它可以产生S1-A1/A2-O1来建议O1向所希望结果的改进。
根据下面结合附图进行的详细说明,其他和进一步的优点和益处将变得更加明显,其中:
图1是依据本发明原理的系统的一个例示实施例的图示表示。
图2是依据本发明的系统的主要结构部件的示意图。
图3是依据本发明原理的方法的示意图。
图4是图2的单元16的示意图。
图5是图2的单元20的示意图。
图6是图2的单元22的示意图。
图7是用户输入的用户请求文本的典型示例。
图8是图7的文本的标记和编码表示形式。
图9是图8的文本的动词组的识别。
图10是图8的编码文本的名词组的识别。
图11是图8的语法分析的分层编码文本的表示。
图12是图7的文本的SAO提取的表示。
图13是图12的提取的SAO结构的表示。
依据本发明原理的语义处理系统的一个例示实施例包括:
CPU12,可以包括带有标准用户输入和输出驱动器、例如键盘14、鼠标16、扫描仪19、CD阅读器17及打印机18的通用个人计算机或联网服务器或微型计算机。系统10还包括到LAN、WAN和/或公用或专用交换网络到万维网的标准通信端口21。
参考图1-6,语义队列系统10包括一个临时存储器或数据库12,用于接收和存储从万维网或局域网上下载的或作为用户请求文本用键盘14或其他一种输入设备产生的文档。用户可以键入请求(下面公开了示例)或输入全部文档到DB12中,并将该文档指定为用户请求。系统10进一步包括用于接收每个文档的整个文本的语义处理器14,还包括用一个代码类型(例如马尔科夫链理论代码)对每个句子的每个词进行标记的主语-动作-宾语(SOA)分析器单元16。单元16则识别每个句子内的每个动词组和名词组(下面将说明),并将每个句子进行语法分析和标准化,使之成为表示句子含义的SAO结构。单元16将其输出加到SAO结构的DB18。SAO处理器单元20存储请求SAO结构,并接收存储在单元18中的每个文档的每个句子的SAO结构。单元20将文档SAO与请求SAO进行比较,并删除不匹配的那些文档。将匹配文档的SAO结构存储回单元18或其他一些存储装置中。另外,单元20分析在一单个文档中的SAO结构或用一个或多个其他相关文档中的SAO结构来分析SAO结构,搜索在S-A-O之间的关系,并产生新的SAO结构以供用户考虑。将这些新结构存储在单元18或系统中的其他一些存储装置中。
单元14进一步包括自然语言单元22,用于以表格形式接收SAO结构,并将结构合成为自然语言形式、即句子。
单元14还包括键盘单元24,用于接收SAO结构并从其中提取关键词和短语,并获得它们的同义词,作为附加关键词/短语使用。
如图所示,数据库单元26、28和30从单元14接收输出,存储如下所述的所选择SAO结构的自然语言概要和形成通过端口21发送到搜索引擎的用户请求的关键词/短语。
单元16包括文档预格式器32,用于从单元12接收文档的全文本,并将文本和其他内容转换到一个标准纯文本格式。文本编码器34分析文本的每个句子的每个词,并将一个代码标记到每个词上,该代码指定词类型,参看图8。在图4中指定为44的各种数据库可用于帮助单元16的各个单元。在进行标记之后,识别器单元36识别每个句子的动词组(图9)和名词组(图10)。句子语法分析器38然后将每个句子语法分析成一个表示句子含义的分层编码形式。在图11中,S-A-O提取器40将每个句子的SAO组织成提取表格式(图12)。然后,标准化器42将该提取标准化为如上所述的SAO结构(图13)。
SAO处理器20包括三个主要单元。比较单元46从数据库18接收SAO结构。这些结构中的一组来自上述的用户请求文本,其他组来自候选文档。单元46然后比较这两组,以寻找这两组SAO结构之间的匹配。如果未产生匹配,则删除候选文档和相关SAO。如果识别出一个匹配,则将该文档标记为相关的,进行排序,并存储在单元12中,将其SAO结构存储在单元18中。单元46然后按顺序以上述相同方式比较所有候选文档。
单元20还包括SAO结构重新组织单元48,用于从涉及同一主题的不同文档合成新的SAO结构,如上所述将其合并成新结构,并将其加到单元18。
过滤单元50分析每个文档的每个SAO结构,并阻挡或删除那些与请求的SAO结构不相关的SAO结构。
标号52标明一些可用于帮助单元20的子单元的数据库。
SAO合成器单元22(图6)包括一个用于检测每个所接收SAO结构的主语的内容的主语检测器54。如果检测到S,则将SAO送到单元56,在这里,采用文法、语义、语言模式和同义词规则数据库66将动词组的树结构恢复成自然语言。合成器58对主语名词组进行同样的操作,合成器60对宾语名词组进行同样的操作。组合器68然后将这些组组织并组合成一个自然语言句子。
如果单元54未检测到S,则由合成器62处理SAO结构,以恢复被动形式的动词组。合成器64为一个被动句子处理宾语名词组,组合器70将这些组组织并组合成一个自然语言句子。
如果由单元54接收的SAO结构带有新结构标志,则组合器68和70将其输出加到单元28,如果它们被标记为现有SAO结构,则单元68、70将其输出加到单元26。参看图3。
依据本发明原理的方法的重要步骤如图3所示,其中,括号中的标号指的是显示处理步骤的图2中的单元。对话开始于用户输入一个国家语言请求,该请求可以用键盘来定制,或者可以是通过图1所示的一个输入设备输入的国家语言文档。一个典型用户产生如图7所示的定制请求,系统10的单元14首先用一个类型代码对每个词进行标记(参见图8),然后识别每个句子的动词组(图9)和每个句子的名词组(图10),然后将每个句子处理成一个分层树(图11),以及,然后提取出SAO提取,其中,所有提取出的词是该请求的原形(图12)。然后,该方法将这些词标准化(修改),将每个动作变为其不定式。即,将图12中的“is isolated”变为“ISOLATE”,词“to”被省略(图13)。应该理解,不是图11中出现的主语、动作和宾语的所有属性都在图12和13中显示,但系统知道与SAO要素相联系的所有属性,这些属性是SAO结构的一部分。并且,如图13所示,对于最后一个动作没有列出主语,因为这可以根据计划规则所表明。这个缺少不影响整个方法的可靠性,因为候选文档中包括A-O isolate-slides的所有句子将被认为是与主语无关的事情。标准化的SAO在这里被称为SAO结构。这些用户请求SAO结构被存储,并在下列两个步骤运用:(ⅰ)合成用户请求的关键词/短语;(ⅱ)比较分析每个候选文档的每个句子的SAO结构,下面将会说明。
将请求SAO结构关键词/短语存储和发送到一个标准搜索引擎,以搜索本地数据库、LAN和/或万维网中的候选文档。可以使用AltaVistaTM、YahooTM或其他典型的搜索引擎。采用请求SAO结构关键词/短语的搜索引擎识别候选文档,并存储它们(全文本)以供系统10分析。接着,为每个候选文档的每个句子重复如上所述对搜索请求的SAO分析,使得SAO结构被产生并存储,如图3所示。另外,每个文档的SAO结构用在比较步骤中,将请求SAO结构与候选文档SAO结构进行比较。如果未得到匹配,则从系统删除文档和相关的SAO结构。如果找到一个或多个匹配,则将该文档和相关结构标记为相关的,将其相关性例如标记为在1.0到10.0的范围内。将全相关文档文本永久存储(即使它以后可以由用户在需要时删除),以供用户根据需要显示或打印。相关SAO结构也被标记为相关的,并永久存储。
接着,系统10滤出最不相关的SAO结构,并使用每个相关文档的匹配SAO结构来将匹配SAO结构和出现与匹配SAO结构相联系的完整句子的页号合成为自然语言概要句子。这个概要被存储,并可根据需要用于用户显示或打印。
分析过滤后的相关文档的相关SAO结构,以识别所有相关结构中的主语、动作和宾语之间的关系。然后,处理SAO结构,将其重新组织成新的SAO结构以供存储,并合成为自然语言新句子。新句子中的一些可以并且可能表达或概述新思想、概念和想法以供用户考虑。将新句子进行存储以供用户显示或打印。
例如,如果
S1-A1-O1
S2-A2-O2
S3-A3-O3
并且S1与O3相同或是O3的同义词,则将S3-A3-S1-A1-O1合成为一个新句子并存储。
因此,依据本发明的方法和设备向用户自动提供直接涉及用户所请求的感兴趣领域的一组新思想,其中一些思想可能是新的并建议对用户所考虑问题的可能的新解决方案,以及/或者向用户自动提供与用户请求直接相关的特定文档和特定文档的相关部分的概要。
虽然这里已经描述了本发明系统和方法在工程、科学和医学领域的应用,将其应用并不限于这些。本发明可以应用到历史、哲学、神学、诗歌、艺术或使用书写语言的任何领域。
应该理解,在不偏离本发明的精神和范围的情况下,可以对这里所公开的例示实施例作出各种提高和改变。

Claims (21)

1.一种自然语言文档分析和选择系统,包括:
通用计算机,具有监视器、中央处理单元(CPU)、用于产生表示一个自然语言请求的请求数据的用户输入设备、以及用于与本地和远程自然语言文档数据库进行通信的通信设备,
所述CPU包括(ⅰ)用于存储请求数据的第一存储装置,(ⅱ)响应于接收到请求数据而产生请求主语-动作-宾语(SAO)提取的语义处理器,以及(ⅲ)用于存储请求SAO提取的表示的SAO存储装置。
2.如权利要求1所述的系统,其中,所述通信设备将候选文档数据传送到所述CPU,以便存储在所述第一存储装置中,候选文档数据表示自然语言文档文本,
所述语义处理器响应于接收到候选文档数据而产生候选文档SAO提取,以及
所述SAO存储装置还存储候选文档SAO提取的表示。
3.如权利要求2所述的系统,其中,所述语义处理器识别在所述请求SAO提取与所述候选文档SAO提取的所述表示之间的匹配。
4.如权利要求3所述的系统,其中,所述语义处理器包括用于标记相关候选文档数据的装置,所述相关候选文档数据包括与至少一个请求SAO提取的表示相匹配的至少一个候选文档SAO提取的表示。
5.如权利要求4所述的系统,其中,所述语义处理器包括用于删除对于不具有与请求SAO提取的表示相匹配的候选文档SAO提取的表示的那些文档的所存储的候选文档数据和所存储的候选文档SAO提取的表示的装置。
6.如权利要求3所述的系统,其中,所述语义处理器包括SAO文本分析器,所述SAO文本分析器具有多个存储文本格式化规则、编码规则、字标记规则、SAO识别规则、语法分析规则、SAO提取规则和标准化规则,将这些规则应用到请求数据和候选文档数据上,使得候选文档SAO提取和请求SAO提取的所述表示分别包括候选文档和请求SAO结构。
7.如权利要求6所述的系统,进一步包括第二存储装置,用于存储请求SAO结构,以及用于将SAO结构作为关键词/短语加到所述通信设备上,以便应用到万维网或本地数据库上的文档搜索引擎,从而将候选文档数据下载到系统。
8.如权利要求6所述的系统,进一步包括SAO合成器,用于响应于接收到文档SAO结构来产生并存储标记文档的自然语言概要以供在所述监视器上显示。
9.如权利要求6所述的系统,进一步包括SAO合成器,用于分析在相关和存储的SAO结构中的主语、动作和宾语之间的关系,并处理那些与至少一个其他SAO结构有关系的SAO结构,以产生一个不同SAO结构,并存储所述不同SAO结构,以供向用户显示。
10.如权利要求9所述的系统,其中,所述关系包括:
S1-A1-O1
S2-A2-O2
其中,S1与O2是同义词
则S2-A2-S1-A1-O1
11.在一个包括万维网和通用计算机的数字数据处理系统中,其中所述通用计算机具有监视器、中央处理单元(CPU)、用户输入设备、以及用于与本地和远程自然语言文档数据库进行通信的通信设备,一种用于分析和选择自然语言文档的方法,包括:
产生表示一个自然语言请求的请求数据,
存储所述请求数据,
在语义上处理所述请求数据以产生请求主语-动作-宾语(SAO)提取,以及
存储所述请求SAO提取的表示。
12.如权利要求11所述的方法,其中,所述通信设备将候选文档数据传送到所述CPU,候选文档数据表示自然语言文档文本,
存储候选文档数据,
所述在语义上的处理包括产生与候选文档数据相关的候选文档SAO提取,以及
存储候选文档SAO提取的表示。
13.如权利要求12所述的方法,其中,所述在语义上的处理包括识别在所述请求SAO提取与所述候选文档SAO提取的所述表示之间的匹配。
14.如权利要求13所述的方法,其中,所述在语义上的处理包括标记相关候选文档数据,相关候选文档数据包括与至少一个请求SAO提取的表示相匹配的至少一个候选文档SAO提取的表示。
15.如权利要求14所述的方法,其中,所述在语义上的处理包括删除对于不具有与请求SAO提取的表示相匹配的候选文档SAO提取的表示的那些文档的所存储的候选文档数据和所存储的候选文档SAO提取的表示的访问。
16.如权利要求13所述的方法,其中,所述在语义上的处理包括将多个存储的文本格式化规则、名词和动词识别规则、编码规则、字标记规则、SAO识别规则、语法分析规则、SAO提取规则和标准化规则应用到请求数据和候选文档数据上,使得候选文档SAO提取的所述表示和请求SAO提取的所述表示分别包括候选文档和请求SAO结构。
17.如权利要求16所述的方法,进一步包括存储请求SAO结构,并将SAO结构作为关键词/短语应用到万维网或本地数据库上的文档搜索引擎,以便向CPU下载候选文档数据。
18.如权利要求16所述的方法,进一步包括产生并存储并在所述监视器上显示与相关文档SAO结构有关的所标记相关文档的自然语言概要。
19.如权利要求16所述的方法,进一步包括分析在相关和存储的SAO结构中的主语、动作和宾语之间的关系,进一步处理那些与至少一个其他相关的所存储SAO结构有关系的SAO结构,并根据所述关系产生一个不同SAO结构,以及
存储所述不同SAO结构,并向用户显示所述不同SAO结构。
20.如权利要求19所述的方法,其中,所述关系包括:
S1-A1-O1包括一个相关和存储的SAO结构
S2-A2-O2包括第二个相关和存储的SAO结构
其中,所述关系包括S1与O2是同义词,
所述不同SAO结构是
S2-A2-S1-A1-O1
21.如权利要求19所述的方法,其中,所述关系包括:
S1-A1-O1包括一个相关和存储的SAO结构
S2-A2-O2包括第二个相关和存储的SAO结构
其中,所述关系在S1与A2之间,
以及,所述不同SAO结构是
S1-A1/A2-O2
其中“/”的意思是可替换。
CN99813079A 1998-09-09 1999-08-31 具有知识生成能力的文档语义分析/选择 Pending CN1325513A (zh)

Applications Claiming Priority (4)

Application Number Priority Date Filing Date Title
US9964198P 1998-09-09 1998-09-09
US60/099,641 1998-09-09
US09/321,804 1999-05-27
US09/321,804 US6167370A (en) 1998-09-09 1999-05-27 Document semantic analysis/selection with knowledge creativity capability utilizing subject-action-object (SAO) structures

Publications (1)

Publication Number Publication Date
CN1325513A true CN1325513A (zh) 2001-12-05

Family

ID=26796312

Family Applications (1)

Application Number Title Priority Date Filing Date
CN99813079A Pending CN1325513A (zh) 1998-09-09 1999-08-31 具有知识生成能力的文档语义分析/选择

Country Status (9)

Country Link
US (2) US6167370A (zh)
EP (1) EP1112541A1 (zh)
JP (1) JP4467184B2 (zh)
KR (1) KR100594512B1 (zh)
CN (1) CN1325513A (zh)
AU (1) AU5790399A (zh)
CA (1) CA2341583A1 (zh)
NO (1) NO20011194L (zh)
WO (1) WO2000014651A1 (zh)

Cited By (12)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100514323C (zh) * 2005-10-25 2009-07-15 国际商业机器公司 用于自动提取副标题信息的系统和方法
CN101075308B (zh) * 2006-11-08 2010-12-15 腾讯科技(深圳)有限公司 一种编辑电子邮件的方法
CN102117283A (zh) * 2009-12-30 2011-07-06 安世亚太科技(北京)有限公司 一种基于语义索引的数据检索方法
CN102117284A (zh) * 2009-12-30 2011-07-06 安世亚太科技(北京)有限公司 一种跨语言知识检索的方法
CN101404031B (zh) * 2008-11-12 2012-05-30 北京搜狗科技发展有限公司 识别概念型网页的方法与系统
CN102117285B (zh) * 2009-12-30 2015-01-07 安世亚太科技股份有限公司 一种基于语义索引的检索方法
CN104391969A (zh) * 2014-12-04 2015-03-04 百度在线网络技术(北京)有限公司 确定用户查询语句句法结构的方法及装置
CN105760500A (zh) * 2009-11-10 2016-07-13 启创互联公司 用于利用交互式图形接口创建及操纵数据结构的系统、方法和计算机程序
CN107112013A (zh) * 2014-09-14 2017-08-29 谷歌公司 用于创建可定制对话系统引擎的平台
CN108780660A (zh) * 2016-02-29 2018-11-09 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
US10146843B2 (en) 2009-11-10 2018-12-04 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
CN107168950B (zh) * 2017-05-02 2021-02-12 苏州大学 一种基于双语语义映射的事件短语学习方法及装置

Families Citing this family (155)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7051024B2 (en) * 1999-04-08 2006-05-23 Microsoft Corporation Document summarizer for word processors
CN1212578C (zh) * 1997-06-04 2005-07-27 盖瑞·L·夏普 用于在计算机系统中创建信息数据库的方法
GB9821969D0 (en) * 1998-10-08 1998-12-02 Canon Kk Apparatus and method for processing natural language
US6711585B1 (en) * 1999-06-15 2004-03-23 Kanisa Inc. System and method for implementing a knowledge management system
US7509572B1 (en) * 1999-07-16 2009-03-24 Oracle International Corporation Automatic generation of document summaries through use of structured text
EP1228461A4 (en) * 1999-09-22 2005-07-27 Oleg Kharisovich Zommers INTERACTIVE PERSONAL INFORMATION SYSTEM AND METHOD
EP1275042A2 (en) * 2000-03-06 2003-01-15 Kanisa Inc. A system and method for providing an intelligent multi-step dialog with a user
US6311194B1 (en) * 2000-03-15 2001-10-30 Taalee, Inc. System and method for creating a semantic web and its applications in browsing, searching, profiling, personalization and advertising
US7120574B2 (en) * 2000-04-03 2006-10-10 Invention Machine Corporation Synonym extension of search queries with validation
US7962326B2 (en) * 2000-04-20 2011-06-14 Invention Machine Corporation Semantic answering system and method
US6711561B1 (en) 2000-05-02 2004-03-23 Iphrase.Com, Inc. Prose feedback in information access system
US8478732B1 (en) * 2000-05-02 2013-07-02 International Business Machines Corporation Database aliasing in information access system
US6704728B1 (en) 2000-05-02 2004-03-09 Iphase.Com, Inc. Accessing information from a collection of data
EP1290578B1 (fr) 2000-05-23 2008-01-02 Vigilint (Software) Holdings Limited Procede de recherche de donnees automatise et securise au moyen d'un reseau de transmission de donnees
JP2001344243A (ja) * 2000-05-31 2001-12-14 Fuji Xerox Co Ltd 文書データ送信装置、文書データ送受信システム及び文書データ送信方法
US6941513B2 (en) * 2000-06-15 2005-09-06 Cognisphere, Inc. System and method for text structuring and text generation
US6408277B1 (en) 2000-06-21 2002-06-18 Banter Limited System and method for automatic task prioritization
US8290768B1 (en) 2000-06-21 2012-10-16 International Business Machines Corporation System and method for determining a set of attributes based on content of communications
US9699129B1 (en) 2000-06-21 2017-07-04 International Business Machines Corporation System and method for increasing email productivity
US6741988B1 (en) 2000-08-11 2004-05-25 Attensity Corporation Relational text index creation and searching
US6738765B1 (en) 2000-08-11 2004-05-18 Attensity Corporation Relational text index creation and searching
US6732097B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US6728707B1 (en) 2000-08-11 2004-04-27 Attensity Corporation Relational text index creation and searching
US7171349B1 (en) 2000-08-11 2007-01-30 Attensity Corporation Relational text index creation and searching
US6732098B1 (en) 2000-08-11 2004-05-04 Attensity Corporation Relational text index creation and searching
US6766320B1 (en) * 2000-08-24 2004-07-20 Microsoft Corporation Search engine with natural language-based robust parsing for user query and relevance feedback learning
US7644057B2 (en) 2001-01-03 2010-01-05 International Business Machines Corporation System and method for electronic communication management
EP1225517B1 (en) * 2001-01-17 2006-05-17 International Business Machines Corporation System and methods for computer based searching for relevant texts
US7136846B2 (en) 2001-04-06 2006-11-14 2005 Keel Company, Inc. Wireless information retrieval
US6904428B2 (en) * 2001-04-18 2005-06-07 Illinois Institute Of Technology Intranet mediator
AU2002304071A1 (en) * 2001-05-28 2002-12-09 Zenya Koono Automatic knowledge creating method, automatic knowledge creating system, automatic knowledge creating program, automatic designing method and automatic designing system
US20020184196A1 (en) * 2001-06-04 2002-12-05 Lehmeier Michelle R. System and method for combining voice annotation and recognition search criteria with traditional search criteria into metadata
GB2412988B (en) * 2001-06-04 2005-12-07 Hewlett Packard Co System for storing documents in an electronic storage media
US7376620B2 (en) * 2001-07-23 2008-05-20 Consona Crm Inc. System and method for measuring the quality of information retrieval
US8799776B2 (en) * 2001-07-31 2014-08-05 Invention Machine Corporation Semantic processor for recognition of whole-part relations in natural language documents
WO2003012661A1 (en) * 2001-07-31 2003-02-13 Invention Machine Corporation Computer based summarization of natural language documents
US9009590B2 (en) * 2001-07-31 2015-04-14 Invention Machines Corporation Semantic processor for recognition of cause-effect relations in natural language documents
US6609124B2 (en) 2001-08-13 2003-08-19 International Business Machines Corporation Hub for strategic intelligence
US7398201B2 (en) 2001-08-14 2008-07-08 Evri Inc. Method and system for enhanced data searching
US7526425B2 (en) 2001-08-14 2009-04-28 Evri Inc. Method and system for extending keyword searching to syntactically and semantically annotated data
US7283951B2 (en) 2001-08-14 2007-10-16 Insightful Corporation Method and system for enhanced data searching
US7403938B2 (en) * 2001-09-24 2008-07-22 Iac Search & Media, Inc. Natural language query processing
US7353247B2 (en) * 2001-10-19 2008-04-01 Microsoft Corporation Querying applications using online messenger service
US20030084066A1 (en) * 2001-10-31 2003-05-01 Waterman Scott A. Device and method for assisting knowledge engineer in associating intelligence with content
NO316480B1 (no) * 2001-11-15 2004-01-26 Forinnova As Fremgangsmåte og system for tekstuell granskning og oppdagelse
US20030154071A1 (en) * 2002-02-11 2003-08-14 Shreve Gregory M. Process for the document management and computer-assisted translation of documents utilizing document corpora constructed by intelligent agents
US7343372B2 (en) * 2002-02-22 2008-03-11 International Business Machines Corporation Direct navigation for information retrieval
EP1351156A1 (en) * 2002-03-14 2003-10-08 Universita' Degli Studi di Firenze System and method for automatically performing functional analyses of technical texts
US20030187632A1 (en) * 2002-04-02 2003-10-02 Menich Barry J. Multimedia conferencing system
US7107261B2 (en) * 2002-05-22 2006-09-12 International Business Machines Corporation Search engine providing match and alternative answer
US20040015481A1 (en) * 2002-05-23 2004-01-22 Kenneth Zinda Patent data mining
US20030229470A1 (en) * 2002-06-10 2003-12-11 Nenad Pejic System and method for analyzing patent-related information
AU2003243635A1 (en) * 2002-06-17 2003-12-31 Beingmeta, Inc. Systems and methods for processing queries
US20040039562A1 (en) * 2002-06-17 2004-02-26 Kenneth Haase Para-linguistic expansion
US7567902B2 (en) * 2002-09-18 2009-07-28 Nuance Communications, Inc. Generating speech recognition grammars from a large corpus of data
US20040064447A1 (en) * 2002-09-27 2004-04-01 Simske Steven J. System and method for management of synonymic searching
CA2791794C (en) * 2002-10-30 2017-01-10 Portauthority Technologies, Inc. A method and system for managing confidential information
US8495002B2 (en) 2003-05-06 2013-07-23 International Business Machines Corporation Software tool for training and testing a knowledge base
US20050187913A1 (en) 2003-05-06 2005-08-25 Yoram Nelken Web-based customer service interface
US7401072B2 (en) 2003-06-10 2008-07-15 Google Inc. Named URL entry
US20050010559A1 (en) * 2003-07-10 2005-01-13 Joseph Du Methods for information search and citation search
US7813916B2 (en) 2003-11-18 2010-10-12 University Of Utah Acquisition and application of contextual role knowledge for coreference resolution
US7536368B2 (en) * 2003-11-26 2009-05-19 Invention Machine Corporation Method for problem formulation and for obtaining solutions from a database
US20050144177A1 (en) * 2003-11-26 2005-06-30 Hodes Alan S. Patent analysis and formulation using ontologies
US20050234738A1 (en) * 2003-11-26 2005-10-20 Hodes Alan S Competitive product intelligence system and method, including patent analysis and formulation using one or more ontologies
US7415101B2 (en) * 2003-12-15 2008-08-19 At&T Knowledge Ventures, L.P. System, method and software for a speech-enabled call routing application using an action-object matrix
US20050138556A1 (en) * 2003-12-18 2005-06-23 Xerox Corporation Creation of normalized summaries using common domain models for input text analysis and output text generation
US7512545B2 (en) * 2004-01-29 2009-03-31 At&T Intellectual Property I, L.P. Method, software and system for developing interactive call center agent personas
US7689543B2 (en) * 2004-03-11 2010-03-30 International Business Machines Corporation Search engine providing match and alternative answers using cumulative probability values
US20050216828A1 (en) * 2004-03-26 2005-09-29 Brindisi Thomas J Patent annotator
US7620159B2 (en) 2004-05-12 2009-11-17 AT&T Intellectual I, L.P. System, method and software for transitioning between speech-enabled applications using action-object matrices
US7685118B2 (en) * 2004-08-12 2010-03-23 Iwint International Holdings Inc. Method using ontology and user query processing to solve inventor problems and user problems
US7623632B2 (en) * 2004-08-26 2009-11-24 At&T Intellectual Property I, L.P. Method, system and software for implementing an automated call routing application in a speech enabled call center environment
TWI340329B (en) * 2004-10-01 2011-04-11 Inst Information Industry Patent summarization system, method and machine-readable storage medium
US7672831B2 (en) * 2005-10-24 2010-03-02 Invention Machine Corporation System and method for cross-language knowledge searching
US7805455B2 (en) * 2005-11-14 2010-09-28 Invention Machine Corporation System and method for problem analysis
EP1949273A1 (en) 2005-11-16 2008-07-30 Evri Inc. Extending keyword searching to syntactically and semantically annotated data
US20070260450A1 (en) * 2006-05-05 2007-11-08 Yudong Sun Indexing parsed natural language texts for advanced search
KR100785927B1 (ko) 2006-06-02 2007-12-17 삼성전자주식회사 데이터 요약 생성 방법 및 장치
US8843475B2 (en) * 2006-07-12 2014-09-23 Philip Marshall System and method for collaborative knowledge structure creation and management
US7668791B2 (en) * 2006-07-31 2010-02-23 Microsoft Corporation Distinguishing facts from opinions using a multi-stage approach
US9865240B2 (en) * 2006-12-29 2018-01-09 Harman International Industries, Incorporated Command interface for generating personalized audio content
WO2008113045A1 (en) 2007-03-14 2008-09-18 Evri Inc. Query templates and labeled search tip system, methods, and techniques
US9031947B2 (en) * 2007-03-27 2015-05-12 Invention Machine Corporation System and method for model element identification
US8301633B2 (en) 2007-10-01 2012-10-30 Palo Alto Research Center Incorporated System and method for semantic search
US8594996B2 (en) 2007-10-17 2013-11-26 Evri Inc. NLP-based entity recognition and disambiguation
AU2008312423B2 (en) 2007-10-17 2013-12-19 Vcvc Iii Llc NLP-based content recommender
US8412516B2 (en) * 2007-11-27 2013-04-02 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8266519B2 (en) 2007-11-27 2012-09-11 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8271870B2 (en) * 2007-11-27 2012-09-18 Accenture Global Services Limited Document analysis, commenting, and reporting system
US8417513B2 (en) * 2008-06-06 2013-04-09 Radiant Logic Inc. Representation of objects and relationships in databases, directories, web services, and applications as sentences as a method to represent context in structured data
US9953651B2 (en) 2008-07-28 2018-04-24 International Business Machines Corporation Speed podcasting
TWI406199B (zh) * 2009-02-17 2013-08-21 Univ Nat Yunlin Sci & Tech 線上閱讀輔助系統及方法
KR20110134909A (ko) * 2009-03-13 2011-12-15 인벤션 머신 코포레이션 텍스트 문서들 및 사용자 질문들의 의미적 라벨링에 기초한 질문-응답 시스템 및 방법
JP2012520529A (ja) * 2009-03-13 2012-09-06 インベンション マシーン コーポレーション 知識調査のためのシステム及び方法
US20100287177A1 (en) * 2009-05-06 2010-11-11 Foundationip, Llc Method, System, and Apparatus for Searching an Electronic Document Collection
US20100287148A1 (en) * 2009-05-08 2010-11-11 Cpa Global Patent Research Limited Method, System, and Apparatus for Targeted Searching of Multi-Sectional Documents within an Electronic Document Collection
WO2011029474A1 (en) * 2009-09-09 2011-03-17 Universität Bremen Document comparison
US8364679B2 (en) * 2009-09-17 2013-01-29 Cpa Global Patent Research Limited Method, system, and apparatus for delivering query results from an electronic document collection
US20110082839A1 (en) * 2009-10-02 2011-04-07 Foundationip, Llc Generating intellectual property intelligence using a patent search engine
US20110119250A1 (en) * 2009-11-16 2011-05-19 Cpa Global Patent Research Limited Forward Progress Search Platform
US8793208B2 (en) 2009-12-17 2014-07-29 International Business Machines Corporation Identifying common data objects representing solutions to a problem in different disciplines
EP2354967A1 (en) 2010-01-29 2011-08-10 British Telecommunications public limited company Semantic textual analysis
EP2362333A1 (en) 2010-02-19 2011-08-31 Accenture Global Services Limited System for requirement identification and analysis based on capability model structure
US9710556B2 (en) 2010-03-01 2017-07-18 Vcvc Iii Llc Content recommendation based on collections of entities
US8645125B2 (en) 2010-03-30 2014-02-04 Evri, Inc. NLP-based systems and methods for providing quotations
WO2011160140A1 (en) 2010-06-18 2011-12-22 Susan Bennett System and method of semantic based searching
US8566731B2 (en) 2010-07-06 2013-10-22 Accenture Global Services Limited Requirement statement manipulation system
US8838633B2 (en) 2010-08-11 2014-09-16 Vcvc Iii Llc NLP-based sentiment analysis
CN102385596A (zh) * 2010-09-03 2012-03-21 腾讯科技(深圳)有限公司 一种诗句的搜索方法及装置
US9405848B2 (en) 2010-09-15 2016-08-02 Vcvc Iii Llc Recommending mobile device activities
CN102455997A (zh) * 2010-10-27 2012-05-16 鸿富锦精密工业(深圳)有限公司 元件名称提取系统及方法
US8725739B2 (en) 2010-11-01 2014-05-13 Evri, Inc. Category-based content recommendation
US9317595B2 (en) 2010-12-06 2016-04-19 Yahoo! Inc. Fast title/summary extraction from long descriptions
US9400778B2 (en) 2011-02-01 2016-07-26 Accenture Global Services Limited System for identifying textual relationships
US9116995B2 (en) 2011-03-30 2015-08-25 Vcvc Iii Llc Cluster-based identification of news stories
US8935654B2 (en) 2011-04-21 2015-01-13 Accenture Global Services Limited Analysis system for test artifact generation
KR101268503B1 (ko) * 2011-04-29 2013-06-04 포항공과대학교 산학협력단 특허지도 생성 시스템 및 그 방법
US9135237B2 (en) * 2011-07-13 2015-09-15 Nuance Communications, Inc. System and a method for generating semantically similar sentences for building a robust SLM
KR101327514B1 (ko) * 2011-07-28 2013-11-08 포항공과대학교 산학협력단 의미론적 특허 유사성을 이용한 특허 네트워크 분석 시스템 및 이를 이용한 특허 네트워크 분석 방법
US9223769B2 (en) 2011-09-21 2015-12-29 Roman Tsibulevskiy Data processing systems, devices, and methods for content analysis
US9715625B2 (en) * 2012-01-27 2017-07-25 Recommind, Inc. Hierarchical information extraction using document segmentation and optical character recognition correction
US9799040B2 (en) 2012-03-27 2017-10-24 Iprova Sarl Method and apparatus for computer assisted innovation
US8747115B2 (en) 2012-03-28 2014-06-10 International Business Machines Corporation Building an ontology by transforming complex triples
ITTO20120303A1 (it) * 2012-04-05 2012-07-05 Wolf S R L Dr Metodo e sistema per effettuare analisi e confronti automatici di brevetti e descrizioni tecniche.
US8539001B1 (en) 2012-08-20 2013-09-17 International Business Machines Corporation Determining the value of an association between ontologies
US9501469B2 (en) 2012-11-21 2016-11-22 University Of Massachusetts Analogy finder
US10810193B1 (en) 2013-03-13 2020-10-20 Google Llc Querying a data graph using natural language queries
US10713261B2 (en) 2013-03-13 2020-07-14 Google Llc Generating insightful connections between graph entities
US20140280050A1 (en) * 2013-03-14 2014-09-18 Fujitsu Limited Term searching based on context
US9646260B1 (en) * 2013-06-24 2017-05-09 Amazon Technologies, Inc. Using existing relationships in a knowledge base to identify types of knowledge for addition to the knowledge base
US9235653B2 (en) 2013-06-26 2016-01-12 Google Inc. Discovering entity actions for an entity graph
US9817823B2 (en) * 2013-09-17 2017-11-14 International Business Machines Corporation Active knowledge guidance based on deep document analysis
CN105706078B (zh) 2013-10-09 2021-08-03 谷歌有限责任公司 实体集合的自动定义
US9916284B2 (en) 2013-12-10 2018-03-13 International Business Machines Corporation Analyzing document content and generating an appendix
US9659056B1 (en) 2013-12-30 2017-05-23 Google Inc. Providing an explanation of a missing fact estimate
CN103761264B (zh) * 2013-12-31 2017-01-18 浙江大学 基于商品评论文档集的概念层次创建方法
RU2564641C1 (ru) * 2014-05-27 2015-10-10 Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования "Кубанский государственный технический университет" (ФГБОУ ВПО "КубГТУ") Интеллектуальная информационная система выбора "оптимэль"
US9818307B2 (en) * 2014-07-28 2017-11-14 Sparkting Llc Communication device interface for a semantic-based creativity assessment
US9916375B2 (en) * 2014-08-15 2018-03-13 International Business Machines Corporation Extraction of concept-based summaries from documents
US10459925B2 (en) 2014-12-08 2019-10-29 Iprova Sarl Computer-enabled method of assisting to generate an innovation
US10339122B2 (en) * 2015-09-10 2019-07-02 Conduent Business Services, Llc Enriching how-to guides by linking actionable phrases
CN106227714A (zh) * 2016-07-14 2016-12-14 北京百度网讯科技有限公司 一种基于人工智能的获取生成诗词的关键词的方法和装置
US11544799B2 (en) 2017-12-05 2023-01-03 Sureprep, Llc Comprehensive tax return preparation system
US11238540B2 (en) 2017-12-05 2022-02-01 Sureprep, Llc Automatic document analysis filtering, and matching system
US11314887B2 (en) * 2017-12-05 2022-04-26 Sureprep, Llc Automated document access regulation system
US10489644B2 (en) 2018-03-15 2019-11-26 Sureprep, Llc System and method for automatic detection and verification of optical character recognition data
US10762142B2 (en) 2018-03-16 2020-09-01 Open Text Holdings, Inc. User-defined automated document feature extraction and optimization
US11048762B2 (en) * 2018-03-16 2021-06-29 Open Text Holdings, Inc. User-defined automated document feature modeling, extraction and optimization
RU2707917C1 (ru) * 2019-01-24 2019-12-02 Открытое акционерное общество "МБКИ" ОАО "МБКИ" Способ поиска методов разрешения технических противоречий и система на основе обучаемой нейронной сети для его осуществления
US11610277B2 (en) 2019-01-25 2023-03-21 Open Text Holdings, Inc. Seamless electronic discovery system with an enterprise data portal
US11829723B2 (en) 2019-10-17 2023-11-28 Microsoft Technology Licensing, Llc System for predicting document reuse
US11790165B2 (en) * 2021-01-26 2023-10-17 Microsoft Technology Licensing, Llc Content element recommendation system
US11860950B2 (en) 2021-03-30 2024-01-02 Sureprep, Llc Document matching and data extraction
CN116069922B (zh) * 2023-04-06 2023-06-20 广东远景信息科技有限公司 基于检索信息进行法律法规筛选的方法及系统

Family Cites Families (25)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US4829423A (en) * 1983-01-28 1989-05-09 Texas Instruments Incorporated Menu-based natural language understanding system
US5696916A (en) * 1985-03-27 1997-12-09 Hitachi, Ltd. Information storage and retrieval system and display method therefor
US4887212A (en) * 1986-10-29 1989-12-12 International Business Machines Corporation Parser for natural language text
US4864502A (en) * 1987-10-07 1989-09-05 Houghton Mifflin Company Sentence analyzer
US4868750A (en) * 1987-10-07 1989-09-19 Houghton Mifflin Company Collocational grammar system
US5146405A (en) * 1988-02-05 1992-09-08 At&T Bell Laboratories Methods for part-of-speech determination and usage
NL8900247A (nl) * 1989-02-01 1990-09-03 Bso Buro Voor Systeemontwikkel Werkwijze en stelsel voor het weergeven van meervoudige analyses in een afhankelijkheidsgrammatica, alsmede ontleed-inrichting voor het genereren van een dergelijke weergave.
JP3266246B2 (ja) * 1990-06-15 2002-03-18 インターナシヨナル・ビジネス・マシーンズ・コーポレーシヨン 自然言語解析装置及び方法並びに自然言語解析用知識ベース構築方法
US5559940A (en) * 1990-12-14 1996-09-24 Hutson; William H. Method and system for real-time information analysis of textual material
US5377103A (en) * 1992-05-15 1994-12-27 International Business Machines Corporation Constrained natural language interface for a computer that employs a browse function
US5369575A (en) * 1992-05-15 1994-11-29 International Business Machines Corporation Constrained natural language interface for a computer system
JPH0635961A (ja) * 1992-07-17 1994-02-10 Matsushita Electric Ind Co Ltd 文書要約装置
JP3202381B2 (ja) * 1993-01-28 2001-08-27 株式会社東芝 文書検索装置及び文書検索方法
JP2821840B2 (ja) * 1993-04-28 1998-11-05 日本アイ・ビー・エム株式会社 機械翻訳装置
US5331556A (en) * 1993-06-28 1994-07-19 General Electric Company Method for natural language data processing using morphological and part-of-speech information
US5873056A (en) * 1993-10-12 1999-02-16 The Syracuse University Natural language processing system for semantic vector representation which accounts for lexical ambiguity
US5692176A (en) * 1993-11-22 1997-11-25 Reed Elsevier Inc. Associative text search and retrieval system
JPH07160684A (ja) * 1993-12-03 1995-06-23 Matsushita Electric Ind Co Ltd 文書圧縮装置および文書圧縮方法
DE69530816T2 (de) * 1994-06-21 2004-04-08 Canon K.K. Textbearbeitungssystem und Verfahren unter Verwendung einer Wissensbasis
US5799268A (en) * 1994-09-28 1998-08-25 Apple Computer, Inc. Method for extracting knowledge from online documentation and creating a glossary, index, help database or the like
US5873076A (en) * 1995-09-15 1999-02-16 Infonautics Corporation Architecture for processing search queries, retrieving documents identified thereby, and method for using same
JPH09160929A (ja) * 1995-12-11 1997-06-20 Ricoh Co Ltd 文書処理装置及び方法
US5878385A (en) * 1996-09-16 1999-03-02 Ergo Linguistic Technologies Method and apparatus for universal parsing of language
US6076051A (en) * 1997-03-07 2000-06-13 Microsoft Corporation Information retrieval utilizing semantic representation of text
US5933822A (en) * 1997-07-22 1999-08-03 Microsoft Corporation Apparatus and methods for an information retrieval system that employs natural language processing of search results to improve overall precision

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN100514323C (zh) * 2005-10-25 2009-07-15 国际商业机器公司 用于自动提取副标题信息的系统和方法
CN101075308B (zh) * 2006-11-08 2010-12-15 腾讯科技(深圳)有限公司 一种编辑电子邮件的方法
CN101404031B (zh) * 2008-11-12 2012-05-30 北京搜狗科技发展有限公司 识别概念型网页的方法与系统
CN105760500B (zh) * 2009-11-10 2019-08-09 启创互联公司 用于利用交互图形接口创建及操纵数据结构的系统和方法
CN105760500A (zh) * 2009-11-10 2016-07-13 启创互联公司 用于利用交互式图形接口创建及操纵数据结构的系统、方法和计算机程序
US10146843B2 (en) 2009-11-10 2018-12-04 Primal Fusion Inc. System, method and computer program for creating and manipulating data structures using an interactive graphical interface
CN102117284A (zh) * 2009-12-30 2011-07-06 安世亚太科技(北京)有限公司 一种跨语言知识检索的方法
CN102117285B (zh) * 2009-12-30 2015-01-07 安世亚太科技股份有限公司 一种基于语义索引的检索方法
CN102117283A (zh) * 2009-12-30 2011-07-06 安世亚太科技(北京)有限公司 一种基于语义索引的数据检索方法
CN107112013A (zh) * 2014-09-14 2017-08-29 谷歌公司 用于创建可定制对话系统引擎的平台
CN107112013B (zh) * 2014-09-14 2020-10-23 谷歌有限责任公司 用于创建可定制对话系统引擎的平台
CN104391969A (zh) * 2014-12-04 2015-03-04 百度在线网络技术(北京)有限公司 确定用户查询语句句法结构的方法及装置
CN104391969B (zh) * 2014-12-04 2018-01-30 百度在线网络技术(北京)有限公司 确定用户查询语句句法结构的方法及装置
CN108780660A (zh) * 2016-02-29 2018-11-09 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
CN108780660B (zh) * 2016-02-29 2023-10-20 皇家飞利浦有限公司 相对于以健康护理为中心的证据对微博中的认知偏差进行分类的设备、系统和方法
CN107168950B (zh) * 2017-05-02 2021-02-12 苏州大学 一种基于双语语义映射的事件短语学习方法及装置

Also Published As

Publication number Publication date
NO20011194L (no) 2001-05-03
CA2341583A1 (en) 2000-03-16
JP2002524799A (ja) 2002-08-06
KR20010075026A (ko) 2001-08-09
NO20011194D0 (no) 2001-03-08
KR100594512B1 (ko) 2006-06-30
WO2000014651A1 (en) 2000-03-16
EP1112541A1 (en) 2001-07-04
US20010014852A1 (en) 2001-08-16
US6167370A (en) 2000-12-26
JP4467184B2 (ja) 2010-05-26
AU5790399A (en) 2000-03-27

Similar Documents

Publication Publication Date Title
CN1325513A (zh) 具有知识生成能力的文档语义分析/选择
US6745181B1 (en) Information access method
US6704728B1 (en) Accessing information from a collection of data
US6714905B1 (en) Parsing ambiguous grammar
US6711561B1 (en) Prose feedback in information access system
CN102142038B (zh) 用于记号空间资料库的多级查询处理系统与方法
US20030163302A1 (en) Method and system of knowledge based search engine using text mining
US8280721B2 (en) Efficiently representing word sense probabilities
US20080288442A1 (en) Ontology Based Text Indexing
CN1871605A (zh) 问答式文献检索系统和方法
Kallipolitis et al. Semantic search in the World News domain using automatically extracted metadata files
Liu et al. Information retrieval and Web search
US8640017B1 (en) Bootstrapping in information access systems
US7127450B1 (en) Intelligent discard in information access system
US20050187964A1 (en) Method and apparatus for retrieving natural language text
US8478732B1 (en) Database aliasing in information access system
Shao et al. An efficient expansion word extraction algorithm for educational video
Demartini et al. An architecture for finding entities on the web
Tudjarski et al. Running Semantic Search Over Complete English Wikipedia on a Local Computer
Mustapha et al. Ontology learning from Web: survey and framework based on semantic search
Tri et al. Applying RST relations to semantic search
Lazarinis Automatic extraction of knowledge from Greek Web documents
MUSTAPHA et al. Ontology learning from Web
Thomas et al. Bhilai Institute of Technology Durg at TAC 2010: Knowledge Base Population Task Challenge.
Negri et al. Answer-driven reasoning as a framework for intelligent information access

Legal Events

Date Code Title Description
C06 Publication
C10 Entry into substantive examination
PB01 Publication
SE01 Entry into force of request for substantive examination
C02 Deemed withdrawal of patent application after publication (patent law 2001)
WD01 Invention patent application deemed withdrawn after publication
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1025977

Country of ref document: HK