CN101681377A - 用于搜索的用户定义的相关性排序 - Google Patents
用于搜索的用户定义的相关性排序 Download PDFInfo
- Publication number
- CN101681377A CN101681377A CN200880017123A CN200880017123A CN101681377A CN 101681377 A CN101681377 A CN 101681377A CN 200880017123 A CN200880017123 A CN 200880017123A CN 200880017123 A CN200880017123 A CN 200880017123A CN 101681377 A CN101681377 A CN 101681377A
- Authority
- CN
- China
- Prior art keywords
- user
- search
- correlation function
- computer
- rank
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/20—Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
- G06F16/24—Querying
- G06F16/245—Query processing
- G06F16/2457—Query processing with adaptation to user needs
- G06F16/24578—Query processing with adaptation to user needs using ranking
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/3331—Query processing
- G06F16/334—Query execution
- G06F16/3341—Query execution using boolean model
Abstract
此处详细描述了一种特别地允许搜索引擎使用用户定义的关联函数的技术。在本技术的一种方法中,描述了一种应用用户定义的关联函数的方法。在该方法中,将复杂的搜索查询分解成简单运算符。将简单运算符与用户定义的关联函数相关联。检索与搜索查询匹配的文档,并使用用户定义的关联函数来为该文档计算排名。
Description
背景
数字信息的基本问题之一在于如何有效地对大量数据进行排序,以便在任何给定时刻找出那些最相关的信息片段。为解决该问题,搜索引擎包括关联或排序函数。这些关联函数用于将不同的权重给予需要搜索准则的文档;所分配的权重或排名然后可用于进一步操纵信息池,例如通过按特定次序显示结果。
许多搜索引擎,特别是那些用于与数据库交互的搜索引擎,使用tf-idf权重方案的某些变体,其中一项出现在特定文档中的频率针对逆文档频率,即对该项出现在文档池中的频率的度量来加权。不同的示例引擎将实现该方案的不同变体,且优化单独的搜索引擎以使用其特定关联函数。
概述
此处详细描述了一种特别地允许搜索引擎利用用户定义的关联函数的技术。在本技术的一种方法中,描述了一种应用用户定义的关联函数的方法。在该方法中,将复杂的搜索查询分解成简单运算符。将简单运算符与用户定义的关联函数相关联。检索与搜索查询匹配的文档,并使用该用户定义的关联函数来为该文档计算排名。
在本技术的另一种方法中,描述了一种具有计算机可执行指令的计算机可读介质。在该方法中,接收用户定义的排序函数,并接收搜索查询。将该搜索查询分解成多个简单运算。这些简单运算中的每一个都与关联函数相关联。检索对应于这些较简单的运算的多个结果,并使用相关联的关联函数来为这些结果中的每一个计算排名。
在本技术的另一种方法中,一种具有总线、处理器、存储器和数据存储设备的系统被配置成接收复杂搜索查询。该系统还被配置成将该复杂搜索查询解析成若干较简单的运算。该系统还被配置成检索对应于这些较简单的运算的结果,并通过应用用户定义的关联函数来为每一个结果计算排名。
提供本概述以便以简化的形式介绍将在以下详细描述中进一步描述的一些概念。本概述并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于限定所要求保护的主题的范围。
附图简述
合并在本说明书中并形成其一部分的附图示出了各实施例,并且与说明书一起用于解释所要求保护的主题的原理:
图1是其上可实现各实施例的示例性计算系统的框图。
图2是其上可实现各实施例的示例数据库表。
图3是根据一个实施例的应用用户定义的关联函数的方法的流程图。
图4A是根据一个实施例的示例数据库查询。
图4B是根据一个实施例的搜索树的描绘。
图4C是根据一个实施例的中间搜索树的描绘。
图4D是根据一个实施例的查询树的描绘。
详细描述
现在将详细参考若干实施例。尽管本主题将结合各替换实施例来描述,但将理解,它们并不旨在将所要求保护的主题限于这些实施例。相反,所要求保护的主题旨在涵盖可被包括在权利要求书所定义的所要求保护的主题的精神和范围内的替换、修改和等效技术方案。
此外,在以下详细描述中,阐明了众多具体细节以提供对所要求保护的主题的全面理解。然而,本领域的技术人员将认识到各实施例可以在没有这些具体细节或具有其等效物的情况下实施。在其它情况下,未详细描述公知的方法、过程、组件和电路以免不必要地使主题的各方面和特征显得晦涩难懂。
以下详细描述中的各部分按照一种方法来呈现和讨论。尽管其步骤和排序在此处描述该方法的各操作的附图(例如,图3)中公开,但这些步骤和排序是示例性的。各实施例很好地适用于执行各种其他步骤或此处附图的流程图中所述的步骤的变型,并且按照与此处所描绘和描述的不同的顺序。
本详细描述的某些部分按照过程、步骤、逻辑块、处理、以及对可在计算机存储器上执行的数据位的操作的其它符号表示来呈现。这些描述和表示是数据处理领域技术人员用来将其工作的实质最有效地传达给本领域的其他技术人员的手段。过程、计算机执行的步骤、逻辑块、处理等在此处且通常被认为是导致所需结果的自相一致的步骤或指令的序列。步骤是需要对物理量的物理操纵的那些步骤。尽管并非必需,但这些物理量通常采用能够在计算机系统中被存储、传输、组合、比较、或以其它方式操纵的电或磁信号的形式。原则上出于常见用法的原因将这些信号称作位、值、元素、符号、字符、项、数字等被证明有时是方便的。
然而,应当记住,所有这些和类似术语都应与适当的物理量相关联并且仅仅是应用于这些物理量的方便的标签。如从以下讨论中清楚的,除非具体地另外指明,否则可以理解,贯穿本发明,利用诸如“访问”、“编写”、“包括”、“存储”、“发送”、“遍历”、“关联”、“标识”等术语的讨论涉及计算机系统或类似的电子计算设备的动作和处理,其操纵计算机系统的寄存器和存储器中被表示为物理(电子)量的数据并将其变换成计算机系统存储器或寄存器或其他这样的信息存储、传输或显示设备中类似地被表示为物理量的其他数据。
诸如计算系统环境10等计算设备通常包括至少某些形式的计算机可读介质。计算机可读介质可以是可由计算机访问的任何可用介质。作为示例而非限制,计算机可读介质可以包括计算机存储介质和通信介质。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据这样的信息的任何方法或技术实现的易失性和非易失性、可移动和不可移动介质。计算机存储介质包括但不限于,RAM、ROM、EEPROM、闪存或其它存储器技术、CD-ROM、数字多功能盘(DVD)或其它光盘存储器、盒式磁带、磁带、磁盘存储或其它磁存储设备,或者任何其它可用于存储所需信息并可由计算机访问的介质。通信介质通常以诸如载波或其它传输机制等已调制数据信号来体现计算机可读指令、数据结构、程序模块或其它数据,并包括任意信息传送介质。术语“已调制数据信号”指的是以在信号中编码信息的方式设定或更改其一个或多个特征的信号。作为示例而非限制,通信介质包括有线介质,诸如有线网络或直接线连接,以及无线介质,诸如声学、RF、红外、和其它无线介质。以上的任何组合也应包括在计算机可读介质的范围内。
某些实施例可以在由一个或多个计算机或其他设备执行的诸如程序模块等计算机可执行指令的通用上下文中描述。一般而言,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等。通常,程序模块的功能可以按需在各个实施例中进行组合或分布。
基本计算设备
参考图1,用于实现各实施例的示例性系统包括通用计算系统环境,如计算系统环境10。在其最基本的配置中,计算系统环境10通常包括至少一个处理单元12和存储器14。取决于计算系统环境的确切配置和类型,存储器14可以是易失性的(诸如RAM)、非易失性的(诸如ROM、闪存等)或是两者的某种组合。该最基本配置在图1中由虚线16来示出。另外,计算系统环境10还可具有附加的特征/功能。例如,计算系统环境10还可包含附加存储(可移动和/或不可移动),包括但不限于磁或光盘或磁带。这样的附加存储在图1中由可移动存储18和不可移动存储20示出。计算机存储介质包括以用于存储诸如计算机可读指令、数据结构、程序模块或其它数据等信息的任何方法或技术来实现的易失性和非易失性、可移动和不可移动介质。存储器14、可移动存储18和不可移动存储20都是计算机存储介质的示例。
计算系统环境10还可包含允许其与其它设备进行通信的通信连接22。通信连接22是通信介质的一个示例。在所描绘的实施例中,计算系统环境10被示为通过通信连接22来与数据库30进行通信。数据库30的特性和内容可跨不同的实施例而变化。此外,在某些实施例中,数据库30可以是内置数据库,例如,在可移动存储18和/或不可移动存储20中实现。
计算装置10还可具有输入设备24,诸如键盘、鼠标、笔、语音输入设备、触摸输入设备等等。还可包括输出设备26,诸如显示器、扬声器、打印机等等。此处所讨论的各具体实施例将触摸输入设备与显示器进行组合,例如,触摸屏。所有这些设备在本领域是公知的并且不必在此详细讨论。
用户定义的关联函数
虽然关联函数是搜索引擎的必需且有价值的部分,但单个关联函数可能不适用于每一种情形。如以下实施例中所描述的,具有允许用户修改由搜索引擎应用的关联函数的搜索引擎将会是有价值的。此外,在某些实施例中,用户将能够完全替换关联函数的部分或全部,以便定制搜索引擎以更好地反映用户的特定需求。
因此,在以下的实施例中,将描述一种允许用户指定供与搜索引擎一起使用的排序函数的方法。在某些实施例中,这通过向排序函数的编写者展示关联函数的基本构建块(例如,多路归并联结逻辑运算符)来实现。
数据库表
现在参考图2,描绘了根据一个实施例的示例性数据库表200。虽然数据库表200被示为结合具体、枚举的特征和元素,但可以理解,各实施例很好地适用于涉及更多、更少或不同的特征或元素的应用。具体而言,虽然数据库表200被示为是只包含两列的简单表格,但可以理解,各实施例适用于跨各种各样的搜索类型和数据类型的应用。
数据库表200被示为包括多个数据库行或条目,例如,行210到260。每一数据库行都包括文档键列,例如,文档键212,其包含存储在该行中的的文档的唯一标识符。每一数据库行还包括一文档列,例如,文档214,其包含对应于特定文档键的文档的文档文本。在所描绘的实施例中,若干文档列条目被示为包括若干项,它们在以下将用于示出其他示例。
关联函数
在不同的实施例中,接受不同类型的查询或搜索。例如,在一个实施例中,支持布尔搜索,例如,使用诸如AND(与)、OR(或)或AND NOT(与非)等布尔逻辑运算符来组合项的搜索。在另一实施例中,支持向量指定,例如,搜索多个项,且这些项的部分或全部被分配不同的权重。在例如web搜索的另一实施例中,,对所返回的搜索文档的最终排名可部分地取决于与该文档相关联的外部考虑事项,例如,元数据。在另一实施例中,利用其它搜索方法。
在许多应用中,用户能操纵或修改搜索引擎所应用的关联函数,而不依赖内置到特定搜索引擎中的关联函数是有利的,例如,用户可选择对不同的情况或数据集应用不同的关联函数,或者可以修改排序函数,以更改应用于搜索结果的排名以满足某一合乎需要的准则。这种操纵的自由向用户提供了优点。
在某些实施例中,用户可选择提供对应于不同的可用运算符的若干排序函数。例如,在处理布尔逻辑运算符时,用户可为AND和OR运算符提供单独的关联函数。此外,在若干这样的实施例中,可向搜索引擎提供默认关联函数以便与未被用户提供的关联函数覆盖的运算符一起使用。
应用用户定义的关联函数
现在参考图3,描绘了根据一个实施例的应用用户定义的关联函数的方法的流程图300。尽管在流程图300中公开了具体步骤,但这些步骤是示例性的。即,这些实施例很好地适用于执行各种其它(附加)步骤或流程图300中所述的步骤的变体。可以理解,流程图300中的步骤可以按与所呈现的次序不同的次序执行,且并非流程图300中的所有步骤都要被执行。
现在参考步骤310,接收用户指定的排序函数。在不同的实施例中,利用提供这一关联函数的不同方法。例如,在某些实施例中,用户可提供用编程语言(例如,T-SQL)编写的关联函数。在若干这样的实施例中,对于用户定义的关联函数使用声明性语言,例如,SQL或方言。而且,在不同的实施例中,排序函数的运算可以变化。例如,在一个实施例中,排序函数可应用于布尔运算符AND,并对搜索结果应用TF-IDF方案。
现在参考步骤320,分解查询。在某些实施例中,将复杂查询分解成较简单的运算符的树。在其它一些实施例中,将查询分解成若干较简单的运算。例如,在一个实施例中,将全文查询分成包含通过联结来连接的若干简单运算的树。在这一实施例中,联结类型基于连接简单运算的逻辑运算符。例如,AND被视作内联结,OR被视作外联结,而AND NOT作为不存在来处理。在某些实施例中,每一较简单的运算都包含同质逻辑运算符,例如,仅AND或OR。在一个这样的实施例中,用于同质逻辑运算符的排序函数被视作是可交换的。
现在参考步骤330,将简单运算与排序函数相关联。在某些实施例中,简单运算可与用户提供的排序函数相关联。在若干实施例中,简单运算可与用户提供的排序函数(如果有用户提供的排序函数可用的话)或默认排序函数链接。在某些实施例中,排序函数具有共同的签名,且将用于索引访问的语言元素用作基本工具;在这些实施例中,为排序函数提供上下文信息,该上下文信息进而被传递给执行索引访问的元素。此外,上下文信息可被传递到其它表值函数(TVF),以获取对于排序函数而言是重要的但不存在于索引中的信息。
现在参考步骤340,执行搜索并检索对应的结果。在不同的实施例中,该搜索和检索操作以不同的方式执行。可以理解,各实施例很好地适用于具有许多不同的搜索和结果检索方法的应用。在某些实施例中,检索到的结果包括关联函数计算这些结果的排名所必需的信息。这些信息可包括诸如文档计数、项频率、项权重和其它信息等元素。在某些实施例中,利用上述分解的简单运算来执行多次搜索。在一个这样的实施例中,提供上下文信息允许索引访问元素检索与对应于较简单的运算的部分查询相匹配的行。
现在参考步骤350,根据一个或多个适当的排序函数来对检索到的结果进行排序。在某些实施例中,排序函数使用诸如聚集和标量用户定义的函数等标准SQL编程构造来为每一个文档计算分数。
在某些实施例中,查询分解以及排序函数与简单运算符的关联在编译阶段期间执行,而搜索、检索和排序在运行时阶段执行。在其它实施例中,这些操作的定时可以变化。
流式表值函数
在实现上述方法的某些实施例中,索引访问使用流式表值函数(streamingtable valued function,STVF)来提供。在这一实施例中,对STVF的使用提供了某些优点。其中有:多路AND和OR在倒排索引上的高效实现,以及输出以递增文档标识符次序排序的高效倒置,即使该文档标识符是倒排索引中的内部列。在其它实施例中,可利用其它搜索结果排序,例如,相关性次序。此外,使用STVF允许基于用户请求来在不同的层进行解压缩,例如,对于文档标识符解压缩在层1进行解压缩,或者对于出现解压缩在等级2进行解压缩。另外,使用STVF允许高效地检索排序所需信息,例如,文档计数、项频率、项权重或列权重。此外,使用STVF允许准确的基数估计,进而允许数据库查询优化器来进行有效优化。
查询分解
现在参考图4A,描绘了根据一个实施例的示例数据库查询400。虽然查询400被示为结合具体、定义的元素,但可以理解各实施例很好地适用于涉及更多、更少或不同元素或者表征不同的元素排列的应用。
在所描绘的实施例中,查询400被示为针对SQL数据库的全文查询。在该实施例中,查询400经过多次变换,这些变换以该查询被精简为若干较简单的运算并允许包括用户提供的排序函数的方式来构造。
在所描绘的实施例中,T是数据库表,诸如表200。文档和文档键是数据库表中的列。在所描绘的实施例中,搜索串是‘apples AND oranges OR grapes ANDpears’。CONTAINSTABLE(包含表)是T-SQL TVF,它返回符合(qualify)搜索串的行以及文档相对于该搜索串的排名。在所描绘的实施例中,该查询指示搜索引擎返回表T的所有行及其排名值,其中文档列包含关键字apples(苹果)和oranges(桔子)或者关键字grapes(葡萄)和pears(梨)。
在一个实施例中,解析并绑定查询。在解析和绑定过程期间,标识CONTAINSTABLE函数,并且调用全文查询编译器来处理搜索串。该全文查询编译器将搜索串变换成表示查询关键字和绑定这些关键字的逻辑运算符的树。图4B描绘了一种这样的棵树,即,树401。
如树401所示,来自查询400的搜索串已被变换成树结构。组织树401以使得逻辑运算符绑定由搜索串关联的树元素。以此方式,OR 410将AND 420与AND425绑定。AND 420进而将apples 431与oranges 433绑定,而AND 425将grapes 435与pears 437绑定。
在某些实施例中,在将搜索字符串精简到简化的树结构后,标识同质逻辑运算符,诸如AND和OR运算符。在若干这样的实施例中,绑定简单项(例如,关键字)的同质逻辑表达式被变换成被实现为STVF的多路跳跃归并联结运算符。图4C将一个这样的实施例描绘为中间树441。
如中间树441所示,树401的AND部分已经用被实现为STVF的多路跳跃归并联结运算符来替换。OR 450现在绑定元素460和465,这两个元素中的每一个都是多路跳跃归并联结运算符。
在某些实施例中,在按此方式变换查询后,系统将加载用户为适当的运算符提供的排序函数。例如,参考中间树441,系统将加载用户为AND运算符提供的排序函数。在编译排序函数期间,系统将在适当时插入实际多路归并联结运算符。在其中用户没有为特定运算符提供排序函数的某些实施例中,改为加载并编译默认系统提供的函数。
然后在更高的层,例如在图4C中的OR 450的层组合排序函数返回的排名值。在某些实施例中,该组合通过默认系统操作来处理,例如,计算组合排名作为最大值(在OR运算符的情况下),或者作为最小值(在AND运算符的情况下)。在其它实施例中,用户可按与用户指定的排序函数类似的方式提供用户指定的组合函数。
在图4D中,描绘了根据一个实施例的查询树471。查询树471示出了具有如上所述的组合函数的查询400的最终状态。在所描绘的实施例中,该全文查询树中的非叶节点被变换成关系运算符,例如,AND被变换成内联结、OR被变换成外联结或者AND NOT被变换成半联结。如图所示,OR 450已被外联结485替换。已分别为多路跳跃归并联结运算符492和497加载排序函数490和495。块480描绘了组合函数,此处被示为排序函数490和495所返回的排名值的最大值。
在某些实施例中,该查询树被结合到总SQL查询中,并作为整体来优化。在若干这样的实施例中,该优化确保用户定义的排序函数无论多复杂都如同该函数是用户提供的查询的一部分那样得到系统的相同程度的优化。
尽管已以针对结构特征和/或方法动作的语言描述了该主题,但可以理解,所附权利要求书中定义的主题不必限定于上述的特定特征或动作。相反,上述特定的特征和动作作为实现这些权利要求的示例性形式而予以公开。
Claims (20)
1.一种应用用户定义的关联函数的方法,包括:
将复杂搜索查询分解成简单运算符;
将所述简单运算符与所述用户定义的关联函数相关联;
检索与所述复杂搜索查询相匹配的匹配文档;以及
使用所述用户定义的关联函数来为所述匹配文档计算排名。
2.如权利要求1所述的方法,其特征在于,还包括:
接收所述用户定义的关联函数。
3.如权利要求1所述的方法,其特征在于,还包括:
在数据库中搜索所述匹配文档。
4.如权利要求1所述的方法,其特征在于,所述匹配文档包括由所述用户定义的关联函数用来计算所述排名的信息。
5.如权利要求1所述的方法,其特征在于,所述计算包括所述用户定义的关联函数使用与所述匹配文档相关联的信息来计算所述排名。
6.如权利要求1所述的方法,其特征在于,所述分解包括将同质逻辑表达式分解成多路跳跃归并联结运算符。
7.如权利要求1所述的方法,其特征在于,所述复杂搜索查询包括布尔逻辑查询。
8.如权利要求1所述的方法,其特征在于,所述分解包括将所述复杂搜索查询分解成运算符树。
9.一种具有用于执行以下步骤的计算机可执行指令的计算机可读介质,所述步骤包括:
接收用户定义的排序函数;
接收搜索查询;
将所述搜索查询分解成多个简单运算;
将所述多个简单运算中的每一个与所述用户定义的排序函数相关联;
检索对应于所述多个简单运算的多个结果;以及
使用所述用户定义的排序函数来计算所述多个结果中的每一个的排名。
10.如权利要求9所述的计算机可读介质,其特征在于,还包括:
接收多个用户定义的排序函数;以及
将所述多个用户定义的排序函数与所述多个简单运算相关联。
11.如权利要求9所述的计算机可读介质,其特征在于,还包括:
组合所述多个结果的所述排名以产生所述多个结果中的每一个的总排名。
12.如权利要求11所述的计算机可读介质,其特征在于,所述组合包括:
从所述多个结果的所述排名中计算最大排名值。
13.如权利要求9所述的计算机可读介质,其特征在于,所述分解包括:
将所述搜索查询变换成搜索树;
标识所述搜索树中的同质运算符;以及
将所述同质运算符变换成多路跳跃归并联结运算符。
14.如权利要求13所述的计算机可读介质,其特征在于,所述多路跳跃归并联结运算符包括流式表值函数(STVF)。
15.如权利要求9所述的计算机可读介质,其特征在于,所述搜索查询包括向量查询。
16.如权利要求15所述的计算机可读介质,其特征在于,所述向量查询包括多个关键字,且每一个关键字都与搜索权重相关联。
17.一种系统,包括:
总线;
耦合到所述总线、用于处理信息的处理器;
耦合到所述总线、用于存储信息的存储器;以及
耦合到所述总线、用于存储信息的数据存储设备,其中所述系统被配置成接收复杂搜索查询,将所述复杂搜索查询解析成多个较简单的运算,检索对应于所述多个较简单的运算的多个结果,并通过应用用户定义的关联函数来计算所述多个结果中的每一个的排名。
18.如权利要求17所述的系统,其特征在于,所述系统被配置成通过将所述复杂搜索查询精简为搜索树,将所述树中的同质运算符变换成多路跳跃归并联结运算符,并将所述搜索树的非叶节点变换成关系运算符,来解析所述复杂搜索查询。
19.如权利要求18所述的系统,其特征在于,还被配置成将所述用户定义的关联函数作为所述搜索树的一部分来优化。
20.如权利要求17所述的系统,其特征在于,所述用户定义的关联函数包括用声明性语言编写的函数。
Applications Claiming Priority (3)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
US11/805,380 US7853603B2 (en) | 2007-05-23 | 2007-05-23 | User-defined relevance ranking for search |
US11/805,380 | 2007-05-23 | ||
PCT/US2008/063991 WO2008147736A1 (en) | 2007-05-23 | 2008-05-16 | User-defined relevance ranking for search |
Publications (2)
Publication Number | Publication Date |
---|---|
CN101681377A true CN101681377A (zh) | 2010-03-24 |
CN101681377B CN101681377B (zh) | 2013-03-27 |
Family
ID=40073337
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN2008800171239A Active CN101681377B (zh) | 2007-05-23 | 2008-05-16 | 用于搜索的用户定义的相关性排序 |
Country Status (5)
Country | Link |
---|---|
US (1) | US7853603B2 (zh) |
EP (1) | EP2156331A4 (zh) |
JP (1) | JP5334333B2 (zh) |
CN (1) | CN101681377B (zh) |
WO (1) | WO2008147736A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425672A (zh) * | 2012-05-17 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种数据库索引的建立方法及装置 |
CN104123374A (zh) * | 2014-07-28 | 2014-10-29 | 北京京东尚科信息技术有限公司 | 分布式数据库中聚合查询的方法及装置 |
CN107273427A (zh) * | 2017-05-18 | 2017-10-20 | 武汉大学 | 基于数据融合的跨设备网络信息搜索方法及系统 |
CN107315744A (zh) * | 2016-04-26 | 2017-11-03 | 杭州海康威视数字技术股份有限公司 | 一种数据查询方法及装置 |
CN110413763A (zh) * | 2018-04-30 | 2019-11-05 | 国际商业机器公司 | 搜索排序器的自动选择 |
Families Citing this family (16)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8046373B2 (en) * | 2009-01-25 | 2011-10-25 | Hewlett-Packard Development Company, L.P. | Structured parallel data intensive computing |
US8166536B1 (en) * | 2009-02-10 | 2012-04-24 | Juniper Networks, Inc. | Transformation of network filter expressions to a content addressable memory format |
US8296292B2 (en) * | 2009-11-25 | 2012-10-23 | Microsoft Corporation | Internal ranking model representation schema |
US10140339B2 (en) * | 2010-01-26 | 2018-11-27 | Paypal, Inc. | Methods and systems for simulating a search to generate an optimized scoring function |
CN102486781A (zh) * | 2010-12-03 | 2012-06-06 | 阿里巴巴集团控股有限公司 | 一种搜索排序方法和装置 |
US9442928B2 (en) | 2011-09-07 | 2016-09-13 | Venio Inc. | System, method and computer program product for automatic topic identification using a hypertext corpus |
US9442930B2 (en) | 2011-09-07 | 2016-09-13 | Venio Inc. | System, method and computer program product for automatic topic identification using a hypertext corpus |
JP5782937B2 (ja) * | 2011-09-08 | 2015-09-24 | 富士通株式会社 | タグ管理装置、タグ管理システムおよびタグ管理プログラム |
US9098550B2 (en) * | 2012-05-17 | 2015-08-04 | Sap Se | Systems and methods for performing data analysis for model proposals |
US9607053B2 (en) * | 2012-08-22 | 2017-03-28 | Expert System France | Methods and systems for searching and displaying a plurality of entities within an interactive user interface |
JP6204753B2 (ja) * | 2013-08-28 | 2017-09-27 | Kddi株式会社 | 分散クエリ処理装置、処理方法及び処理プログラム |
US10417259B2 (en) | 2015-05-13 | 2019-09-17 | International Business Machines Corporation | Representing search results via a three-dimensional matrix |
US10216501B2 (en) * | 2015-06-04 | 2019-02-26 | The Mathworks, Inc. | Generating code in statically typed programming languages for dynamically typed array-based language |
CN114175012A (zh) * | 2019-04-23 | 2022-03-11 | 雷克斯股份有限公司 | 基于查询令牌密度对电子文档进行排序的系统和方法 |
US11281671B2 (en) | 2019-05-20 | 2022-03-22 | Google Llc | Retroreflective join graph generation for relational database queries |
US11269880B2 (en) * | 2019-05-20 | 2022-03-08 | Google Llc | Retroreflective clustered join graph generation for relational database queries |
Family Cites Families (21)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5802515A (en) | 1996-06-11 | 1998-09-01 | Massachusetts Institute Of Technology | Randomized query generation and document relevance ranking for robust information retrieval from a database |
US5966126A (en) * | 1996-12-23 | 1999-10-12 | Szabo; Andrew J. | Graphic user interface for database system |
US5806061A (en) | 1997-05-20 | 1998-09-08 | Hewlett-Packard Company | Method for cost-based optimization over multimeida repositories |
US6012053A (en) | 1997-06-23 | 2000-01-04 | Lycos, Inc. | Computer system with user-controlled relevance ranking of search results |
US6334131B2 (en) | 1998-08-29 | 2001-12-25 | International Business Machines Corporation | Method for cataloging, filtering, and relevance ranking frame-based hierarchical information structures |
US7181438B1 (en) * | 1999-07-21 | 2007-02-20 | Alberti Anemometer, Llc | Database access system |
US7080064B2 (en) | 2000-01-20 | 2006-07-18 | International Business Machines Corporation | System and method for integrating on-line user ratings of businesses with search engines |
US6947934B1 (en) * | 2000-02-16 | 2005-09-20 | International Business Machines Corporation | Aggregate predicates and search in a database management system |
US7158989B2 (en) | 2000-10-27 | 2007-01-02 | Buc International Corporation | Limit engine database management system |
CA2485554A1 (en) | 2002-05-14 | 2003-11-27 | Verity, Inc. | Searching structured, semi-structured, and unstructured content |
US7111000B2 (en) * | 2003-01-06 | 2006-09-19 | Microsoft Corporation | Retrieval of structured documents |
US8600963B2 (en) | 2003-08-14 | 2013-12-03 | Google Inc. | System and method for presenting multiple sets of search results for a single query |
US7505964B2 (en) | 2003-09-12 | 2009-03-17 | Google Inc. | Methods and systems for improving a search ranking using related queries |
US7437371B2 (en) * | 2004-02-10 | 2008-10-14 | Microsoft Corporation | Systems and methods for the implementation of unordered and ordered collections in a data store |
US7606792B2 (en) * | 2004-03-19 | 2009-10-20 | Microsoft Corporation | System and method for efficient evaluation of a query that invokes a table valued function |
US7376642B2 (en) | 2004-03-30 | 2008-05-20 | Microsoft Corporation | Integrated full text search system and method |
KR101030368B1 (ko) * | 2004-04-30 | 2011-04-20 | 마이크로소프트 코포레이션 | 데이터 저장소 내의 비순서화 및 순서화 컬렉션의 구현을 위한 시스템 및 방법 |
US20060064411A1 (en) | 2004-09-22 | 2006-03-23 | William Gross | Search engine using user intent |
US7739277B2 (en) * | 2004-09-30 | 2010-06-15 | Microsoft Corporation | System and method for incorporating anchor text into ranking search results |
US20060218146A1 (en) | 2005-03-28 | 2006-09-28 | Elan Bitan | Interactive user-controlled relevance ranking of retrieved information in an information search system |
CA2550818C (en) | 2005-09-13 | 2012-06-26 | Cognos Incorporated | System and method of providing relational set operations for olap data sources |
-
2007
- 2007-05-23 US US11/805,380 patent/US7853603B2/en active Active
-
2008
- 2008-05-16 JP JP2010509482A patent/JP5334333B2/ja not_active Expired - Fee Related
- 2008-05-16 CN CN2008800171239A patent/CN101681377B/zh active Active
- 2008-05-16 WO PCT/US2008/063991 patent/WO2008147736A1/en active Application Filing
- 2008-05-16 EP EP08755775A patent/EP2156331A4/en not_active Ceased
Cited By (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103425672A (zh) * | 2012-05-17 | 2013-12-04 | 阿里巴巴集团控股有限公司 | 一种数据库索引的建立方法及装置 |
CN103425672B (zh) * | 2012-05-17 | 2016-05-04 | 阿里巴巴集团控股有限公司 | 一种数据库索引的建立方法及装置 |
CN104123374A (zh) * | 2014-07-28 | 2014-10-29 | 北京京东尚科信息技术有限公司 | 分布式数据库中聚合查询的方法及装置 |
CN104123374B (zh) * | 2014-07-28 | 2017-09-29 | 北京京东尚科信息技术有限公司 | 分布式数据库中聚合查询的方法及装置 |
CN107315744A (zh) * | 2016-04-26 | 2017-11-03 | 杭州海康威视数字技术股份有限公司 | 一种数据查询方法及装置 |
CN107273427A (zh) * | 2017-05-18 | 2017-10-20 | 武汉大学 | 基于数据融合的跨设备网络信息搜索方法及系统 |
CN110413763A (zh) * | 2018-04-30 | 2019-11-05 | 国际商业机器公司 | 搜索排序器的自动选择 |
Also Published As
Publication number | Publication date |
---|---|
EP2156331A4 (en) | 2011-10-05 |
JP5334333B2 (ja) | 2013-11-06 |
JP2010528369A (ja) | 2010-08-19 |
US20080294620A1 (en) | 2008-11-27 |
EP2156331A1 (en) | 2010-02-24 |
WO2008147736A1 (en) | 2008-12-04 |
CN101681377B (zh) | 2013-03-27 |
US7853603B2 (en) | 2010-12-14 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101681377B (zh) | 用于搜索的用户定义的相关性排序 | |
CN102725759B (zh) | 用于搜索结果的语义目录 | |
CN1713179B (zh) | 在对象模型中的影响分析 | |
CN102073490B (zh) | 转译数据库语言的方法及装置 | |
US20090319499A1 (en) | Query processing with specialized query operators | |
CN102708136B (zh) | 包括使用可重用索引字段的对特征的索引和搜索 | |
US9275155B1 (en) | Querying across a composite join of multiple database tables using a search engine index | |
US20090109225A1 (en) | System and method to organize assets in a repository | |
US20120254089A1 (en) | Vector throttling to control resource use in computer systems | |
US20100174704A1 (en) | Searching method and system | |
CN103548023A (zh) | 基于本体的自动自助式用户支持 | |
CN101458692A (zh) | 一种战略物资行业知识库的平台及其构建方法 | |
CN102023989A (zh) | 一种信息检索方法及其系统 | |
CN101452487B (zh) | 一种数据加载的方法、系统及数据加载装置 | |
Hiemstra et al. | PF/Tijah: text search in an XML database system | |
KR20130084599A (ko) | 레코드들의 컬럼형 스토리지 표현 | |
CN107710201A (zh) | 存储数据和从位向量搜索索引取回数据 | |
CN107851108A (zh) | 使用位向量搜索索引的匹配文档 | |
CN102902763A (zh) | 关联、检索信息处理数据和处理信息任务的方法及装置 | |
CN102253967B (zh) | 数据查找系统和数据查找方法 | |
CN102270201B (zh) | 用于网络文件的多维索引的方法和设备 | |
CN106055567A (zh) | 提供app商店搜索结果 | |
Porcu | Python for data mining quick syntax reference | |
US20090077031A1 (en) | System and method for creating full-text indexes of patent documents | |
US11620282B2 (en) | Automated information retrieval system and semantic parsing |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C14 | Grant of patent or utility model | ||
GR01 | Patent grant | ||
ASS | Succession or assignment of patent right |
Owner name: MICROSOFT TECHNOLOGY LICENSING LLC Free format text: FORMER OWNER: MICROSOFT CORP. Effective date: 20150506 |
|
C41 | Transfer of patent application or patent right or utility model | ||
TR01 | Transfer of patent right |
Effective date of registration: 20150506 Address after: Washington State Patentee after: Micro soft technique license Co., Ltd Address before: Washington State Patentee before: Microsoft Corp. |