CN101111837A - 查询自动分类的搜索处理 - Google Patents

查询自动分类的搜索处理 Download PDF

Info

Publication number
CN101111837A
CN101111837A CNA2005800473555A CN200580047355A CN101111837A CN 101111837 A CN101111837 A CN 101111837A CN A2005800473555 A CNA2005800473555 A CN A2005800473555A CN 200580047355 A CN200580047355 A CN 200580047355A CN 101111837 A CN101111837 A CN 101111837A
Authority
CN
China
Prior art keywords
unit
classification
inquiry
query
node
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA2005800473555A
Other languages
English (en)
Other versions
CN101111837B (zh
Inventor
希亚姆·卡普尔
吉格纳舒·帕里克
乔希·迪帕
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Fly upward Management Co., Ltd
Original Assignee
Yahoo Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yahoo Inc filed Critical Yahoo Inc
Publication of CN101111837A publication Critical patent/CN101111837A/zh
Application granted granted Critical
Publication of CN101111837B publication Critical patent/CN101111837B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3325Reformulation based on results of preceding query
    • G06F16/3326Reformulation based on results of preceding query using relevance feedback from the user, e.g. relevance feedback on documents, documents sets, document terms or passages
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/95Retrieval from the web
    • G06F16/953Querying, e.g. by the use of web search engines
    • G06F16/9535Search customisation based on user profiles and personalisation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99934Query formulation, input preparation, or translation
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10TECHNICAL SUBJECTS COVERED BY FORMER USPC
    • Y10STECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y10S707/00Data processing: database and file management or data structures
    • Y10S707/99931Database or file accessing
    • Y10S707/99933Query processing, i.e. searching
    • Y10S707/99936Pattern matching access

Abstract

使用搜索请求处理搜索结果,包括分析所接收到的查询以提供对被找到信息的更精确的理解。通过将查询分解为单位以及定义单位之间的各种关系来从一组查询中生成概念网络。通过这些概念网络,查询可被自动分为多个类别,或者更普遍地,可与分类的一个或多个节点相关联。分类可被用于改变搜索结果或向用户表示的结果。作为搜索结果或表示的改变实例,表示可包括对相关搜索查询项的“建议”。作为其它实例,搜索语料库可根据类别来改变,或者向用户表示的结果的排序或选择可根据类别来改变。

Description

查询自动分类的搜索处理
技术领域
总的来说,本发明涉及网络和互联网的搜索以及接口系统,更具体地,涉及提供包括多种功能的增强搜索功能性的搜索系统,其中,根据一种或多种分类系统自动分类搜索查询,以及其中,可从过去的查询和/或关于查询的用户行为自动生成分类系统。
背景技术
随着互联网以及万维网(网络)上用户可用的大量网页和媒体内容的出现,存在向用户提供现代化的方法以过滤并获得来自网络的期望信息的需要。已经开发了搜索系统和进程来满足用户获得期望信息的需求。这种技术的实例可通过Yahoo!、Google、以及其它网站来访问。典型地,用户输入查询,然后搜索进程返回与查询相关的一个或多个链接(在搜索网页的情况下)、文档、和/或参考文献(在不同搜索语料库的情况下)。返回的链接可能与用户实际查找的紧密相关,或者可能与其完全不相关。查询结果的“关联性”部分地可以是所输入实际查询以及所使用的搜索系统(基础收集系统)的稳定性的函数。关联性可以是由用户主观地确定的或者由用户可能正在查找的内容客观地确定的。
用户输入的查询通常地由一个或多个词组成。例如,“Hawaii”是一个查询,所以“New York City”,以及“New York City lawenforcement”也是一个查询。因而,总体来说,查询对人类大脑来说是不完整的。换句话说,人们不会按照查询进行自然思考。它们是部分地由查询搜索引擎或查找库目录的需要而强加的人工构造。人们也不会仅按照单个词来进行自然思考。人类思考的依据是自然概念。例如,“Hawaii”和“New York City”根据对词数的测量是长度完全不同的查询,但它们共享一个重要的特性:它们每个都由一个概念组成。然而,查询“New York City law enforcement”是不同的,其由两个截然不同的概念“New York City”和“lawenforcement”组成。
人们还根据概念之间的逻辑关系进行思考。例如,“法律实施”和“警察”是相关概念,因为警察是法律实施的重要机构;录入这些概念中的一个的用户可能对与其它概念相关的网站感兴趣,即使那些网站不包含用户录入的特定单词或短语。作为这种思考模式的结果,人们通过输入一个或多个自然概念而不是简单的可变长度序列的单个词来自然地建立查询,并且查询通常不包括用户可能知道的所有相关概念。另外,用户意图不必要反映在查询的各个词中。例如,“law enforcement”是一个概念,而分开的词“law”和“enforcement”并不单独传达与组合这两个词相同的用户意图。
搜索提供者使用的当前技术不能以与人们创建它们相同的方式来理解查询。例如,现有搜索引擎通常搜索用户输入的确切的词或短语,而不是基本的自然概念或用户心里实际存在的相关概念。这可能是妨碍搜索提供者确认用户意图和提供最佳搜索结果和内容的最重要的原因。
可以看出,需要提供一种改进的搜索和接口技术,其旨在提供更加符合用户可能感兴趣的实际概念的结果以及更好的用户体验的结果。
发明内容
本发明的实施例提供了一种用于处理搜索请求的系统和方法,包括分析接收到的查询以提供对查找的信息更加精确的理解。例如,基于在查询中一起出现的单位模式,通过将查询分解成单位并定义单位之间的各种关系来从一组查询中生成概念网络。可生成对应于不同查询组(例如,表示不同时间周期或不同地理区域)的大量不同概念网络。根据这些概念网络,可将查询自动分类成类别,或者更通常地,可使查询与一个或多个分类节点相关联。分类可用于改变搜索结果或对用户的表示结果。
作为搜索结果或表示的改变实例,表示可包括对于相关搜索查询项的“建议”列表。作为其它实例,搜索的语料库可根据类别而改变,或者显示给用户的结果的排序和选择可根据类别而改变。
在一些实施例中,使用习得的一组查询节点对进行分类,其中,一个对将特定的查询映射到分类系统中的特定节点。可根据人工指定哪个查询与哪个节点相匹配来初始化习得的组,并且执行随着搜索越来越多而逐渐增强。增强的一种方法包括跟踪后查询点击行为以确定查询的类别估计如何与通过后查询点击行为(例如,查询之后用户选择的搜索结果的特定点击)证明的查询的实际查询类别不同。
在一些实施例中,对于一些单位和概念类别是已知的,并且查询可包含已知的或未知的或者对查询的不同部分的不同类别已知的单位或概念。在这些情况下,可从部分查询的类别和多种类别中推断整个查询的类别。
下面的详细描述与附图一起将提供对本发明的性质和优点更好理解。
附图说明
图1是根据本发明实施例的信息检索和通信系统的简化高级方框图。
图2是根据本发明实施例的通信媒体内容的信息检索和通信网络的简化方框图。
图3是示出了根据本发明实施例的概念网络的示图。
图4是根据本发明实施例的查询处理引擎的简化方框图。
图5是单位发生器的简化方框图。
图6是自动查询分类器的实施例的方框图。
图7是包括根据查询记录和查询的类别表示进行搜索的搜索引擎的信息检索和通信系统的方框图。
图8是包括根据查询分类将查询引导到一个或多个搜索引擎的查询导向器的信息检索和通信系统的方框图。
图9是包括根据参照记录的查询的查询分类来修改查询记录以形成修改的查询记录的预处理器的信息检索和通信系统的方框图。
图10是自动分类系统的用户界面的一个实施例的示图。
图11是用于输入搜索和提供结果的用户界面的一个实施例的示图。
具体实施方式
I.综述
A.网络实现
图1示出了根据本发明实施例的包括客户系统20的信息检索和通信网络10的总的概述。在计算机网络10中,客户系统20通过互联网40或其他通信网络(例如,通过任何局域网(LAN)或广域网(WAN)连接)连接至任意数量的服务器系统501至50N。如这里将要描述的,根据本发明配置客户系统20,以使其与服务器系统501至50N中的任何一个进行通信,例如,访问、接收、检索和显示媒体内容和诸如网页的其他信息。
图1所示系统中的多个元件包括传统的、众所周知的元件,无需在此进行详细解释。例如,客户系统20可包括台式个人计算机、工作站、笔记本电脑、个人数字助理(PDA)、移动电话、或任何WAP可用的装置或者任何其它能够直接或间接与互联网接口的计算装置。典型地,客户系统20运行浏览器程序(例如,Microsoft′sInternet ExplorerTM浏览器、Netscape NavigatorTM浏览器、MozillaTM浏览器、OperaTM浏览器、或者在移动电话、PDA、或其它无线装置等的情况下的WAP可用浏览器),其允许客户系统20的用户通过互联网40访问、处理、和浏览来自服务器系统501至50N的对用户可用的信息和页面。客户系统20通常还包括一个或多个用户接口装置22(例如,键盘、鼠标、触摸屏、笔等),用于与由服务器系统501至50N或其它服务器提供的页面、格式和其它信息一起和通过浏览器在显示器(例如,监视屏、LCD显示器等)上提供的图形用户界面(GUI)进行交互。本发明适用于互联网,互联网指的是特定全球互联网络的网络。然而,应该理解,可使用代替或除互联网之外的其它网络,例如,内联网、外联网、虚拟专用网络(VPN)、不基于TCP/IP的网络、任何LAN或WAN等。
根据一个实施例,客户系统20及其所有组件是操作员使用应用程序可配置的,其中,应用程序包括使用中央处理单元(例如,Intel PentiumTM处理器、AMD AthlonTM处理器等)或多种处理器运行的计算机代码。这里描述的用于操作和配置客户系统20以通信、处理、以及显示数据和媒体内容的计算机代码优选地被下载并存储在硬盘上,但全部程序代码或其一部分也可以存储在众所周知的任一其它易失性或非易失性存储器介质或装置(例如,ROM或RAM)中,或者可设置在任何能够存储程序代码的介质上,例如,光盘(CD)介质、数字通用盘(DVD)介质、软盘等。另外,全部程序代码或其一部分可通过互联网从软件源(例如,服务器系统501至50N中的一个)传送和下载到客户系统20,或者使用任一通信介质和协议(例如,TCP/IP、HTTP、HTTPS、以太网、或其它传统介质和协议)在任一其它网络连接(例如,外联网、VPN、LAN,或其它传统网络)上传输。
应当理解,用于实现本发明一个方面的计算机代码可以是C、C++、HTML、XML、Java、JavaScript等代码,或者任何其它适当的脚本语言(例如,VBScript),或者任一其他可在客户系统20上执行或被编译以在客户系统20上执行的适当编码语言。在一些实施例中,没有代码被下载到客户系统20,并且必要的代码由服务器执行,或者执行已在客户系统20处存在的代码。
B.搜索系统
图2示出了根据本发明实施例的用于通信媒体内容的另一信息检索和通信网络110。如图所示,网络110包括客户系统120、一个或多个内容服务器系统150,以及搜索服务器系统160。在网络110中,客户系统120可通过互联网140或其它通信网络通信地连接至服务器系统150和160。如上所述,配置客户系统120及其组件以通过互联网140或其它通信网络与服务器系统150和160以及其它服务器系统进行通信。
根据一个实施例,在客户系统120上执行的客户应用程序(表示为模块125)包括用于控制客户系统120及其组件以使其与服务器系统150和160进行通信以及处理和显示从服务器系统150和160接收的数据内容的指令。尽管如上所述可在任一软件存储介质(例如,软盘、CD、DVD等)上设置客户应用程序模块125,但客户应用程序125可从诸如远程服务器系统(例如,服务器系统150、服务器系统160、或其它远程服务器系统)的软件源传输并下载到客户系统120。例如,在一个方面,可以以包括各种控制(例如,嵌入式JavaScript或Active X控制)的HTML包装的形式将客户应用程序模块125通过互联网140提供给客户系统120,其中,各种控制用于如稍后描述的操作和渲染在各种对象、帧、和窗口中的数据。
此外,客户应用程序模块125包括用于处理数据和媒体内容的各个软件模块,例如,用于处理搜索请求和搜索结果数据的专用搜索模块126、用于渲染文本和数据帧及活动窗口(例如,浏览器窗口和对话框)中的数据和媒体内容的用户接口模块127、以及用于与在客户端120上执行的各种应用程序进行接口连接和通信的应用程序接口模块128。根据本发明多个方面优选配置为进行接口连接的应用程序接口模块128的客户系统120上执行的多种应用程序的实例包括各种e-mail应用程序、即时消息(IM)应用程序、浏览器应用程序、文档管理应用程序以及其它。此外,接口模块127可包括浏览器,例如,配置在客户系统120上的默认浏览器或不同的浏览器。在一些实施例中,客户应用程序模块125提供如在Kapur IV中描述的通用搜索接口的特征。
根据一个实施例,配置服务器系统160以向客户系统120提供搜索结果数据和媒体内容,并且配置服务器系统150以例如响应于由服务器系统160提供的搜索结果页面中选择的链接向客户系统120提供数据和媒体内容(例如,网页)。如下更加详细的描述,一个实施例中的服务器系统160参考用于对例如页面、对于页面的链接等设置一个或多个索引的各种收集技术。这些收集技术包括自动爬网蛛、蜘蛛等,以及手动或半自动分类进程和用于在诸如分类系统的多层结构中分类或归类以及排列网页的接口。在某些方面,还通过用于处理并排列网页的搜索相关算法配置服务器160。优选地,服务器160还被配置为以查询日志文件的形式记录用户查询活动,例如,提交的查询、它们被提交的时间、谁提交了它们、以及提交者在接收到搜索结果之后做了什么。
一个实施例中的搜索服务器系统160参考用于对例如页面、对于页面的链接、表示索引页面内容的数据等设置的各种页面索引170。可以由多种收集技术生成页面索引,该收集技术包括自动爬网蛛、蜘蛛等,以及手动或半自动分类进程和用于在多层结构中分类或归类以及排列网页的接口。这些技术可在搜索服务器系统160上执行,或者在生成页面索引170并使其可用于搜索服务器系统160的独立系统(未示出)中执行。
页面索引170中的条目162包括搜索项、到该项出现的页面的链接(或其它编码标识符)、以及页面的上下文标识符。在Kapur IV中提供了获得搜索结果的搜索服务器系统操作的其它细节。
应当理解,这里描述的搜索系统是示例性的,以及可以进行变更和修改。内容服务器和搜索服务器系统可以是单个组织的一部分(例如,诸如Yahoo!Inc.提供给用户的分布式服务器系统),或者它们可以是完全不同的组织的一部分。尽管示出了单个块,但每个服务器系统一般都包括至少一个服务器和关联数据库系统,且可包括多个服务器和关联数据库系统,并且可以是地理上分布的。例如,搜索服务器系统的所有服务器可以彼此非常接近地定位(例如,位于单个建筑或学校中的服务农场),或者它们可以分布在彼此远离的位置处(例如,位于城市A的一个或多个服务器以及位于城市B的一个或多个服务器)。从而,如这里所使用的,“服务器系统”通常包括一个或多个逻辑和/或物理连接的服务器,其在本地或者跨越一个或多个地理位置分布;术语“服务器”和“服务器系统”可以互换使用。
可通过一个或多个页面索引和用于响应于从客户系统接收的搜索查询使用户访问页面索引并向用户提供搜索结果算法来配置搜索服务器系统。搜索服务器系统本身可生成页面索引,从另一源(例如,分离的服务器系统)接收页面索引,或者从另一源接收页面索引并执行其中的其它进程(例如,增加或更新上下文标识符)。
在本发明的优选方面,设置查询处理引擎以处理查询并将查询分解为多个组成单位。本发明的查询处理引擎使系统执行概念发现和分析进程以及上下文分析,并执行消除二义性以及可以提高响应于搜索查询返回给用户的结果质量的许多其它处理。根据本发明的查询处理引擎可在孤立的装置或连接至网络的系统(例如,执行各种这里讨论的查询处理以及分析算法和进程的计算机系统)中执行,或者可以包括该查询处理引擎,作为诸如服务器系统160的搜索服务器或其它服务器系统的一部分。
C.概念网络
在一些实施例中,通过参照包含已知概念(或“单位”)列表的单位字典172方便地检测查询中的概念。基于先前查询的某些数字(优选为大数字,例如,至少几十万)通过概念发现进程方便地生成单位字典172。概念发现包括分析查询以生成概念网络,以及可由搜索服务器160或另一服务器(未示出)执行。
图3示出了包括查询处理引擎的系统。所示引擎300经由互联网或通过各种网络连接(例如,LAN、WAN、直接链接、分布介质(例如,CD、DVD、软盘)等)接收来自各种源的查询日志文件(或实际查询)。由查询引擎300使用诸如可用在信息理论中的统计方法或诸如交互信息的概念处理该查询日志文件(查询日志)。在优选的方面,尽管可以根据需要使用不同时间期间(例如,小时、星期等)的日志,但也可使用每日查询日志。典型地,查询日志包括由用户提交的实际查询,以及在某些情况下,包括诸如查询用户的地理位置、时戳、客户系统的IP地址、小段信息(cookie)、客户端的类型(例如,浏览器类型)等的附加可用信息。查询处理引擎300处理各种查询日志并根据其生成单位。单位和诸如发生频率的关联统计被存储到存储器或数据库文件310。
在Kapur II中描述了包括用于处理查询和查询日志以生成单位以及用于根据单位生成建议的方法的查询处理引擎多个方面的实例。服务器160处理从系统180接收的单位和任何统计,并向用户返回对应于用户查询的结果以及建议和其它信息。在某些方面,建议是涉及连续对话中的用户和搜索系统的方法。建议是关于用户接下来期望基于对在单位及其扩展和关联中获得的用户需要的高难度理解进行研究的线索和提示。
在一方面,单位字典310有利地用于生成除实际搜索结果之外和代替实际搜索结果呈现给用户的建议。例如,搜索服务器160或者其它搜索智能装置可向专用服务器(例如,图4的服务器180)发送查询,来控制单位字典,或者单位字典的实例可被存储到搜索服务器160。可在Kapur II中找到根据一个实施例用于生成建议的方法实例,例如,使用上面用于生成单位的伪码中定义的扩展和关联。
在优选方面,被配置为在预订公司的服务器(例如,服务器150)上运行的进程被提供给预订公司(例如,在计算机可读介质上或通过网络连接传输的代码),用于与服务器160通信。优选地,这种进程总是在后台运行,响应于来自服务器160的用于识别页面的查询和/或由索引或作为各个查询的结果参考的产物来提供期望信息。还可以执行手动信息更新,其中,公司的运营者在特定时间或根据来自服务器160的请求提供期望的信息。
单元和簇
图5是单位发生器的简化方框图。如图所示,单位语法分析器500接受查询串(或包括查询串和从属于查询的其它数据或元数据的查询记录)作为输入,查阅概念网络502并输出一个或多个表示引导查询串的概念的单位。在Kapur II中描述了单位发生器操作的其它细节。单位可用于形成搜索,生成相关搜索的建议,记录日志,以及各种其它目的。
单位的一个用途在于用于将用户的查询分簇以定义查询所使用的项的组。作为实例,如果单位具有“相似的”相关词,则可以将其分簇。例如,词语“lyrics”、“mp3”、“guitar tabs”、“discography”等可能同时出现在具有特定吉他弹奏者名字的大量查询中。当查询任一其它歌手时,用户将使用相似的词。这使得搜索系统基于具有高精确度的相关词形成了簇。
可以几种方式定义相似性。在一种方法中,两个单位之间的相似性以具有单位的词的重叠程度为基础。可依次使用多种算法来测量重叠程度。
例如,可通过考虑下列因素的一个或多个来测量两个单位之间的重叠(两个单位中的每个都具有与其相关并根据查询集合确定的词):
a)在两个单位中都能找到的相关词的数量;
b)相关词发生的频率以及相关词的数量;
c)相关词的数量,其中,根据与单位相关的建议列表中的相关词的等级(通过频率分类)的不同来减少一些匹配;
d)相关词的数量,其中,根据相关词的相对频率的不同来减少一些匹配;
e)通过比较相关词与任一单位一起发生的次数与这些词与其它单位一起发生的总次数来测量的相关词的相关性。
在一些经验实验中,因素a)和e)产生好的结果。进一步的簇处理可包括基于上下文的分簇。例如,得到具有表1所示值的单位“sony”的簇。
表1
基本单位     相似性     相似性的可信度
sony     Panasonic     45.49
 ToshibaSharpPhilipsJVCSamsungPioneerCompaqDellLGMobileRCAReviewsMitsubishiWirelessHPtvHitachi     30.6130.4029.7529.3528.4626.2624.0423.1522.1121.7521.7221.6820.2520.1820.1520.1220.05
 pcDigital     20.0219.32
查询中的“sony”经常涉及多种电子产品类型的一种,所以如果查询实际上涉及计算机/台式机/笔记本电脑,则系统可使用一些其它公司的上下文中提及的“sony”来提炼/记录结果。例如,在“compaq”的上下文中,表1的结果变为表2的结果。
表2
基本单位  相似性     相似性的可信度
Sony,compaq  DellToshibaHPIBMPanasonicSharpSamsunglaptopCanon     17.8617.8415.6013.7213.6812.8212.8111.9111.78
  NECGatewaycomputertvMacmobile phoneMitsubishiMotorolaASUSLGmobile     11.7310.8410.8210.6810.559.979.929.769.759.729.69
对于这种基于上下文的簇,一种方法是使用给定单位的相关词语的交集并构建针对上面列出的因素a-e中的一个或多个给出的伪单位。在Kapur III中示出了分簇的进一步实例和描述。
使用单位簇的关键词分类
可人工进行关键词分类。通过这种方法,通过人为编辑将用户查询手工分类或归类为类别树。编辑器需要具有完整的查询知识以进行适当地分类。人工分类不总是一致的并且可以是非常主观的。为了避免这些问题,搜索支持系统可帮助编辑器容易且一致地选择正确类别。搜索支持系统还可以请求自动分类以非手工分类地处理查询。
在这里描述的一种方法中,当系统接收不是已经在分类查询组中的查询时,将未分类的查询分成单位。如果分类了这些单位,则这些种类可用于对未分类的查询进行归类。
当未分类的查询是单位本身且不能再分时,可将诸如这里所描述的分簇进程用于查找相似单位及其类别。例如,如果给出的未分类词是没有归类的电视的品牌,但分簇将类似于其它电视品牌来识别它,则该单位可被归类。这种归类可以是通过可作为一种因素的唯一相似性测量进行的K近邻算法分类。
这种方法还可以帮助分类错拼和变体,这是因为所有这些变体的相关词将是相似的,因此,它们将落入与正确拼写相同的簇中。
自动查询分类器
图6是可以使用通过单位发生器确定的单位来确定在与查询关联的分类系统中一个或多个节点的自动查询分类器的实施例的方框图。如图所示,分类器600接收查询,也可以是查询记录作为输入,并查阅一组查询节点对。在一些情况下,分类器600查阅人工生成的或从一些其它源提供给搜索系统的初始组602。例如,初始组602可包括几百个搜索查询和与搜索查询相关的分类节点(表示类别)。因此,如果用户提交了与初始组中的一个相匹配的查询,则该查询可以直接方式分类到为对列出的节点。然而,对于与初始组中的一个不匹配的查询,其可能是可能有数百万不同查询的系统中的大部分查询,需要另一种方法。
习得组604包括查询节点配对的记录,可能还包括关于该对的元数据(例如,权重),其中,通过初始组得到习得组604,然后随着查询被提交给搜索系统来进行调整并由外部事件(例如,后查询点击行为)表示类别。如图所示,在一个实施例中,后查询分析器610接收查询(或查询记录)与查询相关的后查询行为(例如,用户从对该查询呈现的搜索结果中选择的一个或多个页面的指示),以及由分类器600确定的查询类别的估计,作为输入。从这些输入中,后查询分析器610计算对习得组604的更新。
在一些实施例中,后查询分析器610用作神经网络的反馈回路。以这种方式,改进习得组使得分类器600可改进应与查询相关的一个或多个类别的估计。在其它实施例中,后查询分析器610使用其它学习系统来改进类别的估计。
一旦已知了对分类系统中的一个或多个节点的查询分类,该信息就可被用于改变查询进程。
使用分类查询的搜索引擎
图7是包括根据查询记录和查询类别的表示进行搜索的搜索引擎的信息检索和通信系统的方框图。如图所示,搜索引擎700接收查询(或查询记录)和与查询相关的类别(可能是估计的)作为其输入,从而搜索引擎700输出搜索结果。
查询(或查询记录)和类别也被输入至建议引擎702,其根据查询的一个或多个类别生成诸如将使用的相关搜索查询的建议。例如,如果查询是“find New York hotels”,则关联类别可能是“Location/USA/New York State/New York City”以及“travel/accommodation/hotels”。根据这些类别,建议引擎可以建议相关搜索,例如“New York lodgings”、“New York travel”、“weatherin New York”,这是由于它们是作为与关于原始搜索查询的相同或邻近节点的节点相关联的搜索。
图8是包括查询导向器的信息检索和通信系统的方框图,该查询导向器根据查询的类别将查询引导到一个或多个搜索引擎使得以另一种方式改变搜索进程。如图所示,查询记录被提供给多路分配器800,其基于输入到多路分配器800的类别将查询记录引导到一个或多个可能的搜索引擎802。例如,如果查询的类别是“health/drug information”,则查询可被引导到药物搜索引擎。尽管只示出了两个搜索引擎,但从本文的公开中应当清楚,可以包括多于两个的搜索引擎。在查询被提供给多于一个搜索引擎的情况下,混频器804可将来自每个搜索引擎的结果进行组合以形成整体结果。在一些情况下,混频器804可在配置结果中考虑每个搜索引擎的权重。
图9是包括又一变体的信息检索和通信系统的方框图,其中,预处理器根据在查询记录中参考的查询的分类更改查询记录以形成更改的查询记录,并将更改的查询记录提供给搜索引擎。具体地,预处理器900具有记录在由查询记录表示的查询的估计类别中的查询记录,作为其输入。预处理器900输出更改的查询记录,然后将其提供给搜索引擎902并从该搜索引擎获得结果。优选地,通过添加、更改、或删除查询串中的词语或者通过包括元数据以引导搜索引擎902的操作来使对查询进行的修改包含类别的信息内容。
图10是自动分类系统的用户界面1000的一个实施例的示图。使用该用户界面,可在表格域1002中输入一个关键字或一组关键字(可被用作查询),然后自动分类系统返回示出一个或多个关键字的原始类别、新的可能类别、和每个新的可能类别的可信值的表1004。
图11是用于输入搜索和提供结果的用户界面1100的一个实施例的示图。在该实例中,搜索是“quotes”,搜索引擎提供用于搜索类别的指示以及相关搜索,其中,可使用关于输入搜索的分类信息得到相关搜索的列表。除类别列表和相关搜索列表之外,结果还包括还可以使用分类信息驱动的搜索结果。
进一步的实例
在自动分类系统的一个实例中可以使用来自用于另一目的的另一系统的人工分类,作为其“种子集”。例如,几百万个查询的查询日志经常具有较少相关的非常普通查询和不常用查询的长队。如果测试的是发生频率,则相同地发生超过次数阈值的(例如,100次/天,200次/天等)查询可保证人工分类来提供种子集。这种“最多搜索”词的方法很容易进行分类,并且词语的长队(更少点击)自动进行分类。通过自动进行搜索词分类,相当多的词语可被分类,提供了更好的搜索和用于其它目的有用数据集。
关键字分类可用于各种研究和分析程序,所以分类的精确性非常重要。由于依赖于种子集的自动分类进程可以很好的工作但坏的输入仍然可造成失效,所以用于生成种子集的人工分类的质量也很重要。
如果除了在多词查询中存在多个词的组合之外没有其它原因,则可期望由单个词组成的查询比由多个词的组成的查询更经常地出现。尽管存在一些多词、单个概念查询(例如,“rock conert”),但是在许多真实世界系统中的大多数查询由多于一个的概念组成。例如“hotels in New York”具有两个概念:“hotels”(或“hotels in”)以及“New York”(注意,尽管出现了“new”或“York”,但查询与这些词无关)。因为多概念组合比单个词更多,所以可以期望任一给定单个词查询比任一给定多概念查询更经常发生。因此,如果对最频繁的查询进行人工分类,则未分类查询的总数以及唯一未分类查询的数目有可能支持多概念查询。例如,作为查询“sports”可比“hotels in New York”、“hotels in Boston”等更多地出现在搜索系统中。结果,如果提供了稳定的数据集,则自动分类系统应该正确地处理对多概念查询的分类。
分类的一种方法在于确定最长的概念(根据所使用词的数量),或者在作为完全查询的“主要”概念的约束和标签情况下的最长中的一个。在上面的实例中,“hotels”可能是主要概念。然后,将主要概念用于对完全查询进行分类。在一个实施例中,完全查询的分类被设置成主要概念的类别。
诸如最多搜索概念和一些其它规则的各种试探法可被用于确定最主要的概念。当然,可以不同的方式来进行其概念未被分类的全新查询,但上述方法可自动捕获所有查询的一大部分。
在即使需要更好的分类速度的情况下,也可以将大量方法添加到基础自动分类。例如,一组规则可应用于种子集。
作为规则的实例,基于查询中的主要词语(在这种情况下为“hotels”),查询“hotels in London”可被自动分类到“travel&transportation/hotels and lodging”下。调整规则可以是“如果一个概念属于‘travel&transportation/hotels and lodging’且另一个概念属于国际世界类别,则获取查询的两个部分的类别”。在应用该规则后,查询“hotels in London”应当已分类到例如“travel&transportation/hotels&lodging”、“International World/International Europe/International UKIE/London、Travel&transportation/Non US”下。在这种情况下,将会在考虑到所有概念的情况下完成分类。
现在将描述一组实例规则。除这些“附加”规则之外,也可以使用“删除规则”,以帮助删除不合党的类别分配。这些规则中的几个根据由规则使用的类别对的列表进行操作。
1.合并规则:
使用合并规则,考虑关系表。如果在给定查询中的主要词语/词组属于相关对中的两个类别中的一个,而查询中的其它词属于相关对的另一类别,那么当对查询进行分类时,两个类别都包括在内。相关对的实例为:
(Entertainment/Music,Internet/MP3)
(Holidays and Observances,Online Greetings)
对于实例查询“valentines day e card”可具有“e card”作为其主要概念,所以主要查询分类可以将查询置于类别“OnlineGreetings”中。然而,根据合并规则,也可以包括类别“Holidays andObservances/Valentine’s day”(注意,可使用概念网络来处理拼写错误)。通过这两个类别,完成对查询的自动分类。
2.类别结合规则
如果主要词语或词组属于类别结合对的第一类别,则在对查询进行自动分类时包括类别结合对的第二类别。当种子集中的人工分类不包括主要词语或词组包括第二类别的查询实例时,这个规则比较有用。类别结合对的实例为:
(Luxury Goods/Apparel/Mens,Apparel/Mens)
(Luxury Goods/Apparel/Womens,Apparel/Wowens)
例如,假设查询为“BrandX.com”,“BrandX”在类别“OnlineCommunity/Email”中是人工分类的,这是因为在进行人工分类时不存在类别“Services/Email/BrandX”。根据类别结合规则,完成对“BrandX.com”的分类。
3.主要类别
如果查询包括属于截然不同类别的两个词语或词组,则两个类别都出现在主要类别对中,此外第二类别对是主要类别,当对查询进行自动分类时,使第一类别对代替第二类别成为主要类别并排除第二类别。主要类别对的实例为:
(Toys/Games,Travel and Transportation/Maps)
(Online community/Games,Travel and Transportation/Maps)
(Sports,Education/College and University)
在该实例中,查询“college football”通常可被分解为作为主要概念的“college”,从而分配给类别“Education/College andUniversity”。而概念“football”可被分类到“Sports”下,“football”不是主要概念。然而,根据添加的主要类别规则,由于存在主要类别对(Sports,Education/College and University),所以将查询分类为与“Sports”相关的查询。在可能存在两个概念并且一个为主要概念的情况下主要类别规则是有用的,但对于落入类别的特定概念对的某些对,应为主要类别的类别是与非主要概念相关的类别。
4.替换词规则
存在用于特定目的的某些分类。替换词规则还对对表进行操作。如果主要概念属于与第一类别对相同的特别类别,则以对中第二项的词语替换与主要概念相对应的词。
5.替换单个类别规则
替换单个类别规则可根据对表进行操作,来替换类别。如果主要概念属于与第一类别对相同的特定类别,则用对中的第二类别替换第一类别。例如,对于查询“tennessee rivals online”,概念“tennesseerivals”将具有“Custom Fusion/College football”的类别,然后在对新查新进行自动分类时用“Sports/Football”类别代替该类别。这里提供了使用该规则的对表中条目的实例:
(Custom Fusion/College Football,Sports/Football)
(Custom/Bob Dylan,Entertainment/Music/Rock)
(Custom Fusion/Buzz/Personals,Sex and Romance/Personal)
6.精炼规则
根据精炼规则,如果在自动分类第一阶段之后,查询具有两个类别,这两个类别为在精炼规则表中列出的三个中的一个的前两个类别,用三个中的第三类别代替第二类别。例如,考虑精炼规则表条目:
(Entertainment/Movies,Entertainment/Music,
Entertainment/Music/Shows and Movies)
对于查询“film music”,概念“film”被分类到“Entertainment/Movies”中,以及概念“music”被分类到“Entertainment/Music”中。应用精炼规则,在精炼规则表条目(上面所示)中发现前两个类别成对,所以类别“Entertainment/Music”(三个中的第二项)被“Entertainment/Music/Shows and Movies”替换,使得在应用该规则后,查询“film music”被分类到“Entertainment/Movies”以及“Entertainment/Music/Shows and Movies”中。
可根据需要将更多的规则添加到这些规则文件中,用于改变结果。在使用多于一种分类系统的情况下,对于使用的所有分类系统规则和规则表是整体的,或者可对不同的分类系统提出单独的规则和规则表。在一些实施例中,例如通过处理查询日志中的查询以改进分类进程或精确性,半自动地生成规则和/或规则表。
主要概念
多种方法都可被用于在从查询中排除的多个概念中识别出主要概念。概念可以是单位,或者在某些情况下,可以是单位的集合,其中,集合的类别是已知的,但各个单位的类别是未知的。例如,考虑查询“luxurious furniture in miami”。假设单位“furniture”的类别是已知的,以及单位“miami”的类别也是已知的。进一步假设“luxurious furniture”是单位,但其类别是未知的。在这种情况下,单位“luxurious furniture”可被认为不是已知概念,并且通过作为概念的其它词语继续分类。如果种子集被用于对单位进行分类,单位到类别的映射可用作分类器的种子集。
用于自动确定主要单位的一些规则可包括去除停止词(stopword),考虑单位频率和查询频率,考虑模糊度、以及应用用于确定主要概念的基于类别的规则。
停止词可在确定主要概念之前从查询中移除,因为它们通常不应当作为查询中的主要概念。
单位频率是发生在查询中的单位的频率,作为独立单位或与其它单位结合。给定单位的查询频率是作为查询唯一单位发生的给定单位的频率。通过估计这些比率,可揭示主要概念。
直观地,如果一个词语太经常地与其它词一起使用,则其可能不是独立概念并且一般需要精炼以使它的意义更清楚。这样的实例是查询“cheap furniture”。词“cheap”和“furniture”可以是两个概念,但查询频率与“cheap”单位频率的比率比较低,这是因为它并不是很经常自己出现在查询中。相比于“furniture”的查询/单位频率,其可期望其高于“cheap”的比率,“furniture”会被认为是主要概念。
如果查询/单位比率不可用(例如,在单位和概念不同义的情况下),则系统只比较两个或多个单位的查询频率,并将较多频率概念(不是单位)配置为主要概念状态。
还可以考虑模糊度。可由种子集确定概念的模糊。例如,考虑200,000关键字和分类的查询的种子集。可处理该查询以识别其中的单位。对于每个单位,系统可检查有多少不同的分配有单位的分类。然后,模糊可作为不同类别数量的测量值,这是由于更多的模糊单位将出现在种子集的更多类别中。例如,如果“jaguar cars”和“jaguar animal”是种子集中的两个分类查询,它们的类别将是不同的:分别是“Automobiles”和“Animals”。如果在这两个查询中的单位是“jaguar”、“car”和“animal”,则“jaguar”将出现在两个不同的类别中,并与“car”和“animal”(每个都具有一个类别)相比将被更模糊地考虑。更模糊的单位将是比较不重要的。
还可使用基于规则的类别。例如,在来自特定类别的概念被认为是不重要,除非没有其它分类概念的情况下,可使用规则。例如,位置被典型地用于缩小搜索,例如两个查询“furniture in miami”和“attractions in miami”,其中,“miami”被用作主要限制词,并且整个查询的真实分类将取决于查询中的其它概念(“attractions”和“furniture”)。因此,可使用规则使得作为位置分类的概念或其它主要限制概念不被用作主要概念,除非它们是唯一的概念。
精炼
在查询的单位没有被分类的情况下,与上文描述的模糊度相似的策略可被用于对未知单位/查询进行动态地分类。例如,如果单位A没有被独立分类,而是大多数情况发生在属于类别C的分类查询中,那么A可被分配到类别C中。在一些变化中,可以考虑到可信度因素取决于在特定类别中出现的单位次数。
在一些变化中,可代替人工,自动地生成整个种子集或部分种子集。下面描述了两个实例,但应该理解可使用自动生成种子集的其它方法。
在第一实例中,经由大量入口点检测查询日志。如果入口由多个属性组成并且与每个属性相关的页面都具有搜索界面,则入口可具有多个条目点。例如但不限于下列方式,Yahoo!入口提供了对多个属性的访问,例如,Yahoo!Maps,Yahoo!Sports,Yahoo!Travel,Yahoo!Shopping等。这些属性中的每一个都可具有搜索能力,例如可由属性页面上的搜索框提供。
在生成种子集的过程中,收集一些时间周期或其它分组的查询,并记录输入查询的条目点。例如,如果在Yahoo!Travel页面上的搜索框中输入“New York”作为查询,则其将被记录为关于“NewYork”的搜索将与旅行相关,以及当在Yahoo!Sports页面上的搜索框中输入“New York”时,该搜索将与运动相关。一些属性可具有多个页面,在这些页面中可输入搜索并且每个条目点可被单独处理,属性的所有条目点可被不确定地组合在一起,或者在两者之间改变。在任何情况下,对于所有(或者至少差不多所有)条目点,类别是已知的。例如,如果条目点在显示用户所选股票和它们的当前报价的页面上,则可以清楚地确定条目点的类别。在任何情况下,在还不知道条目点的类别的情况下,其可被人工分配,这是因为可期望适当大小的入口以具有不多于几百个条目点,这比起对几百万个查询进行手工分类更加易于管理。
使用这里描述的技术或相关专利申请或者其它技术为多种条目点生成概念网络。可通过单位分析遍及所有条目点生成的具有概念网络的单位联合。如果第i个单位由u[i]表示,并且条目点由e1、e2、e3...表示,则f(u[i],e[j])是在被分析的查询组上的条目点e[j]处的u[i]的频率。例如,可分析一天的查询价值,或者可分析从某时刻开始的前两千万个查询。使Q(e[j])成为与第j个条目点相关的分析查询组中的查询总数。
对于单位和条目点的每个组合,可如等式1所示地计算标准化权重。可对应于被分析的查询组中查询的数量调整权重的数值范围和精度(例如,与1,000,000或其它比例因子相乘),以使其更易于操作、查看、和数字的存储。
w(u[i],e[j]])=f(u[i],e[j]])*(Q(e[j]])/1000000)     (等式1)
在从不会通过在查询组中的给定条目点处找到单位的情况下,可将其权重设为0。使用每个条目点中给定单位的权重,可以单位权重的降序排列条目点。包括所有条目点的单位联合以及它们的计算权重的这种有序集合可用作种子集。
在另一种方法中,查询记录有或未记录有条目点信息,但日志包括用户采取的下个动作的指示。如果确定了可能进行的下个动作并且它们的类别是已知的或是可自动确定的,那么它们可被用作种子集。例如,如果入口示出了目录匹配和搜索结果,则单击目录匹配中的一个的用户动作可导致目录条目与查询相关。
例如,假设用户输入搜索查询Q并得到一组搜索结果,并显示目录类别匹配。由类别空间标识符c1、c2、c3等来识别每个目录类别。可通过网站空间标识符ss1、ss2、ss3等识别目录中显示的网站。当用户点击类别空间标识符或网站空间标识符时,动作被记录。这些“点击日志”随后可用于将查询映射到目录类别。这两组标识符都不必是非空的。例如,可以不使用网站空间标识符或可以不使用类别空间标识符。
对于查询Q,如果通过点击类别空间标识符cs1并且类别空间标识符是已知的来进行的用户查询属于类别c1,则查询Q可被映射到类别c1。也使用查询Q的另一用户可点击网站空间标识符ss2。如果该空间标识符是类别c2的目录的子集(即,其中的文件),则查询Q可被映射到类别c2。每个到类别的查询映射都可具有与其相关的权重。查询Q和类别C的权重可与用户的数目成比例,该用户在查询Q之后点击与类别C相关的类别空间标识符或者与类别C相关的子条目中的一个。以这种方式,可通过由权重表示的可信度对查询Q进行自动分类。该映射组可被用作种子集。
可在分类的可信度测量值依赖于种子集的情况下考虑可信度测量值。如果种子集具有与类别相关的可信度测量值,则可信度可被分配给每个分类查询。对于人工生成的种子集,可信度可高于自动生成的种子集,但不需要成为这种情况。为了改进精确性,系统可决定忽略具有低可信度等级的一些自动分类查询。
虽然已经参照特定实施例描述了本发明,但本领域的技术人员应当了解,可以进行许多修改。在一些实施例中,查询可当它们被接收到时进行处理,使得对于一个或多个概念网络的概念网络基本上实时地被更新。这里描述的自动系统和方法可通过包括单位、关系、分类系统等的合成单位字典的所有和一部分增大或补充。
这里描述的实施例可涉及网站、链接、以及其它特定实例的术语,其中,万维网(或其子集)服务器作为搜索语料库。应该理解,这里描述的系统和进程可适于使用不同搜索语料库(例如电子数据库或文档储存库),并且结果可包括内容以及到可发现该内容的位置的链接或参考。
因此,尽管本发明已参照特定实施例进行了描述,但应理解,发明旨在覆盖随后权利要求范围内的的所有修改和等同。

Claims (11)

1.一种计算机执行方法,用于使用户搜索查询与分类系统的节点相关联,其中,所述分类系统的每个节点均表示可对查询进行分类的类别,所述方法包括:
接收用户搜索查询;
使用使多个单位与其它单位相关的概念网络,生成对应于在所述用户搜索查询中表示的概念的一组一个或多个查询单位;
访问分类系统数据结构,其中,所述分类系统是表示类别的每个节点和对于作为节点特定概念网络的彼此相关的多个节点的等级;
对一组单位节点对测试所述一组一个或多个查询单位,以确定该组单位节点对是否包括与所述一组一个或多个查询单位相匹配的一个或多个记录的单位;
如果所述一组一个或多个查询单位与单位节点对不匹配,则根据所述组单位节点对中的类似单位测试一组一个或多个查询单位;以及
对于至少多个用户搜索查询,当发生用户动作以单独表示所述用户搜索查询的类别时,修改所述组单位节点对以反映所述用户搜索查询的所述类别。
2.包括权利要求1的所述方法,进一步包括为所述组单位节点对读取在存储器中的单位节点对的初始组,其中,所述初始组是人工生成的并且在所述测试步骤之前生成。
3.包括权利要求1的所述方法,其中,表示用户搜索查询的类别的用户动作包括:
响应于所述用户搜索查询显示一组分类搜索结果;记录用户选择的所述分类搜索结果中提示的指示;以及使用单位节点对,使从所述用户搜索查询获得的单位和与所述用户选择的提示相关的类别相关联。
4.根据权利要求3所述的方法,其中,所述分类搜索结果组是从网页的构造主题目录的搜索得到的搜索结果。
5.根据权利要求1所述的方法,进一步包括根据用户搜索查询的分类修改所述用户搜索查询的搜索结果。
6.根据权利要求1所述的方法,进一步包括根据所述用户搜索查询的分类修改搜索的文档语料库。
7.根据权利要求1所述的方法,进一步包括根据所述用户搜索查询的分类注释所述用户搜索查询。
8.根据权利要求1所述的方法,进一步包括根据所述用户搜索查询的分类生成相关搜索项的列表。
9.根据权利要求1所述的方法,包括使用簇来构成单位节点对,其中,作为给定簇的成员的单位更可能与节点配对,由于单位的分簇而使其它簇成员单位与所述节点相关联。
10.根据权利要求1所述的方法,包括以顶点对顶点为基础,使用单位频率构成单位节点对。
11.一种承载指令的计算机可读介质,当所述指令执行时,使一个或多个处理器执行在权利要求1至10中的任一项所列举的方法。
CN200580047355.5A 2004-12-06 2005-11-29 查询自动分类的搜索处理 Active CN101111837B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/006,466 US7620628B2 (en) 2004-12-06 2004-12-06 Search processing with automatic categorization of queries
US11/006,466 2004-12-06
PCT/US2005/043196 WO2006062772A1 (en) 2004-12-06 2005-11-29 Search processing with automatic categorization of queries

Publications (2)

Publication Number Publication Date
CN101111837A true CN101111837A (zh) 2008-01-23
CN101111837B CN101111837B (zh) 2014-01-15

Family

ID=36575589

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200580047355.5A Active CN101111837B (zh) 2004-12-06 2005-11-29 查询自动分类的搜索处理

Country Status (7)

Country Link
US (1) US7620628B2 (zh)
EP (1) EP1828937A1 (zh)
JP (1) JP4994243B2 (zh)
KR (1) KR101211800B1 (zh)
CN (1) CN101111837B (zh)
HK (1) HK1117243A1 (zh)
WO (1) WO2006062772A1 (zh)

Cited By (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102063468A (zh) * 2010-12-03 2011-05-18 百度在线网络技术(北京)有限公司 一种用于确定查询序列的查询类别的设备及其方法
CN102142017A (zh) * 2010-01-28 2011-08-03 微软公司 提供查询建议
CN103235786A (zh) * 2013-03-28 2013-08-07 北京百度网讯科技有限公司 一种用于提供长尾搜索结果的方法与设备
CN103518199A (zh) * 2011-03-07 2014-01-15 Azzimov公司 用于精炼移动设备上语义搜索的方法和系统
CN103559326A (zh) * 2013-11-25 2014-02-05 方正国际软件有限公司 患者信息提示方法和患者信息提示系统
CN104750822A (zh) * 2015-03-31 2015-07-01 北京奇虎科技有限公司 提供搜索建议的方法和装置
CN107533563A (zh) * 2015-05-29 2018-01-02 英特尔公司 用于动态自动化内容发现的技术
CN107943943A (zh) * 2017-11-23 2018-04-20 北京小度信息科技有限公司 用户相似度的确定方法、装置、电子设备及存储介质
WO2019180515A1 (en) * 2018-03-23 2019-09-26 International Business Machines Corporation Query recognition resiliency determination in virtual agent systems

Families Citing this family (252)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7472113B1 (en) * 2004-01-26 2008-12-30 Microsoft Corporation Query preprocessing and pipelining
US8082264B2 (en) * 2004-04-07 2011-12-20 Inquira, Inc. Automated scheme for identifying user intent in real-time
US7747601B2 (en) * 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8612208B2 (en) 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US7523099B1 (en) 2004-12-30 2009-04-21 Google Inc. Category suggestions relating to a search
US7574436B2 (en) 2005-03-10 2009-08-11 Yahoo! Inc. Reranking and increasing the relevance of the results of Internet searches
US8812473B1 (en) 2005-06-16 2014-08-19 Gere Dev. Applications, LLC Analysis and reporting of collected search activity data over multiple search engines
US20060294071A1 (en) * 2005-06-28 2006-12-28 Microsoft Corporation Facet extraction and user feedback for ranking improvement and personalization
US9009046B1 (en) * 2005-09-27 2015-04-14 At&T Intellectual Property Ii, L.P. System and method for disambiguating multiple intents in a natural language dialog system
KR100809415B1 (ko) * 2005-12-08 2008-03-05 한국전자통신연구원 온톨로지를 활용한 정보질의 확장 시스템 및 그 방법
US7680775B2 (en) * 2005-12-13 2010-03-16 Iac Search & Media, Inc. Methods and systems for generating query and result-based relevance indexes
US20080016441A1 (en) * 2006-01-06 2008-01-17 Tabin Joshua Z Method and Apparatus to Facilitate Altering a Presentation Order for Search Results
US7849047B2 (en) 2006-02-09 2010-12-07 Ebay Inc. Method and system to analyze domain rules based on domain coverage of the domain rules
US7640234B2 (en) * 2006-02-09 2009-12-29 Ebay Inc. Methods and systems to communicate information
US7739226B2 (en) * 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of the aspect rules
US8380698B2 (en) * 2006-02-09 2013-02-19 Ebay Inc. Methods and systems to generate rules to identify data items
US7725417B2 (en) * 2006-02-09 2010-05-25 Ebay Inc. Method and system to analyze rules based on popular query coverage
US9443333B2 (en) * 2006-02-09 2016-09-13 Ebay Inc. Methods and systems to communicate information
US7739225B2 (en) 2006-02-09 2010-06-15 Ebay Inc. Method and system to analyze aspect rules based on domain coverage of an aspect-value pair
US8386469B2 (en) * 2006-02-16 2013-02-26 Mobile Content Networks, Inc. Method and system for determining relevant sources, querying and merging results from multiple content sources
US7689554B2 (en) * 2006-02-28 2010-03-30 Yahoo! Inc. System and method for identifying related queries for languages with multiple writing systems
US7747083B2 (en) * 2006-03-27 2010-06-29 Yahoo! Inc. System and method for good nearest neighbor clustering of text
US8438170B2 (en) * 2006-03-29 2013-05-07 Yahoo! Inc. Behavioral targeting system that generates user profiles for target objectives
US7921099B2 (en) * 2006-05-10 2011-04-05 Inquira, Inc. Guided navigation system
US7792967B2 (en) 2006-07-14 2010-09-07 Chacha Search, Inc. Method and system for sharing and accessing resources
EP2084619A4 (en) * 2006-08-14 2014-07-23 Oracle Otc Subsidiary Llc METHOD AND DEVICE FOR DETERMINING AND CLASSIFYING A QUESTIONNAIRE
US8781813B2 (en) * 2006-08-14 2014-07-15 Oracle Otc Subsidiary Llc Intent management tool for identifying concepts associated with a plurality of users' queries
US8095476B2 (en) * 2006-11-27 2012-01-10 Inquira, Inc. Automated support scheme for electronic forms
US8671114B2 (en) * 2006-11-30 2014-03-11 Red Hat, Inc. Search results weighted by real-time sharing activity
US7822734B2 (en) * 2006-12-12 2010-10-26 Yahoo! Inc. Selecting and presenting user search results based on an environment taxonomy
ITMI20062436A1 (it) * 2006-12-19 2008-06-20 Revamping S R L Metodo di classificazione di pagine web e di organizzazione dei corrispondenti contenuti
US20080189163A1 (en) * 2007-02-05 2008-08-07 Inquira, Inc. Information management system
US20080189265A1 (en) * 2007-02-06 2008-08-07 Microsoft Corporation Techniques to manage vocabulary terms for a taxonomy system
US8930331B2 (en) 2007-02-21 2015-01-06 Palantir Technologies Providing unique views of data based on changes or rules
US9912766B2 (en) 2007-03-23 2018-03-06 Yahoo Holdings, Inc. System and method for identifying a link and generating a link identifier for the link on a webpage
US7672937B2 (en) * 2007-04-11 2010-03-02 Yahoo, Inc. Temporal targeting of advertisements
US7809714B1 (en) 2007-04-30 2010-10-05 Lawrence Richard Smith Process for enhancing queries for information retrieval
US8909528B2 (en) * 2007-05-09 2014-12-09 Nuance Communications, Inc. Method and system for prompt construction for selection from a list of acoustically confusable items in spoken dialog systems
US8051056B2 (en) * 2007-05-29 2011-11-01 Microsoft Corporation Acquiring ontological knowledge from query logs
US20080301815A1 (en) * 2007-05-31 2008-12-04 Microsoft Corporation Detecting Unauthorized Changes to Printed Documents
US20080313142A1 (en) * 2007-06-14 2008-12-18 Microsoft Corporation Categorization of queries
US9183305B2 (en) * 2007-06-19 2015-11-10 Red Hat, Inc. Delegated search of content in accounts linked to social overlay system
US20090006311A1 (en) * 2007-06-28 2009-01-01 Yahoo! Inc. Automated system to improve search engine optimization on web pages
US8694511B1 (en) * 2007-08-20 2014-04-08 Google Inc. Modifying search result ranking based on populations
US20090094223A1 (en) * 2007-10-05 2009-04-09 Matthew Berk System and method for classifying search queries
US20090100015A1 (en) * 2007-10-11 2009-04-16 Alon Golan Web-based workspace for enhancing internet search experience
US8380731B2 (en) * 2007-12-13 2013-02-19 The Boeing Company Methods and apparatus using sets of semantically similar words for text classification
US20090171929A1 (en) * 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US8311996B2 (en) * 2008-01-18 2012-11-13 Microsoft Corporation Generating content to satisfy underserved search queries
US8577894B2 (en) 2008-01-25 2013-11-05 Chacha Search, Inc Method and system for access to restricted resources
US9122743B2 (en) * 2008-01-30 2015-09-01 International Business Machines Corporation Enhanced search query modification
US8312095B2 (en) * 2008-01-30 2012-11-13 International Business Machines Corporation Tracking interactive text-message communications
US8244752B2 (en) * 2008-04-21 2012-08-14 Microsoft Corporation Classifying search query traffic
WO2009151640A1 (en) * 2008-06-13 2009-12-17 Ebay Inc. Method and system for clustering
US20090327268A1 (en) * 2008-06-27 2009-12-31 Microsoft Corporation Providing targeted information for entertainment-oriented searches
JP4981765B2 (ja) * 2008-08-05 2012-07-25 ヤフー株式会社 クリック履歴を用いたWeb検索における検索処理をパーソナライズする検索処理システム、端末装置及び検索処理方法
US8010537B2 (en) * 2008-08-27 2011-08-30 Yahoo! Inc. System and method for assisting search requests with vertical suggestions
US9348499B2 (en) 2008-09-15 2016-05-24 Palantir Technologies, Inc. Sharing objects that rely on local resources with outside servers
US8843829B2 (en) * 2008-11-25 2014-09-23 Samsung Electronics Co., Ltd. Method and system for web browsing
US8346738B2 (en) * 2008-12-30 2013-01-01 International Business Machines Corporation Verification of data categorization
US20100257171A1 (en) * 2009-04-03 2010-10-07 Yahoo! Inc. Techniques for categorizing search queries
CN101876981B (zh) * 2009-04-29 2015-09-23 阿里巴巴集团控股有限公司 一种构建知识库的方法及装置
US9443209B2 (en) * 2009-04-30 2016-09-13 Paypal, Inc. Recommendations based on branding
US8719249B2 (en) * 2009-05-12 2014-05-06 Microsoft Corporation Query classification
US8478779B2 (en) * 2009-05-19 2013-07-02 Microsoft Corporation Disambiguating a search query based on a difference between composite domain-confidence factors
US8606786B2 (en) * 2009-06-22 2013-12-10 Microsoft Corporation Determining a similarity measure between queries
US20100332493A1 (en) * 2009-06-25 2010-12-30 Yahoo! Inc. Semantic search extensions for web search engines
US9104695B1 (en) 2009-07-27 2015-08-11 Palantir Technologies, Inc. Geotagging structured data
CN102033877A (zh) * 2009-09-27 2011-04-27 阿里巴巴集团控股有限公司 检索方法和装置
US9405841B2 (en) * 2009-10-15 2016-08-02 A9.Com, Inc. Dynamic search suggestion and category specific completion
KR101594577B1 (ko) * 2009-11-19 2016-02-16 삼성전자주식회사 클러스터 질의를 이용한 데이터 스트림 처리 장치 및 방법
US20110131247A1 (en) * 2009-11-30 2011-06-02 International Business Machines Corporation Semantic Management Of Enterprise Resourses
WO2011079415A1 (en) * 2009-12-30 2011-07-07 Google Inc. Generating related input suggestions
US9183288B2 (en) * 2010-01-27 2015-11-10 Kinetx, Inc. System and method of structuring data for search using latent semantic analysis techniques
US8903794B2 (en) * 2010-02-05 2014-12-02 Microsoft Corporation Generating and presenting lateral concepts
US8983989B2 (en) * 2010-02-05 2015-03-17 Microsoft Technology Licensing, Llc Contextual queries
US20110231395A1 (en) * 2010-03-19 2011-09-22 Microsoft Corporation Presenting answers
US9946775B2 (en) 2010-03-24 2018-04-17 Taykey Ltd. System and methods thereof for detection of user demographic information
US10600073B2 (en) 2010-03-24 2020-03-24 Innovid Inc. System and method for tracking the performance of advertisements and predicting future behavior of the advertisement
US8965835B2 (en) 2010-03-24 2015-02-24 Taykey Ltd. Method for analyzing sentiment trends based on term taxonomies of user generated content
US9183292B2 (en) 2010-03-24 2015-11-10 Taykey Ltd. System and methods thereof for real-time detection of an hidden connection between phrases
WO2011119410A2 (en) * 2010-03-24 2011-09-29 Taykey, Ltd. A system and methods thereof for mining web based user generated content for creation of term taxonomies
US8782046B2 (en) 2010-03-24 2014-07-15 Taykey Ltd. System and methods for predicting future trends of term taxonomies usage
US9613139B2 (en) 2010-03-24 2017-04-04 Taykey Ltd. System and methods thereof for real-time monitoring of a sentiment trend with respect of a desired phrase
US8370337B2 (en) * 2010-04-19 2013-02-05 Microsoft Corporation Ranking search results using click-based data
US20110270819A1 (en) * 2010-04-30 2011-11-03 Microsoft Corporation Context-aware query classification
US8666980B1 (en) * 2010-05-19 2014-03-04 Amazon Technologies, Inc. Virtual clickstream recommendations
US20110302149A1 (en) * 2010-06-07 2011-12-08 Microsoft Corporation Identifying dominant concepts across multiple sources
US8484201B2 (en) 2010-06-08 2013-07-09 Microsoft Corporation Comparative entity mining
CN102279856B (zh) 2010-06-09 2013-10-02 阿里巴巴集团控股有限公司 一种网站导航实现方法及系统
CN102279851B (zh) 2010-06-12 2017-05-03 阿里巴巴集团控股有限公司 一种智能导航方法、装置和系统
US8612432B2 (en) 2010-06-16 2013-12-17 Microsoft Corporation Determining query intent
US20120030164A1 (en) * 2010-07-27 2012-02-02 Oracle International Corporation Method and system for gathering and usage of live search trends
US20120117102A1 (en) * 2010-11-04 2012-05-10 Microsoft Corporation Query suggestions using replacement substitutions and an advanced query syntax
US8631002B2 (en) * 2010-12-09 2014-01-14 Microsoft Corporation Web-relevance based query classification
JP5426526B2 (ja) * 2010-12-21 2014-02-26 日本電信電話株式会社 確率的情報検索処理装置、確率的情報検索処理方法および確率的情報検索処理プログラム
CN102073707A (zh) * 2010-12-22 2011-05-25 百度在线网络技术(北京)有限公司 用于实时识别短文本类别信息的方法、装置及计算机设备
US8626681B1 (en) * 2011-01-04 2014-01-07 Google Inc. Training a probabilistic spelling checker from structured data
US20120179705A1 (en) * 2011-01-11 2012-07-12 Microsoft Corporation Query reformulation in association with a search box
US8484098B2 (en) 2011-03-03 2013-07-09 Michael Bilotta System for information delivery facilitating partner rating of users and user ratings of partners
CN102799591B (zh) * 2011-05-26 2015-03-04 阿里巴巴集团控股有限公司 一种提供推荐词的方法及装置
US10068022B2 (en) * 2011-06-03 2018-09-04 Google Llc Identifying topical entities
US9547693B1 (en) 2011-06-23 2017-01-17 Palantir Technologies Inc. Periodic database search manager for multiple data sources
US8799240B2 (en) 2011-06-23 2014-08-05 Palantir Technologies, Inc. System and method for investigating large amounts of data
US9092482B2 (en) 2013-03-14 2015-07-28 Palantir Technologies, Inc. Fair scheduling for mixed-query loads
US8965882B1 (en) 2011-07-13 2015-02-24 Google Inc. Click or skip evaluation of synonym rules
US8688688B1 (en) 2011-07-14 2014-04-01 Google Inc. Automatic derivation of synonym entity names
US8732574B2 (en) 2011-08-25 2014-05-20 Palantir Technologies, Inc. System and method for parameterizing documents for automatic workflow generation
US9576573B2 (en) 2011-08-29 2017-02-21 Microsoft Technology Licensing, Llc Using multiple modality input to feedback context for natural language understanding
US8504542B2 (en) 2011-09-02 2013-08-06 Palantir Technologies, Inc. Multi-row transactions
CN103034665B (zh) 2011-10-10 2016-01-06 阿里巴巴集团控股有限公司 信息查询方法和装置
CN103092856B (zh) * 2011-10-31 2015-09-23 阿里巴巴集团控股有限公司 搜索结果排序方法及设备、搜索方法及设备
CN103106220B (zh) * 2011-11-15 2016-08-03 阿里巴巴集团控股有限公司 一种搜索方法、搜索装置及一种搜索引擎系统
US8909627B1 (en) 2011-11-30 2014-12-09 Google Inc. Fake skip evaluation of synonym rules
US9152698B1 (en) 2012-01-03 2015-10-06 Google Inc. Substitute term identification based on over-represented terms identification
US8965875B1 (en) 2012-01-03 2015-02-24 Google Inc. Removing substitution rules based on user interactions
CN103218719B (zh) 2012-01-19 2016-12-07 阿里巴巴集团控股有限公司 一种电子商务网站导航方法及系统
US9141672B1 (en) 2012-01-25 2015-09-22 Google Inc. Click or skip evaluation of query term optionalization rule
AU2013222184B2 (en) * 2012-02-22 2017-09-28 Google Llc Related entities
CN103310343A (zh) 2012-03-15 2013-09-18 阿里巴巴集团控股有限公司 商品信息发布方法和装置
JP5843235B2 (ja) * 2012-05-21 2016-01-13 株式会社プロフィールド Web情報処理装置、web情報処理方法、およびプログラム
US8959103B1 (en) * 2012-05-25 2015-02-17 Google Inc. Click or skip evaluation of reordering rules
US9146966B1 (en) 2012-10-04 2015-09-29 Google Inc. Click or skip evaluation of proximity rules
US9348677B2 (en) 2012-10-22 2016-05-24 Palantir Technologies Inc. System and method for batch evaluation programs
US9152705B2 (en) 2012-10-24 2015-10-06 Wal-Mart Stores, Inc. Automatic taxonomy merge
US9092509B2 (en) 2012-11-19 2015-07-28 Microsoft Technology Licensing, Llc Search query user interface
US9501507B1 (en) 2012-12-27 2016-11-22 Palantir Technologies Inc. Geo-temporal indexing and searching
US9123086B1 (en) 2013-01-31 2015-09-01 Palantir Technologies, Inc. Automatically generating event objects from images
US10037314B2 (en) 2013-03-14 2018-07-31 Palantir Technologies, Inc. Mobile reports
US8909656B2 (en) 2013-03-15 2014-12-09 Palantir Technologies Inc. Filter chains with associated multipath views for exploring large data sets
US10275778B1 (en) 2013-03-15 2019-04-30 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation based on automatic malfeasance clustering of related data in various data structures
US8937619B2 (en) 2013-03-15 2015-01-20 Palantir Technologies Inc. Generating an object time series from data objects
US8788405B1 (en) 2013-03-15 2014-07-22 Palantir Technologies, Inc. Generating data clusters with customizable analysis strategies
US9965937B2 (en) 2013-03-15 2018-05-08 Palantir Technologies Inc. External malware data item clustering and analysis
US8868486B2 (en) 2013-03-15 2014-10-21 Palantir Technologies Inc. Time-sensitive cube
US8917274B2 (en) 2013-03-15 2014-12-23 Palantir Technologies Inc. Event matrix based on integrated data
US9524520B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Training a classification model to predict categories
US9524319B2 (en) 2013-04-30 2016-12-20 Wal-Mart Stores, Inc. Search relevance
US8799799B1 (en) 2013-05-07 2014-08-05 Palantir Technologies Inc. Interactive geospatial map
US9223773B2 (en) 2013-08-08 2015-12-29 Palatir Technologies Inc. Template system for custom document generation
US9335897B2 (en) 2013-08-08 2016-05-10 Palantir Technologies Inc. Long click display of a context menu
US8713467B1 (en) 2013-08-09 2014-04-29 Palantir Technologies, Inc. Context-sensitive views
US9785317B2 (en) 2013-09-24 2017-10-10 Palantir Technologies Inc. Presentation and analysis of user interaction data
US8938686B1 (en) 2013-10-03 2015-01-20 Palantir Technologies Inc. Systems and methods for analyzing performance of an entity
US8812960B1 (en) 2013-10-07 2014-08-19 Palantir Technologies Inc. Cohort-based presentation of user interaction data
US8924872B1 (en) 2013-10-18 2014-12-30 Palantir Technologies Inc. Overview user interface of emergency call data of a law enforcement agency
US9116975B2 (en) 2013-10-18 2015-08-25 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive simultaneous querying of multiple data stores
US9021384B1 (en) 2013-11-04 2015-04-28 Palantir Technologies Inc. Interactive vehicle information map
US8868537B1 (en) 2013-11-11 2014-10-21 Palantir Technologies, Inc. Simple web search
US9996588B2 (en) 2013-12-09 2018-06-12 International Business Machines Corporation Managing a search
US9105000B1 (en) 2013-12-10 2015-08-11 Palantir Technologies Inc. Aggregating data from a plurality of data sources
US9727622B2 (en) 2013-12-16 2017-08-08 Palantir Technologies, Inc. Methods and systems for analyzing entity performance
US9552615B2 (en) 2013-12-20 2017-01-24 Palantir Technologies Inc. Automated database analysis to detect malfeasance
US10356032B2 (en) 2013-12-26 2019-07-16 Palantir Technologies Inc. System and method for detecting confidential information emails
US9043696B1 (en) 2014-01-03 2015-05-26 Palantir Technologies Inc. Systems and methods for visual definition of data associations
US8832832B1 (en) 2014-01-03 2014-09-09 Palantir Technologies Inc. IP reputation
US9483162B2 (en) 2014-02-20 2016-11-01 Palantir Technologies Inc. Relationship visualizations
US9009827B1 (en) 2014-02-20 2015-04-14 Palantir Technologies Inc. Security sharing system
US9727376B1 (en) 2014-03-04 2017-08-08 Palantir Technologies, Inc. Mobile tasks
US8935201B1 (en) 2014-03-18 2015-01-13 Palantir Technologies Inc. Determining and extracting changed data from a data source
US9857958B2 (en) 2014-04-28 2018-01-02 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive access of, investigation of, and analysis of data objects stored in one or more databases
US9009171B1 (en) 2014-05-02 2015-04-14 Palantir Technologies Inc. Systems and methods for active column filtering
US9535974B1 (en) 2014-06-30 2017-01-03 Palantir Technologies Inc. Systems and methods for identifying key phrase clusters within documents
US9129219B1 (en) 2014-06-30 2015-09-08 Palantir Technologies, Inc. Crime risk forecasting
US9619557B2 (en) 2014-06-30 2017-04-11 Palantir Technologies, Inc. Systems and methods for key phrase characterization of documents
US9785773B2 (en) 2014-07-03 2017-10-10 Palantir Technologies Inc. Malware data item analysis
US10572496B1 (en) 2014-07-03 2020-02-25 Palantir Technologies Inc. Distributed workflow system and database with access controls for city resiliency
US9256664B2 (en) 2014-07-03 2016-02-09 Palantir Technologies Inc. System and method for news events detection and visualization
US9202249B1 (en) 2014-07-03 2015-12-01 Palantir Technologies Inc. Data item clustering and analysis
US9021260B1 (en) 2014-07-03 2015-04-28 Palantir Technologies Inc. Malware data item analysis
US9454281B2 (en) 2014-09-03 2016-09-27 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US9767172B2 (en) 2014-10-03 2017-09-19 Palantir Technologies Inc. Data aggregation and analysis system
US9501851B2 (en) 2014-10-03 2016-11-22 Palantir Technologies Inc. Time-series analysis system
US9785328B2 (en) 2014-10-06 2017-10-10 Palantir Technologies Inc. Presentation of multivariate data on a graphical user interface of a computing system
US9984133B2 (en) 2014-10-16 2018-05-29 Palantir Technologies Inc. Schematic and database linking system
US9229952B1 (en) 2014-11-05 2016-01-05 Palantir Technologies, Inc. History preserving data pipeline system and method
US9043894B1 (en) 2014-11-06 2015-05-26 Palantir Technologies Inc. Malicious software detection in a computing system
CN104462918A (zh) * 2014-12-02 2015-03-25 黑龙江大学 基于自适应非均匀量化的人脸生物密钥生成方法
US10346438B2 (en) * 2014-12-09 2019-07-09 International Business Machines Corporation Model navigation constrained by classification
US9367872B1 (en) 2014-12-22 2016-06-14 Palantir Technologies Inc. Systems and user interfaces for dynamic and interactive investigation of bad actor behavior based on automatic clustering of related data in various data structures
US10552994B2 (en) 2014-12-22 2020-02-04 Palantir Technologies Inc. Systems and interactive user interfaces for dynamic retrieval, analysis, and triage of data items
US10362133B1 (en) 2014-12-22 2019-07-23 Palantir Technologies Inc. Communication data processing architecture
US9348920B1 (en) 2014-12-22 2016-05-24 Palantir Technologies Inc. Concept indexing among database of documents using machine learning techniques
US9335911B1 (en) 2014-12-29 2016-05-10 Palantir Technologies Inc. Interactive user interface for dynamic data analysis exploration and query processing
US9817563B1 (en) 2014-12-29 2017-11-14 Palantir Technologies Inc. System and method of generating data points from one or more data stores of data items for chart creation and manipulation
US9870205B1 (en) 2014-12-29 2018-01-16 Palantir Technologies Inc. Storing logical units of program code generated using a dynamic programming notebook user interface
US10372879B2 (en) 2014-12-31 2019-08-06 Palantir Technologies Inc. Medical claims lead summary report generation
US10387834B2 (en) 2015-01-21 2019-08-20 Palantir Technologies Inc. Systems and methods for accessing and storing snapshots of a remote application in a document
US9727560B2 (en) 2015-02-25 2017-08-08 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
EP3070622A1 (en) 2015-03-16 2016-09-21 Palantir Technologies, Inc. Interactive user interfaces for location-based data analysis
US9886467B2 (en) 2015-03-19 2018-02-06 Plantir Technologies Inc. System and method for comparing and visualizing data entities and data entity series
US9460175B1 (en) 2015-06-03 2016-10-04 Palantir Technologies Inc. Server implemented geographic information system with graphical interface
US9454785B1 (en) 2015-07-30 2016-09-27 Palantir Technologies Inc. Systems and user interfaces for holistic, data-driven investigation of bad actor behavior based on clustering and scoring of related data
US9996595B2 (en) 2015-08-03 2018-06-12 Palantir Technologies, Inc. Providing full data provenance visualization for versioned datasets
US9456000B1 (en) 2015-08-06 2016-09-27 Palantir Technologies Inc. Systems, methods, user interfaces, and computer-readable media for investigating potential malicious communications
US9600146B2 (en) 2015-08-17 2017-03-21 Palantir Technologies Inc. Interactive geospatial map
US10489391B1 (en) 2015-08-17 2019-11-26 Palantir Technologies Inc. Systems and methods for grouping and enriching data items accessed from one or more databases for presentation in a user interface
US10102369B2 (en) 2015-08-19 2018-10-16 Palantir Technologies Inc. Checkout system executable code monitoring, and user account compromise determination system
US10853378B1 (en) 2015-08-25 2020-12-01 Palantir Technologies Inc. Electronic note management via a connected entity graph
US11150917B2 (en) 2015-08-26 2021-10-19 Palantir Technologies Inc. System for data aggregation and analysis of data from a plurality of data sources
US9485265B1 (en) 2015-08-28 2016-11-01 Palantir Technologies Inc. Malicious activity detection system capable of efficiently processing data accessed from databases and generating alerts for display in interactive user interfaces
US10706434B1 (en) 2015-09-01 2020-07-07 Palantir Technologies Inc. Methods and systems for determining location information
US9639580B1 (en) 2015-09-04 2017-05-02 Palantir Technologies, Inc. Computer-implemented systems and methods for data management and visualization
US9576015B1 (en) 2015-09-09 2017-02-21 Palantir Technologies, Inc. Domain-specific language for dataset transformations
US10296617B1 (en) 2015-10-05 2019-05-21 Palantir Technologies Inc. Searches of highly structured data
US9542446B1 (en) 2015-12-17 2017-01-10 Palantir Technologies, Inc. Automatic generation of composite datasets based on hierarchical fields
US10109094B2 (en) 2015-12-21 2018-10-23 Palantir Technologies Inc. Interface to index and display geospatial data
US10089289B2 (en) 2015-12-29 2018-10-02 Palantir Technologies Inc. Real-time document annotation
US9823818B1 (en) 2015-12-29 2017-11-21 Palantir Technologies Inc. Systems and interactive user interfaces for automatic generation of temporal representation of data objects
US9612723B1 (en) 2015-12-30 2017-04-04 Palantir Technologies Inc. Composite graphical interface with shareable data-objects
JP6203304B2 (ja) * 2016-02-19 2017-09-27 ヤフー株式会社 情報処理装置、情報処理方法および情報処理プログラム
US10698938B2 (en) 2016-03-18 2020-06-30 Palantir Technologies Inc. Systems and methods for organizing and identifying documents via hierarchies and dimensions of tags
US10068199B1 (en) 2016-05-13 2018-09-04 Palantir Technologies Inc. System to catalogue tracking data
CN105871549B (zh) * 2016-06-13 2018-12-25 四川特伦特科技股份有限公司 一种数字信号加密处理方法
US10719188B2 (en) 2016-07-21 2020-07-21 Palantir Technologies Inc. Cached database and synchronization system for providing dynamic linked panels in user interface
US10324609B2 (en) 2016-07-21 2019-06-18 Palantir Technologies Inc. System for providing dynamic linked panels in user interface
US9686357B1 (en) 2016-08-02 2017-06-20 Palantir Technologies Inc. Mapping content delivery
US10437840B1 (en) 2016-08-19 2019-10-08 Palantir Technologies Inc. Focused probabilistic entity resolution from multiple data sources
US20180137178A1 (en) * 2016-11-11 2018-05-17 International Business Machines Corporation Accessing data and performing a data processing command on the data with a single user input
US10318630B1 (en) 2016-11-21 2019-06-11 Palantir Technologies Inc. Analysis of large bodies of textual data
JP2018085021A (ja) * 2016-11-25 2018-05-31 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
JP6867579B2 (ja) * 2016-11-25 2021-04-28 キヤノンマーケティングジャパン株式会社 情報処理装置、情報処理システム、その制御方法及びプログラム
US10515433B1 (en) 2016-12-13 2019-12-24 Palantir Technologies Inc. Zoom-adaptive data granularity to achieve a flexible high-performance interface for a geospatial mapping system
US10270727B2 (en) 2016-12-20 2019-04-23 Palantir Technologies, Inc. Short message communication within a mobile graphical map
US10460602B1 (en) 2016-12-28 2019-10-29 Palantir Technologies Inc. Interactive vehicle information mapping system
US10579239B1 (en) 2017-03-23 2020-03-03 Palantir Technologies Inc. Systems and methods for production and display of dynamically linked slide presentations
US10860652B2 (en) * 2017-05-10 2020-12-08 Agora Intelligence, Inc. Method, apparatus, and computer-readable medium for generating categorical and criterion-based search results from a search query
US10895946B2 (en) 2017-05-30 2021-01-19 Palantir Technologies Inc. Systems and methods for using tiled data
US11334216B2 (en) 2017-05-30 2022-05-17 Palantir Technologies Inc. Systems and methods for visually presenting geospatial information
US10956406B2 (en) 2017-06-12 2021-03-23 Palantir Technologies Inc. Propagated deletion of database records and derived data
US11580115B2 (en) * 2017-06-29 2023-02-14 Ebay Inc. Identification of intent and non-intent query portions
US10403011B1 (en) 2017-07-18 2019-09-03 Palantir Technologies Inc. Passing system with an interactive user interface
US10371537B1 (en) 2017-11-29 2019-08-06 Palantir Technologies Inc. Systems and methods for flexible route planning
US11599706B1 (en) 2017-12-06 2023-03-07 Palantir Technologies Inc. Systems and methods for providing a view of geospatial information
US10698756B1 (en) 2017-12-15 2020-06-30 Palantir Technologies Inc. Linking related events for various devices and services in computer log files on a centralized server
US11599369B1 (en) 2018-03-08 2023-03-07 Palantir Technologies Inc. Graphical user interface configuration system
US10866976B1 (en) * 2018-03-20 2020-12-15 Amazon Technologies, Inc. Categorical exploration facilitation responsive to broad search queries
US10896234B2 (en) 2018-03-29 2021-01-19 Palantir Technologies Inc. Interactive geographical map
US10830599B2 (en) 2018-04-03 2020-11-10 Palantir Technologies Inc. Systems and methods for alternative projections of geographical information
US11585672B1 (en) 2018-04-11 2023-02-21 Palantir Technologies Inc. Three-dimensional representations of routes
US10754822B1 (en) 2018-04-18 2020-08-25 Palantir Technologies Inc. Systems and methods for ontology migration
US10885021B1 (en) 2018-05-02 2021-01-05 Palantir Technologies Inc. Interactive interpreter and graphical user interface
US10429197B1 (en) 2018-05-29 2019-10-01 Palantir Technologies Inc. Terrain analysis for automatic route determination
US11119630B1 (en) 2018-06-19 2021-09-14 Palantir Technologies Inc. Artificial intelligence assisted evaluations and user interface for same
US10467435B1 (en) 2018-10-24 2019-11-05 Palantir Technologies Inc. Approaches for managing restrictions for middleware applications
US11025672B2 (en) 2018-10-25 2021-06-01 Palantir Technologies Inc. Approaches for securing middleware data access
RU2721159C1 (ru) * 2018-12-13 2020-05-18 Общество С Ограниченной Ответственностью "Яндекс" Способ и сервер генерирования мета-признака для ранжирования документов
US11170035B2 (en) * 2019-03-29 2021-11-09 Snap Inc. Context based media curation
KR102215263B1 (ko) * 2019-04-09 2021-02-15 카페24 주식회사 Sql 쿼리의 유형을 분류하는 방법, 이상 상황 발생 여부 결정 방법 및 컴퓨팅 디바이스
KR102425770B1 (ko) * 2020-04-13 2022-07-28 네이버 주식회사 급상승 검색어 제공 방법 및 시스템
CN112597180A (zh) * 2020-11-20 2021-04-02 深圳市世强元件网络有限公司 电子元件售卖平台服务项目搜索方法、装置及计算机设备
KR102342314B1 (ko) * 2021-07-23 2021-12-22 주식회사 델버 의약품의 품질데이터에 기반하여 질의데이터에 대한 응답을 제공하는 방법, 서버 및 컴퓨터프로그램

Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030220913A1 (en) * 2002-05-24 2003-11-27 International Business Machines Corporation Techniques for personalized and adaptive search services

Family Cites Families (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5619709A (en) * 1993-09-20 1997-04-08 Hnc, Inc. System and method of context vector generation and retrieval
US6460034B1 (en) * 1997-05-21 2002-10-01 Oracle Corporation Document knowledge base research and retrieval system
US6631372B1 (en) * 1998-02-13 2003-10-07 Yahoo! Inc. Search engine using sales and revenue to weight search results
US6424973B1 (en) * 1998-07-24 2002-07-23 Jarg Corporation Search system and method based on multiple ontologies
US6317722B1 (en) * 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US6480843B2 (en) * 1998-11-03 2002-11-12 Nec Usa, Inc. Supporting web-query expansion efficiently using multi-granularity indexing and query processing
US6189002B1 (en) * 1998-12-14 2001-02-13 Dolphin Search Process and system for retrieval of documents using context-relevant semantic profiles
US6327590B1 (en) * 1999-05-05 2001-12-04 Xerox Corporation System and method for collaborative ranking of search results employing user and group profiles derived from document collection content analysis
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
WO2002019147A1 (en) * 2000-08-28 2002-03-07 Emotion, Inc. Method and apparatus for digital media management, retrieval, and collaboration
US20020087346A1 (en) * 2000-11-28 2002-07-04 Harkey Scott T. Utilization of competencies as drivers in a learning network
US6766316B2 (en) * 2001-01-18 2004-07-20 Science Applications International Corporation Method and system of ranking and clustering for document indexing and retrieval
US6584470B2 (en) * 2001-03-01 2003-06-24 Intelliseek, Inc. Multi-layered semiotic mechanism for answering natural language questions using document retrieval combined with information extraction
US7194454B2 (en) * 2001-03-12 2007-03-20 Lucent Technologies Method for organizing records of database search activity by topical relevance
US20030115191A1 (en) * 2001-12-17 2003-06-19 Max Copperman Efficient and cost-effective content provider for customer relationship management (CRM) or other applications
US7243092B2 (en) * 2001-12-28 2007-07-10 Sap Ag Taxonomy generation for electronic documents
US7406459B2 (en) * 2003-05-01 2008-07-29 Microsoft Corporation Concept network
US20040225555A1 (en) * 2003-05-09 2004-11-11 Andreas Persidis System and method for generating targeted marketing resources and market performance data
US20040260677A1 (en) * 2003-06-17 2004-12-23 Radhika Malpani Search query categorization for business listings search
US7395256B2 (en) * 2003-06-20 2008-07-01 Agency For Science, Technology And Research Method and platform for term extraction from large collection of documents
US7260568B2 (en) * 2004-04-15 2007-08-21 Microsoft Corporation Verifying relevance between keywords and web site contents
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query

Patent Citations (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20030220913A1 (en) * 2002-05-24 2003-11-27 International Business Machines Corporation Techniques for personalized and adaptive search services

Cited By (16)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102142017A (zh) * 2010-01-28 2011-08-03 微软公司 提供查询建议
CN102063468B (zh) * 2010-12-03 2014-04-16 百度在线网络技术(北京)有限公司 一种用于确定查询序列的查询类别的设备及其方法
CN102063468A (zh) * 2010-12-03 2011-05-18 百度在线网络技术(北京)有限公司 一种用于确定查询序列的查询类别的设备及其方法
CN103518199A (zh) * 2011-03-07 2014-01-15 Azzimov公司 用于精炼移动设备上语义搜索的方法和系统
CN103518199B (zh) * 2011-03-07 2018-04-24 Azzimov公司 用于精炼移动设备上语义搜索的方法和系统
CN103235786A (zh) * 2013-03-28 2013-08-07 北京百度网讯科技有限公司 一种用于提供长尾搜索结果的方法与设备
CN103235786B (zh) * 2013-03-28 2018-12-18 北京百度网讯科技有限公司 一种用于提供长尾搜索结果的方法与设备
CN103559326A (zh) * 2013-11-25 2014-02-05 方正国际软件有限公司 患者信息提示方法和患者信息提示系统
CN104750822A (zh) * 2015-03-31 2015-07-01 北京奇虎科技有限公司 提供搜索建议的方法和装置
CN107533563B (zh) * 2015-05-29 2022-03-11 英特尔公司 用于动态自动化内容发现的方法和设备
CN107533563A (zh) * 2015-05-29 2018-01-02 英特尔公司 用于动态自动化内容发现的技术
CN107943943A (zh) * 2017-11-23 2018-04-20 北京小度信息科技有限公司 用户相似度的确定方法、装置、电子设备及存储介质
CN107943943B (zh) * 2017-11-23 2020-11-03 北京小度信息科技有限公司 用户相似度的确定方法、装置、电子设备及存储介质
CN111801666A (zh) * 2018-03-23 2020-10-20 国际商业机器公司 虚拟代理系统中的查询识别弹性确定
US10831797B2 (en) 2018-03-23 2020-11-10 International Business Machines Corporation Query recognition resiliency determination in virtual agent systems
WO2019180515A1 (en) * 2018-03-23 2019-09-26 International Business Machines Corporation Query recognition resiliency determination in virtual agent systems

Also Published As

Publication number Publication date
JP4994243B2 (ja) 2012-08-08
EP1828937A1 (en) 2007-09-05
HK1117243A1 (zh) 2009-01-09
JP2008523469A (ja) 2008-07-03
WO2006062772A1 (en) 2006-06-15
KR101211800B1 (ko) 2012-12-12
KR20070092718A (ko) 2007-09-13
CN101111837B (zh) 2014-01-15
US20060122979A1 (en) 2006-06-08
US7620628B2 (en) 2009-11-17

Similar Documents

Publication Publication Date Title
CN101111837B (zh) 查询自动分类的搜索处理
CN100401292C (zh) 用于使用倾向分析进行搜索查询处理的系统和方法
US10157233B2 (en) Search engine that applies feedback from users to improve search results
US8515811B2 (en) Online advertising valuation apparatus and method
Crescenzi et al. Clustering web pages based on their structure
US9449105B1 (en) User-context-based search engine
Jung et al. User preference mining through hybrid collaborative filtering and content-based filtering in recommendation system
WO2001025947A1 (en) Method of dynamically recommending web sites and answering user queries based upon affinity groups
CN101151607A (zh) 用于提供产品评论的方法、系统和图形用户界面
KR20070038146A (ko) 검색 결과에서 배치 내용 정렬의 개인화
CN101401062A (zh) 确定相关来源、查询及合并多个内容来源的结果的方法和系统
US11379473B1 (en) Site rank codex search patterns
Vargiu et al. Improving contextual advertising by adopting collaborative filtering
Amini et al. Discovering the impact of knowledge in recommender systems: A comparative study
Velásquez et al. A knowledge base for the maintenance of knowledge extracted from web data
Liu et al. Recent advances in personal recommender systems
WO2008032037A1 (en) Method and system for filtering and searching data using word frequencies
Li et al. Online commercial intention detection framework based on web pages
Rana An Evolutionary clustering algorithm for handling dynamics of user profiles in recommender systems
Chen et al. Serendipitous Page Recommendation on Web IndeX System with Potential Preferences
KAYA TAG BASED RECOMMENDATION SYSTEM OF A SOCIAL NETWORKING SITE
Eichstädt Internet webcasting: generating and matching profiles
Patel et al. A Survey on Web Personalization and Recommendation Techniques
Suryavanshi A new class of techniques for Web personaliation
Zhu et al. Personalized information retrieval in digital ecosystems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
REG Reference to a national code

Ref country code: HK

Ref legal event code: DE

Ref document number: 1117243

Country of ref document: HK

C14 Grant of patent or utility model
GR01 Patent grant
REG Reference to a national code

Ref country code: HK

Ref legal event code: GR

Ref document number: 1117243

Country of ref document: HK

ASS Succession or assignment of patent right

Owner name: FEIYANG MANAGEMENT CO., LTD.

Free format text: FORMER OWNER: YAHOO CORP.

Effective date: 20150331

TR01 Transfer of patent right

Effective date of registration: 20150331

Address after: The British Virgin Islands of Tortola

Patentee after: Fly upward Management Co., Ltd

Address before: American California

Patentee before: Yahoo Corp.