CN102945237B - 基于原始用户输入建议和细分用户输入的系统和方法 - Google Patents

基于原始用户输入建议和细分用户输入的系统和方法 Download PDF

Info

Publication number
CN102945237B
CN102945237B CN201210199408.7A CN201210199408A CN102945237B CN 102945237 B CN102945237 B CN 102945237B CN 201210199408 A CN201210199408 A CN 201210199408A CN 102945237 B CN102945237 B CN 102945237B
Authority
CN
China
Prior art keywords
word
input
user
feature
suggestion
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201210199408.7A
Other languages
English (en)
Other versions
CN102945237A (zh
Inventor
吴军
林德康
钱哲
周杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Google LLC
Original Assignee
Google LLC
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Google LLC filed Critical Google LLC
Publication of CN102945237A publication Critical patent/CN102945237A/zh
Application granted granted Critical
Publication of CN102945237B publication Critical patent/CN102945237B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/90Details of database functions independent of the retrieved data types
    • G06F16/903Querying
    • G06F16/9032Query formulation
    • G06F16/90324Query formulation using system suggestions
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/242Query formulation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • G06F16/2457Query processing with adaptation to user needs
    • G06F16/24578Query processing with adaptation to user needs using ranking
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/30Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
    • G06F16/33Querying
    • G06F16/332Query formulation
    • G06F16/3322Query formulation using system suggestions

Abstract

提供了一种基于原始用户输入建议和细分用户输入的系统和方法。该方法可以针对基于罗马语系的语言和/或诸如汉语的基于非罗马语系的语言来实现。该方法通常可以包括:接收原始用户输入并识别其中的核心词语;通过根据相似矩阵用另一词语替代原始输入中的核心词语和/或通过根据扩展/缩略表用另一个字序列代替原始输入中的字序列来确定潜在可选输入,其中,一个字序列是另一个字序列的子串;计算每个潜在可选输入的似然;以及根据预定标准(例如,可选输入的似然至少是原始输入的似然)来选择最有可能的可选输入。可以提供包含预计算的原始用户输入和相应的可选输入的高速缓冲存储器。

Description

基于原始用户输入建议和细分用户输入的系统和方法
本申请是分案申请,其原案申请的申请号为200680021940.2,申请日为2006年5月4日,发明名称为“基于原始用户输入建议和细分用户输入”。
技术领域
本发明总的来说涉及生成可选用户输入。更具体地,公开了基于诸如搜索查询的原始用户输入生成更改和细分的用户输入的系统和方法。
背景技术
在给定的搜索会话(session)期间,许多用户常常,有时重复地,更改或细分其原始搜索查询。例如,用户可以将原始搜索查询更改为更具体的搜索查询、更宽泛的搜索查询、和/或使用可选的查询词语(term)的搜索查询,直到生成期望的搜索结果。用户搜索查询细分通过基于罗马语系语言(例如,英语)的查询、以及通过基于非罗马语系语言(例如,汉语、日语、韩语(CJK)、泰国语等)来产生。当原始搜索查询未产生一组好的搜索结果时(例如,如果搜索查询太具体或太宽泛,或者如果搜索查询使用不合适的词语),用户通常更改或细分他们的搜索查询。例如,当一个或多个搜索词语有多种意思且一些返回文档涉及不同于用户想要的多义搜索词语的一个意思时、和/或用户仅对搜索词语的许多方面中给定搜索词语的一个方面感兴趣时,原始用户搜索查询可能产生许多不相关的结果。当用户仅探究关于所指定搜索词语的概念时,原始用户搜索查询也可能产生很多不相关的结果。
许多搜索引擎提供与用户原始搜索查询相关的一系列建议的搜索查询。例如,如果用户的原始搜索查询是“Amazon”,则搜索引擎可以建议其它相关的搜索查询,例如,“Amazon.com”、“Amazon Rainforest”、以及“Amazon River”。搜索查询建议对于基于非罗马语系语言用户(例如,CJK用户)特别有用。具体地,因为基于非罗马语系语言通常具有一组大量的字符且每个字符可能都需要多次按下使用传统基于罗马语系的键盘的按键,所以基于非罗马语系语言用户可以优选单击或选择全部键入的更改搜索查询中的一个建议的搜索查询。例如,许多汉语用户使用拼音(语音拼写法)来输入汉语字符。典型地,传统拼音输入系统转换拼音输入,并提供用户可以从中选择期望的汉语字符集的一组候选的汉语字符集。明显的是,多步输入处理将是繁重且耗时的。
搜索查询建议也将对基于罗马语系的语言用户有用。许多搜索引擎(例如,Yahoo、Teoma、Alta Vista、Askjeeves、AllTheWeb以及Baidu)都提供例如以相关搜索、查询细分、或查询分簇形式的特征。
发明内容
公开了一种基于原始用户输入(例如,搜索查询)来生成更改或细分的用户输入的系统和方法。应当理解,本发明可以多种方式来实施,这些方式包括诸如处理、设备、系统、装置、方法、或其中的程序指令通过光通信线路或电子通信线路来发送的计算机可读介质(例如,计算机可读存储介质或计算机网络)。术语计算机通常指具有计算能力的任何装置,例如,个人数字助理(PDA)、蜂窝式电话、和网络交换机。以下将描述本发明的几个创造性实施例。
该方法可以被应用于基于非罗马语系语言(例如,汉语)的查询。该方法通常可以包括接收和识别原始用户输入中的核心词语;通过根据相似矩阵用另一词语代替原始输入中的核心词语、和/或根据扩展/缩略表用另一个字序列替代原始输入中的字序列来确定潜在可选的用户输入,其中,一个序列是另一个序列的子串;计算潜在可选的用户输入的似然;以及根据预定标准(例如,每个所选的可选用户输入的似然至少为原始用户输入的似然)来选择最可能的可选用户输入。该方法还可以包括确定原始用户输入是否在所建议的可选用户输入的预计算高速缓冲存储器中,如果在,则输出存储在预计算高速缓冲存储器中的预计算的最可能的可选用户输入。
相似矩阵可以利用语料库生成,且可以具有两个相似词语(包括例如“New York”和“Los Angeles”的短语词)之间的相似值,尽管每个对应词语对(New和Los和York和Angeles)不具有高相似性,但这些短语词可以具有非常高的相似性。在一个实施例中,可以通过构建对于语料库中的字的特征向量并利用他们的特征向量来确定两个字/短语之间的相似值来生成相似矩阵。
可以从用户输入数据库中生成扩展/缩略表,且可以具有与每对词语序列相关的频率值。在一个实施例中,可以通过确定常用的字序列、滤出非短语字序列、以及使计数与每个术语序列相关作为频率值来生成扩展/缩略表。仅为了示出,扩展/缩略表中的项的实例可以为“The United Stateof America”和“United States”。
可以通过确定以下的至少一项来计算潜在可选用户输入的似然:(a)原始用户输入和潜在可选用户输入之间的关联性,(b)用户将选择潜在可选用户输入的概率,以及(c)潜在可选用户输入的位置分数(score)。具体地,可以使用原始输入和潜在可选用户输入的调整(align)词语之间的相关值来确定原始用户输入和潜在可选用户输入之间的关联性。
在另一实施例中,用于建议可选用户输入的系统通常包括建议/细分服务器,被配置为接收具有至少一个核心词语的原始用户输入;从原始用户输入中识别出核心词语;通过执行以下中的至少一项来确定潜在可选用户输入:(a)根据相似矩阵用另一词语来代替原始用户输入中的至少一个核心词语,该相似矩阵具有两个词语之间的相似值,(b)根据扩展/缩略表用另一个字序列来替代原始用户输入中的字序列,其中,一个序列是另一个序列的子串,该扩展/缩略表具有与每个词语序列相关联的频率值,计算潜在可选用户输入的似然;以及根据预定标准来选择和输出最可能的可选用户输入。
在又一实施例中,用于建议可选用户输入的计算机程序产品和计算机系统一起使用,该计算机程序产品包括在其上存储有在计算机处理器上可执行的指令的计算机可读存储介质。该指令通常可以包括接收和识别原始用户输入中的核心词语;通过根据相似矩阵用另一个词语代替在原始输入中的核心词语、和/或根据扩展/缩略表用另一个字序列代替原始输入中的字序列来确定潜在可选用户输入,一个序列是另一个序列的子串;用潜在可选用户输入计算潜在可选用户输入的似然和可选地计算预测用户满意度;以及根据预定标准(例如,每个所选的可选用户输入的似然至少为原始用户输入的似然)来选择最可能的可选用户输入。
实现系统和方法的应用可以在服务器站点(例如,在搜索引擎上)上实现,或者可以在客户端站点上(例如,用户计算机)被实现(例如,下载),以提出建议的可选输入或与远程服务器(例如,搜索引擎)连接。
下面将通过下列详细描述和附图更详细地呈现本发明的这些和其它特征以及优点,其中,以本发明的实例原理的方式示出了附图。
附图说明
结合附图,通过下面详细的描述,将更好地理解本发明,其中,相同的参考标号表示相同的结构元件。
图1A是用于生成诸如用户搜索查询的建议的更改/细分的用户输入的示例性系统的框图。
图1B是示出用于通过建议-细分服务器的相似字提取器生成相似矩阵的过程的框图。
图1C是示出用于通过建议-细分服务器的扩展/缩略表生成器生成扩展/缩略表的过程的框图。
图1D是示出用于通过建议-细分服务器的会话语法分析器生成初始的更改/细分高速缓冲存储器的过程的框图。
图2A是示出用于生成如可以由图1A所示的系统实现的更改/细分用户输入高速缓冲存储器的示例性过程的流程图。
图2B是示出用于生成如可以由图1A所示的系统实现的诸如用户查询的建议的更改/细分用户输入的示例性过程的流程图。
图3示出了通过对原始用户查询进行语法分析而生成的示例性查询网格。
图4是示出了用于通过代替查询词语来构建在生成建议的更改/细分查询中使用的相似矩阵的示例性过程的流程图。
图5是列出了对于从示例性文本中生成的词语“communities”的特征和对应计数的表。
图6是列出了对于从语料库中生成的词语“communities”的示例性特征和对应计数的表。
图7是用于代替词语以生成建议的更改/细分查询的示例性相似矩阵。
图8是示出用于通过替代查询中的复合字来构建在生成建议的更改/细分查询中使用的复合字对的提取/缩略表的示例性过程的流程图。
图9是示出用于代替查询中的复合字来生成建议的更改/细分查询的扩展/缩略表中的一些示例性项的表格。
图10是示出用于确定建议的更改/细分查询分数的示例性过程的流程图。
图11示出两个查询Q和Q’的词语对准映射的实例。
图12是示出用于生成用于检测的新项的相关值的示例性过程的流程图。
具体实施方式
披露了一种基于原始用户输入(例如,搜索查询)来生成更改或细分的用户输入的系统和方法。应当注意,仅为了清楚,通常以汉语查询输入的词语来表示文中表示的实例。然而,用于建议细分/更改的用户输入的系统和方法可以类似地应用于其它基于非罗马语系的语言(例如,日语、韩语、泰国语等)以及基于罗马语系的语言。此外,用于建议的细分/更改用户输入的系统和方法可以类似地应用于其它非查询用户输入。表示下列描述,以使任何本领域技术人员能够制造和使用本发明。仅提供了特定实施例和应用的描述作为实例,并且各种更改对于本领域技术人员来说是显而易见的。在不背离本发明的精神和范围的情况下,可将文中限定的主要原理应用于其它实施例和应用。因此,本发明应与包括与文中公开的原理和特征相一致的各种改变、更改和等同替换的最宽范围相一致。为了清楚,未对关于与本发明相关的的技术领域中已知的技术资料的细节进行详细描述,以避免对本发明产生不必要的混淆。
该系统和方法基于原始用户输入(例如,查询)、基于用户的查询历史和用户查询词语之间的关系来生成更改或细分的用户输入。该系统和方法可以包括用于提取包括新名称项(例如,适当名称、电影名、歌曲和产品等)的新词语以及词语之间关系的系统和方法。文中描述的系统和方法适用于生成查询(或其它用户输入)细分,并且还将适用于诸如新文章分类、拼写校正、媒体搜索和分段的许多其它应用。对于许多用户,初始搜索查询通常不是最佳搜索查询,因此在给定搜索会话期间,用户有时多次更改或细分搜索查询。
图1A是用于从诸如用户搜索查询22的原始用户输入中生成建议更改/细分的输入26的示例性系统20的框图。系统20通常包括建议/细分服务器24,其使用可以从多个数据源中推导出的概率来生成建议的更改/细分查询26。多个数据源的实例包括可选的建议/细分高速缓冲存储器36,其存储预先计算的查询建议或细分的高速缓冲存储器。首先,可以通过建议/细分服务器24的会话语法分析器24C生成建议/细分高速缓冲存储器36。另一数据源可以是可由建议/细分服务器24的相似字提取器24A生成的相似矩阵38,以及由扩展/缩略表生成器24B生成的扩展/缩略表39。相似矩阵38和扩展/缩略表39通常接近于词语和/或词语序列之间的关系。系统20可以周期性地更新和/或再生相似矩阵38和/或扩展/缩略表39。以下将参照图1B至图1D分别详细描述建议/细分服务器24的相似字提取器24A、扩展/缩略表生成器24B、和会话语法分析器24C。
图1B是示出用于通过相似字提取器24A生成相似矩阵38的过程的框图。如图所示,相似字提取器24A可以利用用于生成相似矩阵38的多种数据源。由相似字提取器24A利用的数据源的实例包括诸如网络语料库30的语料库(例如,新闻、网页、和链接锚文本信息)、查询和相关用户选择(例如,存储在查询日志32中的查询和相关用户选择)、和/或可以包括在每个给定会话中的查询历史的会话数据34。网络语料库30还可以包括链接锚文本信息。例如,查询日志32不仅可以包括用户查询日志,还可以包括由用户进行的搜索结果选择以及在返回搜索结果之前用户停留在所选搜索结果处的持续时间。
图1C是示出用于通过扩展/缩略表生成器24B生成提取/缩略表39的过程的框图。如图所示,扩展/缩略表生成器24B可以将查询日志32和/或会话数据34用作用于生成提取/缩略表39的数据源。图1D是示出用于通过会话语法分析器24C生成初始更改/细分高速缓冲存储器36a的处理的框图。如图所示,会话语法分析器24C将会话数据34用作其用于生成初始更改/细分高速缓冲存储器36a的数据源。
图2A和图2B是示出可以通过建议/细分服务器24来执行示例性过程的流程图。具体地,图2A是示出了用于生成如可以通过图1A示出的系统20实现的更改/细分用户输入高速缓冲存储器的示例性处理40的流程图。在方框41处,可以使用会话语法分析器从会话数据中生成初始更改/细分高速缓冲存储器。注意,会话数据可以包括在每个给定用户输入或查询会话中的查询历史。然后,过程40进入包括方框43~48的循环,该循环针对在方框42中的预定数量的最普通用户输入中的每一个,例如,查询。具体地,在方框43处,过程对高速缓冲存储器中的建议的更改/细分查询执行查找。在方框43处的查找可以生成建议1、2、…M。
更改/细分高速缓冲存储器中的每个用户输入或查询项可以包含一列预定数量N个的建议查询。因此,为生成建议M+1、M+2…N,即,为填补每个查询的建议查询列,还可以执行方框44~47。具体地,在方框44和45处,可以(理论上地)构建扩展查询网格,以生成附加的建议的更改/细分(可选)查询。方框44通常表示词语替代查询更改/细分方法,而方框45通常表示扩展/缩略查询更改/细分方法。具体地,在方框44处,可以使用相似词语的相似矩阵用相似词语替代原始查询中的词语来创建扩展查询网格。词语替代用相似字或词语替代原始查询中的字或词语(包括短语词)。相似词语可包括同义字或近义字(例如,社区和相邻区域)、缩写词、和/或在相同语法/语义类别中的词语(例如,Toyota和Honda、Dell和HP、DVD和数码相机、以及Nokia和Motorola)。
在方框45处,可以通过使用复合字对的扩展/缩略表在原始查询中添加/删除词语来附加地和/或选择性地构建扩展查询网格。具体地,扩展/缩略表中的每一项都是一个复合字对,其中,一个复合字是另一个的子串,例如,T1T2<=>T1T2T3,以及T4T5T6<=>T4T5。汉语复合字对的实例包括上海和上海市以及电视和电视机。复合字对可以包括多义词语和它们明确的上下文(例如,Amazon和Amazon rain forest和/或Amazon.com)、概念及其细分(例如,cell和stem cell和/或cell phone)、词语及其属性(例如,计算机和存储器、硬盘驱动器、和/或DVD驱动器)、以及名称(例如,人名、公司名称等)和他们对应的活动性、工作、产品等(例如,诸如TomHanks和Forrest Gump的演员-电影、诸如Apple和iPod的公司-产品、如Bill Gates和Microsoft或CEO的法人-公司或头衔、作者-书、歌手-歌曲等)。
在构建了包含多种可选路径的扩展查询网格之后,在方框46处,对于扩展查询网格中预定数量的最佳查询的路径和分数被识别为潜在建议的查询。在方框47处,计算原始普通用户查询的分数,使得仅提供其分数至少是那个原始普通用户查询分数的潜在建议的查询,作为建议的更改/细分查询。分数可以表示作为由用户选择或期望的查询的给定查询(原始或潜在建议的查询)的似然。可以仅提供其分数至少是原始普通用户查询分数的查询,作为建议的更改/细分查询来填充更改/细分高速缓冲存储器的建议列表项。可以将生成的建议的查询存储到预计算的更改/细分查询高速缓冲存储器。注意,过程40或包括方框42~49的循环可以周期性重复,以更新更改/细分高速缓冲存储器。
图2B是示出用于生成如可以由图1A所示的系统实现的诸如用户查询的建议的更改/细分用户输入的示例性过程50的流程图。在方框51处,接收诸如用户查询的用户输入。在判断框52处,可以将在方框51接收的原始用户输入与在可选的预计算的更改/细分高速缓冲存储器中的项进行比较。如果在判断框52处确定原始用户查询处于建议/细分高速缓冲存储器中,则在方框53,由来自预计算的更改/细分高速缓冲存储器的多至N个预计算查询建议至少部分地填充大小为N的查询建议列表。如果如在判断框54处确定的建议列表被填满,则过程50完成。注意,建议列表可以具有预定大小N,例如,10个建议或单个最佳建议。可选地,如果如在判断框54处确定的建议列表未被填满,则过程50继续执行方框55和56。类似地,如果在判断框52处原始用户查询确定未处于建议/细分高速缓冲存储器中,则过程也继续执行方框55和56。注意,参照图2A,方框55~58类似于如上所述的过程40的方框44~47。因此,为了清楚,某种程度上它们是相似的描述将不在这里重复。
在方框55和56处,(概念上)构建扩展查询网格来生成建议的更改/细分(可选)查询。在构建包含多个可选路径的扩展查询网格之后,在方框57处,对于扩展查询网格中预定数量的最佳查询的路径和分数被识别为潜在建议查询。在方框58处,计算原始用户查询的分数,使得仅提供其分数至少是原始用户查询的分数的潜在建议查询,作为建议的更改/细分查询。其分数至少是原始用户查询的分数的查询可以被提供给用户,作为建议的更改/细分查询来填充建议列表或建议列表的剩余部分。尽管未示出,可以可选地提供单个最佳查询。此外,可以将原始用户查询和生成的建议查询附加地存储到预计算的更改/细分查询高速缓冲存储器。
下面将更详细地描述如上面参照图2A和图2B示出并描述的用于生成建议的更改/细分用户输入的过程40和50的各个方框。
图3示出示例性的扩展查询网格示意图。如图所示,原始查询可以包括多个核心字或词语T1、T2、T3、T4,以及非核心字或词语s1、s2、s3。例如,在汉语查询“新浪的URL”中,核心词语或项是“新浪”而不是“URL”。非核心术语通常还包括无用字。无用字通常被定义为在诸如网络语料库的语料库中的30个最频繁出现的汉语字或100个最频繁出现的英文字。
在识别原始查询的核心项之后,可以应用一个或多个查询更改或细分方法(例如,词语替代和/或扩展/缩略)来构建扩展查询网格。如上所述注意,词语替代是指替代与核心项类似(例如,同义字或近义字)并可以使用诸如相似矩阵来识别的字和/或词语。仅为了示例性的目的,图3示出可以通过用词语T1’或T1”来替代词语T1和/或用词语T4’替代词语T4来构建扩展查询网格。
同样如上所注意的,扩展/缩略是指利用诸如复合字的扩展/缩略表来将核心项添加到原始查询中和/或从原始查询中删除一些核心项。仅为示例性的目的,复合字的扩展/缩略表可以包括复合字对T1T2和T1T2T5的表项,以使图3的原始查询中的复合字T1T2可以用复合字T1T2T5(即,添加新词语T5)替代,从而进一步构建扩展查询网格。类似地,复合字的扩展/缩略表还可以包括对于复合字对T2T3T4和T3T4的表项,以使图3的原始查询中的复合字T2T3T4可以用复合字T3T4(即,删除核心项T2)替代,从而进一步构建扩展查询网格。
参照图4至图7,更详细地描述用于生成相似词语的相似矩阵的一种示例性的方法。图4是示出用于通过替代查询词语来构建在生成建议的更改/细分查询中使用的相似矩阵的示例性过程60的流程图。相似矩阵可以是在每对字或术语w之间分布字相似性的矩阵。可以通过构建对于在诸如网页的语料库中的每个字w的特征向量、并确定在每个对字的每个字之间的相似性作为其对应特征向量之间角的余弦来获得分布字相似性。字或词语的特征向量可以包括所有出现的字或词语的周围字(surrounding word)。
尽管可以类似地采用各种其它特征向量和相似矩阵构建方法,但参照图4示出了构建特征向量和相似矩阵的一个实例。具体地,在方框62处,语料库(例如,网络语料库)中的每个字/词语的特征向量与特征向量中对于每个特征f的计数一起被构建。字/词语w的特征可以包括在字/词语w之前和之后直到第一个无用字出现的多个字。仅为示例性目的,对于给出的句子“Because communities assess at different percentages of fair marketvalue,the only way to improve tax rates among communities is by usingequalized rates,”,在图5的表中列出了特征字communities及其对应的共同出现计数。注意,在具有不同形式的给定字(例如,诸如“community”和“communities”的单数或复数、或诸如“walk”、“walking”、和“walked”的不同时态)的语言中,系统可以将不同形式的字视为单个字,但通常是相似词语。这种不同形式的给定字的处理将与不具有这种区别的语言无关(例如,通常在例如汉语的情况下)。此外,还注意到,具有前缀“L:”或“R:”的特征分别是表示字w的左侧或右侧的字。在该实施例中,在字w的给定情况的左侧和右侧中的每一个上的一个或多个特征的计数和是1。例如,在字“communities”的第一种情况中,左侧和右侧特征中的每一个都被分配为计数1。此外,当在字“communities”附近存在一个或多个无用字(例如,“between”、“is”、和“by”)时,字“communities”的给定情况的每一侧的特征计数可被平分,从而,被计算为小数。在字“communities”的第二种情况中,存在两个左侧特征,使得为每个左侧特征分配计数0.5。类似地,在字“communities”的第二种情况中,存在两个右侧特征,使得为每个右侧特征分配计数0.33。
再次参照图4,在方框64处,特征向量中的每个特征f的值可以被确定为在字w和特征f之间的点态(point-wise)交互信息MI。使用点态交互信息MI的值,这是因为虽然频繁出现的字(例如,无用字)容易具有较高计数,但这种字常常是无意义的。因此,因为特征计数可能不是重要特征较好的指示符,所以字w和特征f之间的点态交互信息MI(w,f)可被用作特征f的值。点态交互信息MI(w,f)可以被定义为w和f的有效联合概率P(w,f)、以及w的期望概率P(w)、和f的期望概率P(f)之间的对数比,如果他们是相互独立的,则共同存在:
MI ( w , f ) = P ( w &CenterDot; f ) &CenterDot; log P ( w &CenterDot; f ) P ( w ) &CenterDot; P ( f )
其中,可以使用诸如语料库中的其各自概率来确定特征概率P(f)和字概率P(w)(例如,相对频率)。仅作为实例,图6是列出了对于从网络语料库中生成的词语“communities”的示例性特征和相应概率的表。图6中示出的特征向量表列出了字“communities”的特征子集以及特征与字“communities”之间的概率和交互信息。注意,特征向量可能相当大。例如,从语料库中提取的字communities的全部特征集包括大约2000项。
再次参照图4,在方框66处,将使用特征向量中的特征值,将两个字或短语w1和w2之间的相似性测量值或值sim确定为其特征向量之间角的余弦。具体地,两个术语或字w1和w2之间的相似性sim可以被定义为:
sim ( w 1 , w 2 ) = &Sigma; i f 1 i f 2 i &Sigma; i f 1 i 2 &Sigma; i f 2 i 2
其中,w1和w2的特征向量分别由(f11,f12…,f1n)和(f21,f22…,f2n)表示。
然后,在方框68处,根据对于词语的每个字对的相似值构建相似矩阵,并可以通过用相似词语替代查询词语来生成建议的更改/细分查询。具体地,例如,相似值可用于确定潜在建议查询的分数。注意,可周期性地重新计算相似矩阵,和/或可以将词语的相似值(例如,新近识别的那些词语)添加到矩阵。图7是用于代替词语以生成建议的更改/细分查询的示例性的相似矩阵。
现在,将参照图8至图11更详细地描述用于生成在应用现存的词语替代查询更改/细分方法中使用的相似矩阵的示例性方法、用于生成在应用扩展/缩略查询更改/细分方法中使用的复合字对的扩展/缩略表的示例性方法。图8是示出用于构建复合字对的提取/缩略表的示例性过程70的流程图。如上所述注意,扩展/缩略表中的每项都是一对复合字,该复合字对中,一个复合字是另一个的子串,使得如果查询包含扩展/缩略表的项中复合字对中的一个复合字,则该复合字可以被在延伸的网格中的复合字对项中的其它复合字替代。理想地,提取/缩略表中的每个复合字都应当是有意义的短语。仅作为实例,复合字对可以是上海和上海市,或者电视和电视机。如上所注意的,复合字对可以包括,例如,多义词语及其清晰的上下文(例如,Amazon和Amazon rain forest)、人名及其对应的活动、词语的属性、概念的细分、演员、作者、产品、法人地位等。
在方框71处,查询日志(或用户输入的另一数据库)中的查询可以被分割成使查询的全部概率最大化的字序列。具体地,因为汉字并不需要用空格或其它分隔符明确地描述,使得查询可以是没有分隔符的汉语字符串,所以分割器可以用于将字符序列分割成字序列。字序列可以使字概率的积是所有可能字符序列段中的最大序列。显然,不需要对在相邻字之间存在清晰描述的某种语言(例如,英语)执行方框71。
在方框72处,为了识别复合字/短语,识别常用字序列或n元(gram)(n个序列的序列)。同样在方框72处,对字序列中所有相邻字对是常用n元的字序列进行计数,以识别任意长度的常用字序列。注意,常用字序列可以是或者不是复合字。例如,某些常用字序列可以是复合字,而其它字序列可以是非短语或非复合字序列。
在方框73处,通过需要复合字/短语在最少数量查询的开始以及结尾处出现,来识别非短语序列(但在相同的查询中不是必须的)。查询的最小数量可以是大于或等于1的任意数,但通常远大于1,例如,50或100。
在方框74处,对于语料库(例如,网络语料库)中的每个n元特征向量,与对于特征向量中的每个特征f的计数一起构建。在方框75处,特征向量中的每个特征f的值可以被确定为在n元和特征f之间的点态交互信息MI。在方框76处,可以利用特征向量中的特征值,将两个n元之间的相似测量值或值sim确定为其特征向量之间角的余弦。注意,方框74、75、和76分别类似于如参照图4描述的过程60的方框62、64、和66。因此,为了清楚目的,这里将不被重复描述在某种程度上与它们类似的描述。
然后,在方框77处,扩展/缩略表可被构建为复合字对,在该复合字对中,一个复合字是另一个复合字的子串。此外,还可以确定多个复合字的计数并将其存储在扩展/缩略表中。
图9是示出在替代查询中的复合字以生成建议的更改/细分查询中的扩展/缩略表中的一些示例性项的表格。如图所示,扩展/缩略表的每一行都包含两个复合字或字序列,其中,一个复合字是另一个复合字的子串。例如,每个复合字还与一个计数(或其它频率值)相关,该计数可以根据查询日志或一些其它用户输入数据库来确定。计数可被用作取舍点(cutoff)以降低数据库的大小,和/或例如,通过使用log(计数)可以至少部分地用来确定词语或复合字的权重。如上所述,参照图2A和2B,一旦通过替换原始查询中的词语和/或通过添加/删除原始查询中的词语来延伸查询网格,则根据扩充网格来确定N个最佳查询的路径和分数,作为潜在建议查询。图10是示出了用于确定建议的更改/细分查询的分数(例如,扩充查询网格中的路径)的示例性过程80的流程图。
查询建议的确定可被视为在当前查询会话中基于在先查询的预测问题。给定当前搜索会话中的查询历史Q1、Q2,…,Qn-1,可以进行关于用户最可能选择的下一查询Qn是什么的预测。建议或预测的下一查询Qn应当不仅与当前会话中的查询历史Q1、Q2,…,Qn-1关联,还应当产生好的搜索结果。例如,搜索结果有多好的测量值可以是单击位置(用户选择的搜索结果的位置)和单击持续时间(用户停留在所选的搜索结果页面多长时间)的函数。
在一个实施例中,每个潜在建议查询的分数可以被确定为目标函数F的值:
F(Q,Q1,…,Qn-1)=Rel(Q,Q1,...,Qn-1)*Click(Q)*Position(Q);
其中,
Rel(Q,Q1,...,Qn-1)是查询历史Q1、Q2,…,Qn-1和候选建议查询Q之间的关联性;
Click(Q)是用户将选择候选建议查询Q的概率;以及
Position(Q)是将要被单击的候选建议查询Q的搜索结果的位置。
如上参照图2所述,一个或多个建议或预测的下一查询Q可以被提供给用户。因此,最佳的N个建议下一查询(例如,扩充查询网格中的路径)是具有最高目标函数值的N个查询,且最佳(例如,最可能的)的建议下一查询可以被表示为使目标函数F的值最大化的查询:
Qn=ArgMax_Q{F(Q,Q1,...,Qn-1)}
在图10的流程图中示出了每个潜在建议或预测的下一查询Q 80的分数的确定。在方框82中,利用查询中的调整词语的相关性来确定当前会话中的用户查询历史Q1、Q2,…,Qn-1和预测的查询Q之间的关联性Rel(Q,Q1,...,Qn-1)。具体地,为了估计关联函数Rel,识别原始查询Q中的词语或核心项。利用核心项之间的相关性,能够从其核心项的相关性中推导出两个查询Q和Q’之间的关联性Rel(Q,Q’)。具体地,关联性Rel(Q,Q’)可以被表示为:
Rel(Q,Q′)=Max_f Prod_{i=1}^k Cor(Ti,Ti′)*w(Ti)
其中:
调整函数(alignment function)f=f(T1,T2,…Tk,T1’,T2’,…,Tk’)进行与相关查询Q和Q’的词语映射,例如,图11中示出的实例,在{T1,…,Tk,e}和{T1’,…,Tk’,e}之间的映射;
Cor(Ti,Ti’)是词语Ti,Ti’之间的相关性,且是实数向量;
Q=T1,T2,…,Tk(在任意词语Ti都可以是空词语e的查询Q中的核心项);
Q’=T1’,T2’,…Tk’(在任意词语Ti’都可以是空词语e的查询Q’中的核心项);以及
w(Ti)是词语Ti的重要度,例如,Ti的TF/IDF,其中,TF表示词语频率(例如,词语的计数)以及IDF表示反向(inverted)文档频率。
接下来,在方框84处,例如,根据单击持续时间或归一化的单击持续时间来确定用户将选择查询Q的概率Click(Q)。在方框86处,例如,根据单击位置、归一化的单击位置、或反向单击位置来确定预测查询Q的位置的分数Position(Q)。最后,在方框88处,根据如上所述的方框82、方框84、和方框86的结果来确定潜在建议或预测的下一查询Q的目标函数F的值。
参照图12,更详细地描述在确定两个查询之间的关联性中使用的相关值Cor(Ti,Ti’)的确定。具体地,图12是示出用于生成词语对或核心项T、T’之间的相关值的示例性过程90的流程图。在方框92处,可以使用交互信息从语料库(例如,网络语料库)和用户查询中识别出新的核心项。在方框92的一个示意性实施中,如果Motorola是一个项,且“MotorolaAnnounced”、“Motorola cell phone”、和“buy Motorola”以及“NokiaAnnounced”、“Nokia cell phone”、和“buy Nokia”处于语料库中,则Nokia也被识别为一个项。注意,尽管现用的字典能够提供传统的核心项,但许多新的核心项常常被引入到词汇表中。新核心项的实例包括恰当的名称(例如,人名和公司名),以及多种其它新词和短语(例如,产品模型、电影、和歌曲名等)。
在方框94处,例如,可以使用查询日志、网页和链接锚文本来确定核心项对T、T’之间的相关值。两个核心项T1和T2之间的相关性可以被定义为实数向量的函数:
Cor(T1,T2)=f(w1,w2,…,wn)
其中,w1,w2,…,wn是某些预定关系的权重。预定关系的实例包括(1)同义词、缩写词和反义词,(2)复合短语,例如,上海对应上海市、电视对应电视机,(3)相同语法/语义类中的词语,例如,Toyota和Honda,(4)多义词语及其清楚的上下文,(5)人名及其相应的活动,例如,Oprah和现场访谈主持人,(6)词语的属性,例如,计算机和存储器,(7)概念的细分,例如,Amazon和Amazon River、Amazon Rain Forrest、和Amazon.com,(8)电影-演员、书-作者、公司-产品、人-职位等,例如,Tom Hanks和Forrest Gump、以及Bill Gates和CEO。
在方框96中,相关向量Cor(T1,T2)的值可以被归一化为[0-1]。
用于生成更改或细分用户输入的系统和方法可以建议多个查询,该查询可能被用户使用和/或生成用户可能选择的最佳结果。该系统和方法定量地测量两个查询之间的相关性。显然,两个查询不需要具有任何共同的词语或一致的同义词。例如,与原始查询(例如,汉语)有关的查询,对于歌曲“Now and Forever”的mp3文件“‘Now and Forever’mp3”,可以包括例如“CoCo Lee”(歌手)以及相同艺术家的其它歌曲或唱片集。因此,建议的查询可以不是简单的原始查询的扩展而是具有更好搜索结果(例如,用户最可能选择的搜索结果)的查询。在一个实例中,建议的查询可以包括实现消除了查询意义多义性的查询,其中,原始查询是简短且多义的。作为另一个实例,建议的查询可以包括将原始查询分成多个较短查询的查询,其中,原始查询可以是较长和/或包含彼此独立的词语。
虽然本文描述和示出了本发明的多个示例性实施例,但应当理解,仅在不背离本发明的精神和范围内,对其进行示出和更改。因此,本发明的范围将仅根据下列可被修改的权利要求来限定,其中,每个权利要求都与作为本发明的一个实施例的本“具体实施方式”明确相结合。

Claims (10)

1.一种用于生成替代用户输入的计算机实现的方法,包括:
接收原始用户输入,所述原始用户输入具有至少一个核心词语;
生成一个或多个替代用户输入,包括使用相似词语的相似性矩阵将所述原始用户输入中的核心词语替换为第二词语,所述相似词语的相似性矩阵包括在所述核心词语和所述第二词语之间的相似性值,所述相似性矩阵是通过以下操作来构建的:
构建出现在语料库中的一个或多个词语中的每个词语的特征矢量,其中所述一个或多个词语包括所述核心词语,并且其中该特征矢量包括该特征矢量中的每个特征的计数;
针对所述一个或多个词语中的每个词语的特征矢量,将该特征矢量中的每个特征的值确定为该特征和该词语之间的点态交互信息;
将在所述核心词语的第一特征矢量和所述语料库中出现的所述一个或多个词语的每个相应特征矢量之间的相应相似性测度确定为在所述第一特征矢量和该相应特征矢量之间的角的余弦;以及
使用所确定的在所述核心词语的第一特征矢量和所述语料库中出现的所述一个或多个词语的相应特征矢量之间的所述相应相似性测度来构建所述相似性矩阵;
确定所述一个或多个替代用户输入中的每一个替代用户输入的相应的分数,其中该分数基于该替代用户输入与所述原始用户输入之间的相关性;
选择其分数至少是所述原始用户输入的分数的一个或多个替代用户输入;以及
将所选择的所述一个或多个替代用户输入作为所述原始用户输入的替选存储在查询细化高速缓冲存储器中。
2.根据权利要求1所述的方法,还包括:
确定所述原始用户输入出现在所述查询细化高速缓冲存储器中;以及
响应于所述原始用户输入提供所述一个或多个相关的替代用户输入作为查询建议。
3.根据权利要求1所述的方法,还包括:
对于所述一个或多个词语中的每个词语的特征矢量的每个特征,计算所述核心词语和该特征之间的点态交互信息并且将所述核心词语和该特征之间的所述点态交互信息用作所述特征的值。
4.根据权利要求1所述的方法,还包括:
从用户输入日志或用户输入数据库或两者生成扩展/缩略表,其中所述扩展/缩略表包括表示字序列出现的频率值。
5.根据权利要求4所述的方法,其中生成所述扩展/缩略表包括确定频繁出现的字序列,滤出非短语字序列,以及将计数与词语序列相关联作为所述频率值。
6.一种用于生成替代用户输入的系统,包括:
查询细化高速缓冲存储器,其将替代用户输入存储为原始用户输入的替选;以及
建议/细分服务器设备,其被配置为接收原始用户输入,所述原始用户输入具有至少一个核心词语,并且执行如下操作:
生成一个或多个替代用户输入,包括使用相似词语的相似性矩阵将所述原始用户输入中的核心词语替换为第二词语,所述相似词语的相似性矩阵包括在所述核心词语和所述第二词语之间的相似性值,所述相似性矩阵是通过以下操作来构建的:
构建出现在语料库中的一个或多个词语中的每个词语的特征矢量,其中所述一个或多个词语包括所述核心词语,并且其中所述特征矢量包括所述特征矢量中的每个特征的计数;
针对所述一个或多个词语中的每个词语的特征矢量,将该特征矢量中的每个特征的值确定为该特征和该词语之间的点态交互信息;
将在所述核心词语的第一特征矢量和所述语料库中出现的所述一个或多个词语的每个相应特征矢量之间的相应相似性测度确定为在所述特征矢量之间的角的余弦;以及
使用所确定的在所述核心词语的第一特征矢量和所述语料库中出现的所述一个或多个词语的相应特征矢量之间的所述相应相似性测度来构建所述相似性矩阵;
确定所述一个或多个替代用户输入中的每一个替代用户输入的相应的分数,其中该分数基于该替代用户输入与所述原始用户输入之间的相关性;
选择其分数至少是所述原始用户输入的分数的一个或多个替代用户输入;以及
将所选择的所述一个或多个替代用户输入作为所述原始用户输入的替选存储在所述查询细化高速缓冲存储器中。
7.根据权利要求6所述的系统,其中所述建议/细分服务器设备进一步被配置为执行如下操作:
确定所述原始用户输入出现在所述查询细化高速缓冲存储器中;以及
响应于所述原始用户输入提供所述一个或多个相关的替代用户输入作为查询建议。
8.根据权利要求6所述的系统,其中所述建议/细分服务器设备进一步被配置为执行如下操作:
对于所述一个或多个词语中的每个词语的特征矢量的每个特征,计算所述核心词语和该特征之间的点态交互信息并且将所述核心词语和该特征之间的所述点态交互信息用作该特征的值。
9.根据权利要求6所述的系统,其中所述建议/细分服务器设备进一步被配置为执行如下操作:
从用户输入日志或用户输入数据库或两者生成扩展/缩略表,其中所述扩展/缩略表包括表示字序列出现的频率值。
10.根据权利要求9所述的系统,其中生成所述扩展/缩略表包括确定频繁出现的字序列,滤出非短语字序列,以及将计数与词语序列相关联作为所述频率值。
CN201210199408.7A 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入的系统和方法 Active CN102945237B (zh)

Applications Claiming Priority (3)

Application Number Priority Date Filing Date Title
US11/122,873 US8438142B2 (en) 2005-05-04 2005-05-04 Suggesting and refining user input based on original user input
US11/122,873 2005-05-04
CNA2006800219402A CN101297291A (zh) 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入

Related Parent Applications (1)

Application Number Title Priority Date Filing Date
CNA2006800219402A Division CN101297291A (zh) 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入

Publications (2)

Publication Number Publication Date
CN102945237A CN102945237A (zh) 2013-02-27
CN102945237B true CN102945237B (zh) 2016-08-10

Family

ID=36781555

Family Applications (2)

Application Number Title Priority Date Filing Date
CN201210199408.7A Active CN102945237B (zh) 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入的系统和方法
CNA2006800219402A Pending CN101297291A (zh) 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入

Family Applications After (1)

Application Number Title Priority Date Filing Date
CNA2006800219402A Pending CN101297291A (zh) 2005-05-04 2006-05-04 基于原始用户输入建议和细分用户输入

Country Status (6)

Country Link
US (3) US8438142B2 (zh)
EP (1) EP1877939A1 (zh)
JP (1) JP5203934B2 (zh)
KR (1) KR101389148B1 (zh)
CN (2) CN102945237B (zh)
WO (1) WO2006121702A1 (zh)

Families Citing this family (215)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US8590013B2 (en) 2002-02-25 2013-11-19 C. S. Lee Crawford Method of managing and communicating data pertaining to software applications for processor-based devices comprising wireless communication circuitry
US7346839B2 (en) 2003-09-30 2008-03-18 Google Inc. Information retrieval based on historical data
US8082264B2 (en) 2004-04-07 2011-12-20 Inquira, Inc. Automated scheme for identifying user intent in real-time
US7747601B2 (en) 2006-08-14 2010-06-29 Inquira, Inc. Method and apparatus for identifying and classifying query intent
US8612208B2 (en) 2004-04-07 2013-12-17 Oracle Otc Subsidiary Llc Ontology for use with a system, method, and computer readable medium for retrieving information and response to a query
US7765178B1 (en) * 2004-10-06 2010-07-27 Shopzilla, Inc. Search ranking estimation
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7647312B2 (en) * 2005-05-12 2010-01-12 Microsoft Corporation System and method for automatic generation of suggested inline search terms
US7634462B2 (en) * 2005-08-10 2009-12-15 Yahoo! Inc. System and method for determining alternate search queries
US7752220B2 (en) * 2005-08-10 2010-07-06 Yahoo! Inc. Alternative search query processing in a term bidding system
US8027879B2 (en) 2005-11-05 2011-09-27 Jumptap, Inc. Exclusivity bidding for mobile sponsored content
US8209344B2 (en) 2005-09-14 2012-06-26 Jumptap, Inc. Embedding sponsored content in mobile applications
US10911894B2 (en) 2005-09-14 2021-02-02 Verizon Media Inc. Use of dynamic content generation parameters based on previous performance of those parameters
US9471925B2 (en) 2005-09-14 2016-10-18 Millennial Media Llc Increasing mobile interactivity
US8364540B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Contextual targeting of content using a monetization platform
US8131271B2 (en) 2005-11-05 2012-03-06 Jumptap, Inc. Categorization of a mobile user profile based on browse behavior
US7577665B2 (en) 2005-09-14 2009-08-18 Jumptap, Inc. User characteristic influenced search results
US8666376B2 (en) 2005-09-14 2014-03-04 Millennial Media Location based mobile shopping affinity program
US8195133B2 (en) 2005-09-14 2012-06-05 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US20070198485A1 (en) * 2005-09-14 2007-08-23 Jorey Ramer Mobile search service discovery
US10038756B2 (en) 2005-09-14 2018-07-31 Millenial Media LLC Managing sponsored content based on device characteristics
US7752209B2 (en) 2005-09-14 2010-07-06 Jumptap, Inc. Presenting sponsored content on a mobile communication facility
US8832100B2 (en) 2005-09-14 2014-09-09 Millennial Media, Inc. User transaction history influenced search results
US7702318B2 (en) 2005-09-14 2010-04-20 Jumptap, Inc. Presentation of sponsored content based on mobile transaction event
US8311888B2 (en) 2005-09-14 2012-11-13 Jumptap, Inc. Revenue models associated with syndication of a behavioral profile using a monetization platform
US8364521B2 (en) 2005-09-14 2013-01-29 Jumptap, Inc. Rendering targeted advertisement on mobile communication facilities
US8229914B2 (en) 2005-09-14 2012-07-24 Jumptap, Inc. Mobile content spidering and compatibility determination
US20110313853A1 (en) 2005-09-14 2011-12-22 Jorey Ramer System for targeting advertising content to a plurality of mobile communication facilities
US8503995B2 (en) 2005-09-14 2013-08-06 Jumptap, Inc. Mobile dynamic advertisement creation and placement
US7912458B2 (en) 2005-09-14 2011-03-22 Jumptap, Inc. Interaction analysis and prioritization of mobile content
US8805339B2 (en) 2005-09-14 2014-08-12 Millennial Media, Inc. Categorization of a mobile user profile based on browse and viewing behavior
US8302030B2 (en) 2005-09-14 2012-10-30 Jumptap, Inc. Management of multiple advertising inventories using a monetization platform
US9058406B2 (en) 2005-09-14 2015-06-16 Millennial Media, Inc. Management of multiple advertising inventories using a monetization platform
US9703892B2 (en) 2005-09-14 2017-07-11 Millennial Media Llc Predictive text completion for a mobile communication facility
US8688671B2 (en) 2005-09-14 2014-04-01 Millennial Media Managing sponsored content based on geographic region
US8812526B2 (en) 2005-09-14 2014-08-19 Millennial Media, Inc. Mobile content cross-inventory yield optimization
US8238888B2 (en) 2006-09-13 2012-08-07 Jumptap, Inc. Methods and systems for mobile coupon placement
US10592930B2 (en) 2005-09-14 2020-03-17 Millenial Media, LLC Syndication of a behavioral profile using a monetization platform
US8532633B2 (en) 2005-09-14 2013-09-10 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
US8156128B2 (en) 2005-09-14 2012-04-10 Jumptap, Inc. Contextual mobile content placement on a mobile communication facility
US8819659B2 (en) 2005-09-14 2014-08-26 Millennial Media, Inc. Mobile search service instant activation
US8989718B2 (en) 2005-09-14 2015-03-24 Millennial Media, Inc. Idle screen advertising
US7660581B2 (en) 2005-09-14 2010-02-09 Jumptap, Inc. Managing sponsored content based on usage history
US8660891B2 (en) 2005-11-01 2014-02-25 Millennial Media Interactive mobile advertisement banners
US8615719B2 (en) 2005-09-14 2013-12-24 Jumptap, Inc. Managing sponsored content for delivery to mobile communication facilities
US7769764B2 (en) 2005-09-14 2010-08-03 Jumptap, Inc. Mobile advertisement syndication
US7860871B2 (en) 2005-09-14 2010-12-28 Jumptap, Inc. User history influenced search results
US8290810B2 (en) 2005-09-14 2012-10-16 Jumptap, Inc. Realtime surveying within mobile sponsored content
US7676394B2 (en) 2005-09-14 2010-03-09 Jumptap, Inc. Dynamic bidding and expected value
US8103545B2 (en) 2005-09-14 2012-01-24 Jumptap, Inc. Managing payment for sponsored content presented to mobile communication facilities
US9201979B2 (en) 2005-09-14 2015-12-01 Millennial Media, Inc. Syndication of a behavioral profile associated with an availability condition using a monetization platform
US9076175B2 (en) 2005-09-14 2015-07-07 Millennial Media, Inc. Mobile comparison shopping
US8312021B2 (en) * 2005-09-16 2012-11-13 Palo Alto Research Center Incorporated Generalized latent semantic analysis
US8175585B2 (en) 2005-11-05 2012-05-08 Jumptap, Inc. System for targeting advertising content to a plurality of mobile communication facilities
US8571999B2 (en) 2005-11-14 2013-10-29 C. S. Lee Crawford Method of conducting operations for a social network application including activity list generation
US8903810B2 (en) 2005-12-05 2014-12-02 Collarity, Inc. Techniques for ranking search results
US8429184B2 (en) * 2005-12-05 2013-04-23 Collarity Inc. Generation of refinement terms for search queries
US20080126079A1 (en) * 2006-01-20 2008-05-29 Research In Motion Limited Handheld electronic device with automatic text generation
US7676460B2 (en) * 2006-03-03 2010-03-09 International Business Machines Corporation Techniques for providing suggestions for creating a search query
US7921099B2 (en) 2006-05-10 2011-04-05 Inquira, Inc. Guided navigation system
US8781813B2 (en) 2006-08-14 2014-07-15 Oracle Otc Subsidiary Llc Intent management tool for identifying concepts associated with a plurality of users' queries
US7921154B2 (en) * 2006-08-17 2011-04-05 Flash Widgets, L.L.C. System and method of live data search on a mobile device
KR100837750B1 (ko) * 2006-08-25 2008-06-13 엔에이치엔(주) 성조를 이용하여 중국어를 검색하는 방법 및 상기 방법을수행하는 시스템
US7747607B2 (en) * 2006-09-21 2010-06-29 Yahoo! Inc. Determining logically-related sub-strings of a string
US9037581B1 (en) 2006-09-29 2015-05-19 Google Inc. Personalized search result ranking
US8442972B2 (en) 2006-10-11 2013-05-14 Collarity, Inc. Negative associations for search results ranking and refinement
US7739264B2 (en) * 2006-11-15 2010-06-15 Yahoo! Inc. System and method for generating substitutable queries on the basis of one or more features
US8095476B2 (en) * 2006-11-27 2012-01-10 Inquira, Inc. Automated support scheme for electronic forms
US8024319B2 (en) * 2007-01-25 2011-09-20 Microsoft Corporation Finite-state model for processing web queries
US20080228699A1 (en) 2007-03-16 2008-09-18 Expanse Networks, Inc. Creation of Attribute Combination Databases
US7917528B1 (en) * 2007-04-02 2011-03-29 Google Inc. Contextual display of query refinements
US8074234B2 (en) * 2007-04-16 2011-12-06 Microsoft Corporation Web service platform for keyword technologies
KR20080096005A (ko) * 2007-04-26 2008-10-30 엔에이치엔(주) 키워드 제공 범위에 따라 키워드 제공 방법 및 그 시스템
JP2009031931A (ja) * 2007-07-25 2009-02-12 Univ Waseda 検索語クラスタリング装置、検索語クラスタリング方法、検索語クラスタリングプログラム及び記録媒体
US8086441B1 (en) * 2007-07-27 2011-12-27 Sonicwall, Inc. Efficient string search
US20090043752A1 (en) 2007-08-08 2009-02-12 Expanse Networks, Inc. Predicting Side Effect Attributes
US7822732B2 (en) * 2007-08-13 2010-10-26 Chandra Bodapati Method and system to enable domain specific search
CN101159967B (zh) * 2007-10-29 2011-08-31 中国移动通信集团设计院有限公司 一种将路测数据用于传播模型校正的方法及装置
US7945525B2 (en) * 2007-11-09 2011-05-17 International Business Machines Corporation Methods for obtaining improved text similarity measures which replace similar characters with a string pattern representation by using a semantic data tree
US8725756B1 (en) * 2007-11-12 2014-05-13 Google Inc. Session-based query suggestions
US8019748B1 (en) 2007-11-14 2011-09-13 Google Inc. Web search refinement
US7953746B1 (en) * 2007-12-07 2011-05-31 Google Inc. Contextual query revision
US10176827B2 (en) * 2008-01-15 2019-01-08 Verint Americas Inc. Active lab
US8224845B2 (en) * 2008-01-21 2012-07-17 International Business Machines Corporation Transaction prediction modeling method
US20090187540A1 (en) * 2008-01-22 2009-07-23 Microsoft Corporation Prediction of informational interests
US8122011B1 (en) 2008-03-12 2012-02-21 Google Inc. Identifying sibling queries
US7958136B1 (en) * 2008-03-18 2011-06-07 Google Inc. Systems and methods for identifying similar documents
US8832135B2 (en) * 2008-05-02 2014-09-09 Verint Systems, Ltd. Method and system for database query term suggestion
JP2010003015A (ja) * 2008-06-18 2010-01-07 Hitachi Software Eng Co Ltd 文書検索システム
US8438178B2 (en) 2008-06-26 2013-05-07 Collarity Inc. Interactions among online digital identities
US8521731B2 (en) 2008-07-09 2013-08-27 Yahoo! Inc. Systems and methods for query expansion in sponsored search
US8200509B2 (en) 2008-09-10 2012-06-12 Expanse Networks, Inc. Masked data record access
US7917438B2 (en) * 2008-09-10 2011-03-29 Expanse Networks, Inc. System for secure mobile healthcare selection
US9092517B2 (en) * 2008-09-23 2015-07-28 Microsoft Technology Licensing, Llc Generating synonyms based on query log data
JP5387577B2 (ja) * 2008-09-25 2014-01-15 日本電気株式会社 情報分析装置、情報分析方法、及びプログラム
US8156111B2 (en) * 2008-11-24 2012-04-10 Yahoo! Inc. Identifying and expanding implicitly temporally qualified queries
US10489434B2 (en) * 2008-12-12 2019-11-26 Verint Americas Inc. Leveraging concepts with information retrieval techniques and knowledge bases
US8386519B2 (en) 2008-12-30 2013-02-26 Expanse Networks, Inc. Pangenetic web item recommendation system
US8108406B2 (en) 2008-12-30 2012-01-31 Expanse Networks, Inc. Pangenetic web user behavior prediction system
US20100169262A1 (en) * 2008-12-30 2010-07-01 Expanse Networks, Inc. Mobile Device for Pangenetic Web
US9659257B2 (en) * 2009-01-12 2017-05-23 Alphatrac, Inc. Predictive cueing
CN101464897A (zh) * 2009-01-12 2009-06-24 阿里巴巴集团控股有限公司 一种词匹配及信息查询方法及装置
US9330165B2 (en) * 2009-02-13 2016-05-03 Microsoft Technology Licensing, Llc Context-aware query suggestion by mining log data
JP5129194B2 (ja) * 2009-05-20 2013-01-23 ヤフー株式会社 商品検索装置
US8943094B2 (en) * 2009-09-22 2015-01-27 Next It Corporation Apparatus, system, and method for natural language processing
US8494852B2 (en) 2010-01-05 2013-07-23 Google Inc. Word-level correction of speech input
US8875038B2 (en) 2010-01-19 2014-10-28 Collarity, Inc. Anchoring for content synchronization
WO2011090036A1 (ja) * 2010-01-19 2011-07-28 日本電気株式会社 動向情報検索装置、動向情報検索方法および記録媒体
CN102193939B (zh) * 2010-03-10 2016-04-06 阿里巴巴集团控股有限公司 信息导航的实现方法、信息导航服务器和信息处理系统
US9165065B2 (en) * 2010-03-26 2015-10-20 Paypal Inc. Terminology management database
US20110258212A1 (en) * 2010-04-14 2011-10-20 Microsoft Corporation Automatic query suggestion generation using sub-queries
US9600566B2 (en) 2010-05-14 2017-03-21 Microsoft Technology Licensing, Llc Identifying entity synonyms
US20110314001A1 (en) * 2010-06-18 2011-12-22 Microsoft Corporation Performing query expansion based upon statistical analysis of structured data
US8751520B1 (en) * 2010-06-23 2014-06-10 Google Inc. Query suggestions with high utility
US8560562B2 (en) * 2010-07-22 2013-10-15 Google Inc. Predictive query suggestion caching
EP2423830A1 (de) 2010-08-25 2012-02-29 Omikron Data Quality GmbH Verfahren zum Suchen in einer Vielzahl von Datensätzen und Suchmaschine
CN102385577A (zh) * 2010-08-27 2012-03-21 腾讯科技(深圳)有限公司 搜索方法和系统
US8838453B2 (en) * 2010-08-31 2014-09-16 Red Hat, Inc. Interactive input method
RU2582480C2 (ru) * 2010-09-27 2016-04-27 Эксонмобил Апстрим Рисерч Компани Кодирование одновременных источников и разделение источников в качестве практического решения по инверсии полного волнового поля
US9122744B2 (en) 2010-10-11 2015-09-01 Next It Corporation System and method for providing distributed intelligent assistance
BR112013009616B1 (pt) * 2010-10-21 2020-12-15 Qualcomm Incorporated. Método implementado por computador para iniciar uma ação em um dispositivo de computação móvel responsivo a receber dados de texto de pesquisa e meio de armazenagem lido por computador
US8448089B2 (en) 2010-10-26 2013-05-21 Microsoft Corporation Context-aware user input prediction
WO2012063770A1 (ja) 2010-11-10 2012-05-18 楽天株式会社 関連語登録装置、情報処理装置、関連語登録方法、関連語登録装置用プログラム、および、記録媒体
US9098569B1 (en) * 2010-12-10 2015-08-04 Amazon Technologies, Inc. Generating suggested search queries
CN102567408B (zh) 2010-12-31 2014-06-04 阿里巴巴集团控股有限公司 推荐搜索关键词的方法和装置
US20120179705A1 (en) * 2011-01-11 2012-07-12 Microsoft Corporation Query reformulation in association with a search box
US20120185332A1 (en) * 2011-01-14 2012-07-19 Google Inc. Serving Advertisements Based on Article Availability
US20120233140A1 (en) * 2011-03-09 2012-09-13 Microsoft Corporation Context-aware query alteration
US20120265784A1 (en) * 2011-04-15 2012-10-18 Microsoft Corporation Ordering semantic query formulation suggestions
WO2012143839A1 (en) * 2011-04-19 2012-10-26 Greyling Abraham Carel A computerized system and a method for processing and building search strings
EP3115913B1 (en) * 2011-05-10 2018-03-14 Uber Technologies, Inc. Systems and methods for performing search and retrieval of electronic documents using a big index
US8972240B2 (en) * 2011-05-19 2015-03-03 Microsoft Corporation User-modifiable word lattice display for editing documents and search queries
WO2012159245A1 (en) * 2011-05-20 2012-11-29 Microsoft Corporation Displaying key pinyins
CN102262660B (zh) * 2011-07-15 2013-05-29 北京百度网讯科技有限公司 一种计算机实现的用于获取搜索结果的方法与设备
US9058362B2 (en) * 2011-07-26 2015-06-16 24/7 Customer, Inc. Method and apparatus for predictive enrichment of search in an enterprise
CN102306171B (zh) * 2011-08-22 2016-07-06 百度在线网络技术(北京)有限公司 一种用于提供网络访问建议和网络搜索建议的方法与设备
US20130054632A1 (en) * 2011-08-30 2013-02-28 Google Inc. Caching Input Suggestions
WO2013046838A1 (ja) * 2011-09-29 2013-04-04 楽天株式会社 情報処理装置、情報処理方法、情報処理装置用プログラム、および、記録媒体
US9652556B2 (en) 2011-10-05 2017-05-16 Google Inc. Search suggestions based on viewport content
US10013152B2 (en) 2011-10-05 2018-07-03 Google Llc Content selection disambiguation
CN102368262B (zh) * 2011-10-14 2013-05-29 北京百度网讯科技有限公司 一种提供与查询序列相对应的搜索建议的方法与设备
US9189550B2 (en) * 2011-11-17 2015-11-17 Microsoft Technology Licensing, Llc Query refinement in a browser toolbar
US9836177B2 (en) 2011-12-30 2017-12-05 Next IT Innovation Labs, LLC Providing variable responses in a virtual-assistant environment
CN102419776A (zh) * 2011-12-31 2012-04-18 北京百度网讯科技有限公司 一种满足用户多维度搜索需求的方法和设备
US9152698B1 (en) 2012-01-03 2015-10-06 Google Inc. Substitute term identification based on over-represented terms identification
US9141672B1 (en) 2012-01-25 2015-09-22 Google Inc. Click or skip evaluation of query term optionalization rule
WO2013124519A1 (en) * 2012-02-22 2013-08-29 Nokia Corporation Predictive service access
CN104246756B (zh) * 2012-02-22 2019-05-28 诺基亚技术有限公司 用于提供用于控制系统的预测的系统和方法
US8745019B2 (en) 2012-03-05 2014-06-03 Microsoft Corporation Robust discovery of entity synonyms using query logs
US20130238636A1 (en) * 2012-03-06 2013-09-12 Salesforce.Com, Inc. Suggesting access-controlled related queries
US9223537B2 (en) 2012-04-18 2015-12-29 Next It Corporation Conversation user interface
US11023520B1 (en) 2012-06-01 2021-06-01 Google Llc Background audio identification for query disambiguation
US10032131B2 (en) 2012-06-20 2018-07-24 Microsoft Technology Licensing, Llc Data services for enterprises leveraging search system data assets
US9594831B2 (en) 2012-06-22 2017-03-14 Microsoft Technology Licensing, Llc Targeted disambiguation of named entities
CN103577401A (zh) * 2012-07-18 2014-02-12 腾讯科技(深圳)有限公司 一种移动终端搜索方法及系统
CN103577416B (zh) * 2012-07-20 2017-09-22 阿里巴巴集团控股有限公司 扩展查询方法及系统
US9128915B2 (en) * 2012-08-03 2015-09-08 Oracle International Corporation System and method for utilizing multiple encodings to identify similar language characters
US9135912B1 (en) * 2012-08-15 2015-09-15 Google Inc. Updating phonetic dictionaries
US9229924B2 (en) 2012-08-24 2016-01-05 Microsoft Technology Licensing, Llc Word detection and domain dictionary recommendation
US9536049B2 (en) 2012-09-07 2017-01-03 Next It Corporation Conversational virtual healthcare assistant
US9146966B1 (en) 2012-10-04 2015-09-29 Google Inc. Click or skip evaluation of proximity rules
US9471881B2 (en) * 2013-01-21 2016-10-18 International Business Machines Corporation Transductive feature selection with maximum-relevancy and minimum-redundancy criteria
US10102333B2 (en) 2013-01-21 2018-10-16 International Business Machines Corporation Feature selection for efficient epistasis modeling for phenotype prediction
US9218420B1 (en) 2013-02-26 2015-12-22 Google Inc. Detecting new businesses with unrecognized query terms
US9619046B2 (en) 2013-02-27 2017-04-11 Facebook, Inc. Determining phrase objects based on received user input context information
US10445115B2 (en) * 2013-04-18 2019-10-15 Verint Americas Inc. Virtual assistant focused user interfaces
US9122376B1 (en) * 2013-04-18 2015-09-01 Google Inc. System for improving autocompletion of text input
KR101332757B1 (ko) * 2013-05-16 2013-11-25 주식회사 큐키 삭제키 입력 없이 단어 또는 문자열을 수정하는 방법 및 이를 구현한 장치
US9256687B2 (en) 2013-06-28 2016-02-09 International Business Machines Corporation Augmenting search results with interactive search matrix
US9342592B2 (en) * 2013-07-29 2016-05-17 Workday, Inc. Method for systematic mass normalization of titles
US9886950B2 (en) * 2013-09-08 2018-02-06 Intel Corporation Automatic generation of domain models for virtual personal assistants
US11210705B1 (en) * 2013-10-18 2021-12-28 United Services Automobile Association (Usaa) System and method for transmitting direct advertising information to an augmented reality device
CN106164889A (zh) * 2013-12-02 2016-11-23 丘贝斯有限责任公司 用于内存数据库搜索的系统和方法
US10176256B1 (en) 2013-12-23 2019-01-08 BroadbandTV, Corp Title rating and improvement process and system
US9830044B2 (en) 2013-12-31 2017-11-28 Next It Corporation Virtual assistant team customization
CN104899214B (zh) 2014-03-06 2018-05-22 阿里巴巴集团控股有限公司 一种建立输入建议的数据处理方法和系统
JP5627061B1 (ja) * 2014-03-07 2014-11-19 楽天株式会社 検索装置、検索方法、プログラム及び記憶媒体
CN104978314B (zh) * 2014-04-01 2019-05-14 深圳市腾讯计算机系统有限公司 媒体内容推荐方法及装置
JP5687401B1 (ja) * 2014-04-23 2015-03-18 楽天株式会社 情報提供装置、情報提供方法、プログラム、及び記録媒体
CN104090963A (zh) * 2014-07-14 2014-10-08 百度在线网络技术(北京)有限公司 查询信息推荐方法和装置
US9798801B2 (en) 2014-07-16 2017-10-24 Microsoft Technology Licensing, Llc Observation-based query interpretation model modification
US20160071517A1 (en) 2014-09-09 2016-03-10 Next It Corporation Evaluating Conversation Data based on Risk Factors
CN104361010A (zh) * 2014-10-11 2015-02-18 北京中搜网络技术股份有限公司 一种纠正新闻分类的自动分类方法
CN104462595B (zh) * 2014-12-29 2019-03-19 北京奇虎科技有限公司 搜索引擎系统及在搜索结果项中嵌入多媒体元素的方法
US10339165B2 (en) * 2015-02-27 2019-07-02 Walmart Apollo, Llc System, method, and non-transitory computer-readable storage media for generating synonyms of a search query
EP3089159B1 (en) 2015-04-28 2019-08-28 Google LLC Correcting voice recognition using selective re-speak
CN104991656B (zh) * 2015-06-11 2018-12-21 浦江开丰广告设计有限公司 一种输入汉语词组的方法
US11836169B2 (en) * 2015-10-05 2023-12-05 Yahoo Assets Llc Methods, systems and techniques for providing search query suggestions based on non-personal data and user personal data according to availability of user personal data
US11899728B2 (en) 2015-10-05 2024-02-13 Yahoo Assets Llc Methods, systems and techniques for ranking personalized and generic search query suggestions
EP3232336A4 (en) * 2015-12-01 2018-03-21 Huawei Technologies Co., Ltd. Method and device for recognizing stop word
US11379538B1 (en) 2016-05-19 2022-07-05 Artemis Intelligence Llc Systems and methods for automatically identifying unmet technical needs and/or technical problems
US10474704B2 (en) * 2016-06-27 2019-11-12 International Business Machines Corporation Recommending documents sets based on a similar set of correlated features
CN106126758B (zh) * 2016-08-30 2021-01-05 西安航空学院 用于信息处理和信息评估的云系统
US20180068232A1 (en) * 2016-09-07 2018-03-08 Telefonaktiebolaget Lm Ericsson (Publ) Expert-assisted online-learning for media similarity
TWI645303B (zh) * 2016-12-21 2018-12-21 財團法人工業技術研究院 字串驗證方法、字串擴充方法與驗證模型訓練方法
US11392651B1 (en) 2017-04-14 2022-07-19 Artemis Intelligence Llc Systems and methods for automatically identifying unmet technical needs and/or technical problems
GB201713728D0 (en) * 2017-08-25 2017-10-11 Just Eat Holding Ltd System and method of language processing
US11100169B2 (en) 2017-10-06 2021-08-24 Target Brands, Inc. Alternative query suggestion in electronic searching
US11416503B2 (en) 2018-02-09 2022-08-16 Microsoft Technology Licensing, Llc Mining data for generating consumable collaboration events
EP3769238A4 (en) 2018-03-19 2022-01-26 Coffing, Daniel L. PROCESSING OF ARGUMENTS AND PROPOSITIONS IN NATURAL LANGUAGE
JP7059727B2 (ja) * 2018-03-19 2022-04-26 株式会社リコー 電子機器、検索方法、および、プログラム
US10853332B2 (en) * 2018-04-19 2020-12-01 Microsoft Technology Licensing, Llc Discovering schema using anchor attributes
EP3579125A1 (en) 2018-06-05 2019-12-11 Sap Se System, computer-implemented method and computer program product for information retrieval
US10860631B1 (en) * 2018-06-21 2020-12-08 Intuit Inc. Searching and scoring using phrases and/or multiple words
US10943059B2 (en) * 2018-06-27 2021-03-09 Microsoft Technology Licensing, Llc Document editing models and management
EP3847643A4 (en) 2018-09-06 2022-04-20 Coffing, Daniel L. DIALOG GUIDANCE PROVIDING SYSTEM
US11568175B2 (en) 2018-09-07 2023-01-31 Verint Americas Inc. Dynamic intent classification based on environment variables
US11743268B2 (en) 2018-09-14 2023-08-29 Daniel L. Coffing Fact management system
US11196863B2 (en) 2018-10-24 2021-12-07 Verint Americas Inc. Method and system for virtual assistant conversations
US11144560B2 (en) 2019-08-23 2021-10-12 International Business Machines Corporation Utilizing unsumbitted user input data for improved task performance
US11829716B2 (en) 2019-09-06 2023-11-28 International Business Machines Corporation Suggestion of an output candidate
CN111222058B (zh) * 2020-01-06 2021-04-16 百度在线网络技术(北京)有限公司 查询自动补全的方法、装置、设备和计算机存储介质
JP2021192142A (ja) * 2020-06-05 2021-12-16 富士フイルムビジネスイノベーション株式会社 情報処理装置及びプログラム
US11762916B1 (en) 2020-08-17 2023-09-19 Artemis Intelligence Llc User interface for identifying unmet technical needs and/or technical problems
US11416554B2 (en) * 2020-09-10 2022-08-16 Coupang Corp. Generating context relevant search results

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
CN1460948A (zh) * 2002-05-22 2003-12-10 夏普株式会社 修改或改进词语使用的方法和装置
WO2004086192A2 (en) * 2003-03-21 2004-10-07 Overture Services, Inc. Systems and methods for interactive search query refinement
WO2005026989A1 (en) * 2003-09-05 2005-03-24 Google Inc. Providing search query refinements

Family Cites Families (61)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5265065A (en) * 1991-10-08 1993-11-23 West Publishing Company Method and apparatus for information retrieval from a database by replacing domain specific stemmed phases in a natural language to create a search query
US5331554A (en) * 1992-12-10 1994-07-19 Ricoh Corporation Method and apparatus for semantic pattern matching for text retrieval
WO1996041281A1 (en) * 1995-06-07 1996-12-19 International Language Engineering Corporation Machine assisted translation tools
US6006221A (en) * 1995-08-16 1999-12-21 Syracuse University Multilingual document retrieval system and method using semantic vector matching
US6182066B1 (en) * 1997-11-26 2001-01-30 International Business Machines Corp. Category processing of query topics and electronic document content topics
US6345244B1 (en) * 1998-05-27 2002-02-05 Lionbridge Technologies, Inc. System, method, and product for dynamically aligning translations in a translation-memory system
US6411950B1 (en) * 1998-11-30 2002-06-25 Compaq Information Technologies Group, Lp Dynamic query expansion
EP1024443A3 (en) * 1999-01-29 2002-01-09 Canon Kabushiki Kaisha Utilising electronically accessible resources
CN1343337B (zh) * 1999-03-05 2013-03-20 佳能株式会社 用于产生包括音素数据和解码的字的注释数据的方法和设备
US6510406B1 (en) * 1999-03-23 2003-01-21 Mathsoft, Inc. Inverse inference engine for high performance web search
US6571234B1 (en) * 1999-05-11 2003-05-27 Prophet Financial Systems, Inc. System and method for managing online message board
US6314419B1 (en) 1999-06-04 2001-11-06 Oracle Corporation Methods and apparatus for generating query feedback based on co-occurrence patterns
US6611825B1 (en) * 1999-06-09 2003-08-26 The Boeing Company Method and system for text mining using multidimensional subspaces
US7089236B1 (en) * 1999-06-24 2006-08-08 Search 123.Com, Inc. Search engine interface
AU6200300A (en) 1999-06-24 2001-01-09 Simpli.Com Search engine interface
US6882970B1 (en) * 1999-10-28 2005-04-19 Canon Kabushiki Kaisha Language recognition using sequence frequency
US6757646B2 (en) * 2000-03-22 2004-06-29 Insightful Corporation Extended functionality for an inverse inference engine based web search
GB0011798D0 (en) * 2000-05-16 2000-07-05 Canon Kk Database annotation and retrieval
US6633868B1 (en) * 2000-07-28 2003-10-14 Shermann Loyall Min System and method for context-based document retrieval
EP1182581B1 (en) * 2000-08-18 2005-01-26 Exalead Searching tool and process for unified search using categories and keywords
US20030217052A1 (en) * 2000-08-24 2003-11-20 Celebros Ltd. Search engine method and apparatus
US20020103798A1 (en) * 2001-02-01 2002-08-01 Abrol Mani S. Adaptive document ranking method based on user behavior
US7269546B2 (en) * 2001-05-09 2007-09-11 International Business Machines Corporation System and method of finding documents related to other documents and of finding related words in response to a query to refine a search
JP3918531B2 (ja) * 2001-11-29 2007-05-23 株式会社日立製作所 類似文書検索方法およびシステム
US6961719B1 (en) * 2002-01-07 2005-11-01 The United States Of America As Represented By The Administrator Of The National Aeronautics And Space Administration Hybrid neural network and support vector machine method for optimization
JP4003468B2 (ja) * 2002-02-05 2007-11-07 株式会社日立製作所 適合性フィードバックによる類似データ検索方法および装置
WO2003085551A1 (en) * 2002-04-05 2003-10-16 Hyperwave Software Forschungs- Und Entwicklungs Gmbh Data visualization system
US6847966B1 (en) * 2002-04-24 2005-01-25 Engenium Corporation Method and system for optimally searching a document database using a representative semantic space
EP2109048A1 (en) * 2002-08-30 2009-10-14 Sony Deutschland Gmbh Methods to create a user profile and to specify a suggestion for a next selection of a user
US20040086185A1 (en) * 2002-10-31 2004-05-06 Eastman Kodak Company Method and system for multiple cue integration
US7287025B2 (en) 2003-02-12 2007-10-23 Microsoft Corporation Systems and methods for query expansion
US7563748B2 (en) 2003-06-23 2009-07-21 Cognis Ip Management Gmbh Alcohol alkoxylate carriers for pesticide active ingredients
US8856163B2 (en) * 2003-07-28 2014-10-07 Google Inc. System and method for providing a user interface with search query broadening
JP4292922B2 (ja) * 2003-09-09 2009-07-08 株式会社日立製作所 文書検索システムおよび方法
US20050076003A1 (en) * 2003-10-06 2005-04-07 Dubose Paul A. Method and apparatus for delivering personalized search results
US7231375B2 (en) * 2003-10-10 2007-06-12 Microsoft Corporation Computer aided query to task mapping
US20050149496A1 (en) * 2003-12-22 2005-07-07 Verity, Inc. System and method for dynamic context-sensitive federated search of multiple information repositories
US7739262B2 (en) * 2004-03-19 2010-06-15 Microsoft Corporation Enforcing currency and consistency constraints in database query processing
US7428529B2 (en) * 2004-04-15 2008-09-23 Microsoft Corporation Term suggestion for multi-sense query
US7689585B2 (en) * 2004-04-15 2010-03-30 Microsoft Corporation Reinforced clustering of multi-type data objects for search term suggestion
US20050289463A1 (en) * 2004-06-23 2005-12-29 Google Inc., A Delaware Corporation Systems and methods for spell correction of non-roman characters and words
US20060106769A1 (en) * 2004-11-12 2006-05-18 Gibbs Kevin A Method and system for autocompletion for languages having ideographs and phonetic characters
US20060112091A1 (en) * 2004-11-24 2006-05-25 Harbinger Associates, Llc Method and system for obtaining collection of variants of search query subjects
US7698270B2 (en) * 2004-12-29 2010-04-13 Baynote, Inc. Method and apparatus for identifying, extracting, capturing, and leveraging expertise and knowledge
US7636714B1 (en) * 2005-03-31 2009-12-22 Google Inc. Determining query term synonyms within query context
WO2006113597A2 (en) * 2005-04-14 2006-10-26 The Regents Of The University Of California Method for information retrieval
US8438142B2 (en) 2005-05-04 2013-05-07 Google Inc. Suggesting and refining user input based on original user input
US7627564B2 (en) 2005-06-21 2009-12-01 Microsoft Corporation High scale adaptive search systems and methods
JP4333745B2 (ja) * 2007-01-15 2009-09-16 株式会社デンソー 電子制御装置
US7603348B2 (en) * 2007-01-26 2009-10-13 Yahoo! Inc. System for classifying a search query
US20080256056A1 (en) 2007-04-10 2008-10-16 Yahoo! Inc. System for building a data structure representing a network of users and advertisers
US8086504B1 (en) 2007-09-06 2011-12-27 Amazon Technologies, Inc. Tag suggestions based on item metadata
US8583670B2 (en) 2007-10-04 2013-11-12 Microsoft Corporation Query suggestions for no result web searches
US8019748B1 (en) * 2007-11-14 2011-09-13 Google Inc. Web search refinement
US20090171929A1 (en) 2007-12-26 2009-07-02 Microsoft Corporation Toward optimized query suggeston: user interfaces and algorithms
US20090248510A1 (en) 2008-03-31 2009-10-01 Yahoo! Inc. Information retrieval using dynamic guided navigation
US20090248669A1 (en) 2008-04-01 2009-10-01 Nitin Mangesh Shetti Method and system for organizing information
US20100185644A1 (en) 2009-01-21 2010-07-22 Microsoft Corporatoin Automatic search suggestions from client-side, browser, history cache
US8452794B2 (en) 2009-02-11 2013-05-28 Microsoft Corporation Visual and textual query suggestion
US9330165B2 (en) 2009-02-13 2016-05-03 Microsoft Technology Licensing, Llc Context-aware query suggestion by mining log data
US8275759B2 (en) 2009-02-24 2012-09-25 Microsoft Corporation Contextual query suggestion in result pages

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6006225A (en) * 1998-06-15 1999-12-21 Amazon.Com Refining search queries by the suggestion of correlated terms from prior searches
CN1460948A (zh) * 2002-05-22 2003-12-10 夏普株式会社 修改或改进词语使用的方法和装置
WO2004086192A2 (en) * 2003-03-21 2004-10-07 Overture Services, Inc. Systems and methods for interactive search query refinement
WO2005026989A1 (en) * 2003-09-05 2005-03-24 Google Inc. Providing search query refinements

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
基于差异相似矩阵算法的词语用法知识发现;李文翔等;《计算机应用与软件》;20050131;第22卷(第1期);92-94 *

Also Published As

Publication number Publication date
WO2006121702A1 (en) 2006-11-16
KR20080008400A (ko) 2008-01-23
JP2008541233A (ja) 2008-11-20
EP1877939A1 (en) 2008-01-16
US20130103696A1 (en) 2013-04-25
US9411906B2 (en) 2016-08-09
JP5203934B2 (ja) 2013-06-05
US8438142B2 (en) 2013-05-07
CN102945237A (zh) 2013-02-27
US9020924B2 (en) 2015-04-28
US20150220547A1 (en) 2015-08-06
US20060253427A1 (en) 2006-11-09
KR101389148B1 (ko) 2014-04-24
CN101297291A (zh) 2008-10-29

Similar Documents

Publication Publication Date Title
CN102945237B (zh) 基于原始用户输入建议和细分用户输入的系统和方法
Oliveira et al. Assessing shallow sentence scoring techniques and combinations for single and multi-document summarization
CN101630314B (zh) 一种基于领域知识的语义查询扩展方法
US8301633B2 (en) System and method for semantic search
US7895195B2 (en) Method and apparatus for constructing a link structure between documents
CN110442777B (zh) 基于bert的伪相关反馈模型信息检索方法及系统
CN102866782B (zh) 一种提高整句生成效率的输入法和输入法系统
US20070192293A1 (en) Method for presenting search results
Tekli et al. SemIndex+: A semantic indexing scheme for structured, unstructured, and partly structured data
Liu et al. Information retrieval and Web search
CN114547253A (zh) 一种基于知识库应用的语义搜索方法
Das et al. Indexing the world wide web: The journey so far
CN112036178A (zh) 一种配网实体相关的语义搜索方法
CN110083683A (zh) 基于随机游走的实体语义标注方法
Huang et al. Multi-task learning for entity recommendation and document ranking in web search
Mass et al. Language models for keyword search over data graphs
Yang et al. Cascaded deep neural ranking models in linkedin people search
Gupta et al. Page ranking algorithms in online digital libraries: A survey
Dhanapal An intelligent information retrieval agent
Fatemi et al. Record linkage to match customer names: A probabilistic approach
Mosbah Query Refinement into Information Retrieval Systems: An Overview
Khattak et al. Intelligent search in digital documents
Kumaran MIRA: Multilingual information processing on relational architecture
d'Acierno et al. Building summaries from web information sources
Li et al. An efficient token-based approach for web-snippet clustering

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CP01 Change in the name or title of a patent holder

Address after: American California

Patentee after: Google limited liability company

Address before: American California

Patentee before: Google Inc.

CP01 Change in the name or title of a patent holder