CN101267518B - 从内容元数据提取相关信息的方法和装置 - Google Patents

从内容元数据提取相关信息的方法和装置 Download PDF

Info

Publication number
CN101267518B
CN101267518B CN2008100826213A CN200810082621A CN101267518B CN 101267518 B CN101267518 B CN 101267518B CN 2008100826213 A CN2008100826213 A CN 2008100826213A CN 200810082621 A CN200810082621 A CN 200810082621A CN 101267518 B CN101267518 B CN 101267518B
Authority
CN
China
Prior art keywords
rule
information
content
user
speech
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Expired - Fee Related
Application number
CN2008100826213A
Other languages
English (en)
Other versions
CN101267518A (zh
Inventor
普里扬·拉索德
夫昂·古叶
阿努基萨·昆吉萨帕赞
米塞·锡莎吉
艾伦·梅瑟
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Samsung Electronics Co Ltd
Original Assignee
Samsung Electronics Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Priority claimed from US11/789,609 external-priority patent/US8209724B2/en
Application filed by Samsung Electronics Co Ltd filed Critical Samsung Electronics Co Ltd
Publication of CN101267518A publication Critical patent/CN101267518A/zh
Application granted granted Critical
Publication of CN101267518B publication Critical patent/CN101267518B/zh
Expired - Fee Related legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/83Generation or processing of protective or descriptive data associated with content; Content structuring
    • H04N21/84Generation or processing of descriptive data, e.g. content descriptors
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/68Systems specially adapted for using specific information, e.g. geographical or meteorological information
    • H04H60/73Systems specially adapted for using specific information, e.g. geographical or meteorological information using meta-information
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/70Information retrieval; Database structures therefor; File system structures therefor of video data
    • G06F16/78Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
    • G06F16/783Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
    • G06F16/7844Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content using original textual content or text extracted from visual content or transcript of audio data
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04HBROADCAST COMMUNICATION
    • H04H60/00Arrangements for broadcast applications with a direct linking to broadcast information or broadcast space-time; Broadcast-related systems
    • H04H60/35Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users
    • H04H60/48Arrangements for identifying or recognising characteristics with a direct linkage to broadcast information or to broadcast space-time, e.g. for identifying broadcast stations or for identifying users for recognising items expressed in broadcast information
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/432Content retrieval operation from a local storage medium, e.g. hard-disk
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4345Extraction or processing of SI, e.g. extracting service information from an MPEG stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/434Disassembling of a multiplex stream, e.g. demultiplexing audio and video streams, extraction of additional data from a video stream; Remultiplexing of multiplex streams; Extraction or processing of SI; Disassembling of packetised elementary stream
    • H04N21/4348Demultiplexing of additional data and video streams
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/43Processing of content or additional data, e.g. demultiplexing additional data from a digital video stream; Elementary client operations, e.g. monitoring of home network or synchronising decoder's clock; Client middleware
    • H04N21/44Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs
    • H04N21/44008Processing of video elementary streams, e.g. splicing a video clip retrieved from local storage with an incoming video stream, rendering scenes according to MPEG-4 scene graphs involving operations for analysing video streams, e.g. detecting features or characteristics in the video stream
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/40Client devices specifically adapted for the reception of or interaction with content, e.g. set-top-box [STB]; Operations thereof
    • H04N21/45Management operations performed by the client for facilitating the reception of or the interaction with the content or administrating data related to the end-user or to the client device itself, e.g. learning user preferences for recommending movies, resolving scheduling conflicts
    • H04N21/466Learning process for intelligent management, e.g. learning user preferences for recommending movies
    • H04N21/4668Learning process for intelligent management, e.g. learning user preferences for recommending movies for recommending content, e.g. movies

Abstract

本发明提供一种从内容元数据提取相关信息的方法和装置。监控用户对内容的访问。选择用于信息提取的一组提取规则。基于选择的提取规则从内容的元数据提取关键信息。另外,可确定内容的类型,并基于内容的类型选择一组提取规则。在查询中使用所述关键信息以便搜索用户有可能感兴趣的与访问的内容有关的信息。

Description

从内容元数据提取相关信息的方法和装置
                        技术领域
本发明涉及向用户提供相关信息,更具体地讲,涉及利用内容的元数据来向用户提供相关信息。
                        背景技术
电视(TV)是一种主要的娱乐工具,其提供广泛的媒体以供家中娱乐。随着互联网以及家庭网络中的其它装置上可用信息量的增加,需要将来自互联网和其它源的相关信息提供给用户的TV。所述相关信息包括与TV上用户正在访问的内容有关的信息。这样的信息是用户有可能感兴趣的信息。
然而,TV信号不提供太多与内容关联的元数据来帮助寻找与该内容有关的信息。尽管在许多国家中,TV内容提供商需要发送嵌入到TV信号中的隐藏式字幕,但是存在众多TV频道,并且每一频道携带包含节目的各种类型的内容,如体育赛事、肥皂剧、电影、情景喜剧、新闻、记录片、商业信息片、真人秀等。每一频道在其隐藏式字幕中具有可能有用的不同数量和类型的内容。
存在使用户能够在资源的网络中获得信息的现有方法。在一种方法中,用户请求信息。在另一种方法中,用户通过提供关键词来指定信息,然后浏览信息以寻找满足用户需求的信息。然而,使用没有键盘的装置(如消费类电子(CE)装置)来指定关键词会是繁重的工作。
这些传统的方法没有在不限制信息的特定源的情况下分析和获得用户感兴趣的信息。此外,这些方法没有适应正在观看的节目的类型来获得相关信息。因此,需要一种在不限制信息的特定源的情况下分析并获得用户感兴趣的信息的方法和系统。此外,还需要一种适应于所访问的内容的类型并向用户提供相关信息的方法和系统。
                        发明内容
本发明提供一种从内容元数据提取相关信息的方法和装置。在一种实施方式中,这包含在不限制特定信息源的情况下,分析隐藏式字幕信息并获得用户感兴趣的信息。这样的方法通过监控用户与电子装置的交互以识别用户所访问的信息,基于识别的信息(其中,所述识别的信息包括隐藏式字幕信息)确定关键信息并基于所述关键信息在可用源上搜索用户有可能感兴趣的信息,可用于提供对电子装置的用户有可能感兴趣的信息的访问。对可用源的搜索包括基于所述关键信息形成查询,并利用所述查询搜索诸如互联网的外部网络。
这样的电子装置的一个实现方式是CE装置,如接收包含隐藏式字幕信息的TV节目的TV。用户正在访问/观看的TV节目的隐藏式字幕信息被分析,并且关键信息(关键词/短语)被提取。所述关键信息被用于形成查询并利用诸如可用的互联网搜索引擎的搜索引擎进行搜索。搜索结果作为推荐被呈现给用户,所述推荐表示用户有可能感兴趣的信息。可在所述推荐中进行选择以进行进一步搜索,从而寻找用户感兴趣的另外的和/或更精确的信息。
本发明还提供基于内容类型从内容元数据提取信息。在一种实现方式中,这包含适应于访问的内容的不同类型改变关键词提取。基于内容的类型对从元数据源(从诸如隐藏式字幕)提取与诸如TV节目的内容相关的关键词进行适应性改变。基于TV节目的EPG信息来改变从TV节目的隐藏式字幕文本的关键词提取。EPG指示TV节目的类型,其中,利用EPG类型信息对从隐藏式字幕的关键词提取进行参数化。基于EPG信息,TV节目的类型被用于确定从TV节目的隐藏式字幕提取的关键词的类型。
通过参照下面的描述以及权利要求和附图,本发明的这些和其它特征、方面和优点将容易理解。
                        附图说明
图1示出实现本发明的实施例的电子装置的网络的示例;
图2示出根据本发明实施例的分析TV隐藏式字幕信息以在互联网上寻找相关信息的示例系统的功能框图;
图3A示出根据本发明实施例的分析TV隐藏式字幕以在互联网上寻找相关信息的处理的示例步骤的流程图;
图3B示出图3A的处理中的关键词提取的示例步骤的流程图;
图4示出根据本发明另一实施例的分析TV隐藏式字幕信息以在互联网上寻找相关信息的另一示例系统的功能框图;
图5示出根据本发明实施例的分析元数据信息以寻找相关信息的另一处理的示例步骤的流程图;
图6示出根据本发明实施例的适应于内容类型来进行关键信息提取的关键信息提取器的框图;
图7示出根据本发明的适应于TV节目类型来进行关键词提取的示例关键词提取器的框图;
图8示出根据本发明的不利用节目类型来进行关键词提取的示例关键词提取器的框图;
图9示出根据本发明的具有适应于TV节目类型来进行关键词提取或者在不使用节目类型的情况下执行关键词提取的能力的示例关键词提取器的框图;
图10示出根据本发明的实施例的利用根据图9的关键词提取器分析TV隐藏式字幕信息来进行关键词提取以在互联网上寻找相关信息的系统的功能框图。
                      具体实施方式
本发明提供一种从内容元数据提取信息的方法和系统。本发明还允许改变从元数据源的信息提取以便适应不同类型的内容。在一个实施例中,本发明提供一种在不限制信息的特定源的情况下分析并获得用户感兴趣的信息的方法和系统。通过监控用户与连接到外部网络的装置的本地网络中的装置的交互来确定用户有可能感兴趣的信息。这样的装置可以是连接到互联网的局域网(例如,家庭网络)中的CE装置。
在一个实现方式中,这包含:接收包含隐藏式字幕信息的隐藏式字幕节目,并分析隐藏式字幕信息以得到指示用户兴趣的关键信息。然后,使用关键信息从诸如互联网的信息源寻找用户有可能感兴趣的相关信息。
诸如TV的典型CE装置缺少键盘,用户难以通过输入关键词来在互联网上搜索信息。如果用户正在观看TV节目,则这是用户对该TV节目的内容感兴趣的很好的暗示。因此,通过收集并分析针对该TV节目接收的作为隐藏式字幕信息的文本来分析该TV节目的内容。此外,从关于正在观看的频道的信息收集上下文信息(contextual information)。隐藏式字幕信息和上下文信息可被组合并用于向用户推荐用户有可能感兴趣的信息。
收集的信息被用于确定用户有可能感兴趣的一个或多个关键词。然后,使用所述关键词来在互联网上搜索相关信息。例如,如果用户正在观看有关巴尔的摩的新闻报道,则提取词“巴尔的摩”作为关键词。使用该关键词来形成查询以利用搜索引擎搜索互联网,以便寻找信息,如包括关于巴尔的摩市或者巴尔的摩乌鸦队等的信息的网址。
搜索结果作为推荐被呈现给用户,该推荐包括可能的搜索查询,这些搜索查询可被用户选择并执行,以在互联网上寻找用户可能感兴趣的进一步的信息。例如,当用户正在TV上观看关于南极洲的记录片时,关键词“南极洲”被选为关键词,互联网上的搜索返回“北极熊”作为用户有可能感兴趣的推荐。然后,用户可选择该推荐以寻找关于北极熊的更多信息。如果用户选择了该推荐,则用于“北极熊”的查询被发送给搜索引擎,结果被显示给用户。
搜索不限于预定数量或固定数量的类别或查询或者信息源。在一个示例中,基于隐藏式字幕信息来识别关键词以便搜索。可向用户建议关键词,一旦用户选择,利用在互联网上搜索可用源的搜索引擎(不同的网址对这些搜索引擎可用)来获得另外的信息,而非使用预定数量和/或固定数量的源,如一个或多个特定网址。
图1示出根据本发明实施例的示例网络10,如本地网络(例如,家庭网络,局域网(LAN))的功能架构。网络10实现分析TV隐藏式字幕信息以在互联网50上寻找相关信息的处理。网络10包括诸如可能包含内容的设备的电子装置20以及可能包含内容的CE装置30(例如,TV、DVD播放器、蜂窝电话、PDA)。网络10还包括将网络10连接到外部网络50(例如,另一个本地网络、互联网)的接口40。外部网络50连接到一个或多个服务器51。装置20和30可实现有用于在其间进行通信的通用即插即用(UPnP)协议。本领域技术人员应该理解,本发明可使用其它网络通信协议(例如,Jini、HAVi、IEEE 1394)。此外,网络10可以是有线网络、无线网络或其组合。
如下面将进一步描述的,在一个示例中,根据本发明的分析TV隐藏式字幕信息并建议用户感兴趣的信息的处理可在图1的装置30中实现。实现分析TV隐藏式字幕信息的处理的系统接收作为输入的TV信号。监控用户正在观看的频道,并且分析作为TV信号的一部分的相应的隐藏式字幕信息。然后,确定一组关键词,这些关键词捕获了用户正在观看的内容的要点。图2示出根据本发明实施例的分析TV隐藏式字幕信息的示例系统200的功能框图。系统200采用频道监控器201、TV信号至文本转换器202、停用词(stop-word)过滤器204、专有名词检测器206、索引器(indexer)208、字典210和关键词提取器212。
监控器201监控TV/有线信号并确定用户访问/观看的频道信息。该信息包括隐藏式字幕信息,利用图3A中的示例处理300来分析该隐藏式字幕信息以提取捕获上下文的词。示例处理300包括步骤:
步骤302:由转换器202利用已知的变换方法将隐藏式字幕信息变换为文本。
步骤304:由停用词过滤器204去除文本中的停用词。停用词包括诸如“of”、“on”、“the”等的本身没有意义的词。
步骤306:利用专有名词检测器206,在缺少大小写信息时,通过将剩余文本中的每一词与字典210进行比较来检测(识别)专有名词。通常,专有名词以大写字母开头。在其它场合,获得的文本中不分大小写。字典210包括不是专有名词的词。如果所考虑的词不在字典210中,则假设该词是专有名词。由于专有名词涉及特定人名、地名或物名,所以专有名词传达有用的上下文信息。因此,专用名词检测器206对被识别为专有名词的词进行标注,以便于后续排序(ranking)。
步骤308:利用专有名词检测器206,在存在大小写信息时,基于每一词的第一字符的大小写来检测专有名词。专用名词检测器206对专有名词进行标注,以便于后续排序。
步骤310:剩余词及其出现次数(频率)被索引器208记录。较频繁的词是重要的词,将从这些词中选择关键词。只要频道改变,或者利用从隐藏式字幕信息获得的文本中的特定字符发现主题改变,就重置词的记录。
步骤312:索引器208保存在n秒窗口内识别的词(即,在n秒时间段(可能是最近的n秒)内接收的词)及其频率和专有名词相关信息。例如,n=10秒窗口包括在过去的10秒内收集的词。在步骤310中加以索引的关键词覆盖正在观看的整个当前TV节目/故事等,而本步骤中讨论的关键词覆盖在最近“n”秒内收集的词。
步骤314:由关键词提取器212利用所有词的频率来从过去n秒内收集的所有词中提取感兴趣的词(即,关键词)。
步骤316:在查询形成模块205中使用关键词形成查询,以通过搜索模块207在可用资源(如互联网50上的搜索引擎)上执行搜索。用户接口(UI)模块203将搜索结果作为推荐呈现给用户,以便可选地进一步选择。
步骤318:用户在推荐中进行选择,其中,搜索模块207利用选择的推荐来在可用资源上搜索用户感兴趣的另外的信息。由UI模块203将这样的另外的信息呈现给用户。
步骤316和318允许用户寻找关于用户近来在TV上观看的节目的更多的信息,并且只要用户要求,步骤316和318可被重复以向用户提供用户感兴趣的另外的和/或更精确的信息。
图3B示出由关键词提取器212执行的步骤的示例流程图,包括:
步骤314A:当用户激活TV控制器(例如,TV遥控器)上的特定按钮时,这提供包括用户动作的“用户请求”。一旦用户请求,由关键词提取器212将最近n秒内的词另设为最重要的词。
步骤314B:此外,基于每一词的频率或者另一排序机制来对每一词进行排序。
步骤314C:利用在步骤306或308中产生的标注检查每一词的专有名词状态。
步骤314D:生成排序列表,其中,在一个示例中,高频率且是专有名词的词占据列表的顶部。然后是高频率词,然后是专有名词。排序列表中顶部的i个词与自TV节目的开始起识别的高频率词和专有名词一起捕获用户正在观看的内容的上下文。排序列表中的信息被用作关键词。在n秒窗口内捕获的词以更精细级别的细节表现上下文,而自节目的开始起捕获的专有名词和高频率词以更高的级别表现上下文。
利用包括关于有线TV、卫星TV等上的TV节目的信息的EPG(电子节目指南)信息,正在观看的频道的名称连同频道和节目信息一起被用来构建步骤316和318中的查询。例如,当用户正在观看BBC America上的“Panorama”节目时,词“Panorama”和“BBC America”被附加到提取的关键词上,以为搜索提供频道和节目上下文的相关信息。
此外,提取的关键词可被转换为不同的语言并用于在互联网50上搜索另外的信息。此外,与句子相比,将关键词从一种语言转换为另一种语言是简单的,并且可利用语言-语言字典来实现这种转换。这对仅可理解正在观看的TV节目中的语言的一小部分的用户而言很有益。
图4示出根据本发明的分析TV隐藏式字幕信息以在互联网上寻找相关信息的系统400的另一示例的功能框图。系统400是图2的系统200的变形,其还包括短语提取器214,该短语提取器214除了提取关键词之外还提取短语。短语的例子可以是“巴尔的摩乌鸦”,而非关键词“巴尔的摩”和“乌鸦”。
在本实施例中,关键词提取器212不仅依赖于来自专有名词检测器206和索引器208的信息,而且还使用来自短语提取器214的信息来获得关键词。短语提取器214包括短语识别器功能,该短语识别器功能利用索引器208所记录的频率信息和共同出现信息以及一组规则来识别重要的短语。这对识别诸如“United Nations”、“Al Qaeda”等多词短语很重要。
在操作中,收集的隐藏式字幕文本首先经过短语识别器以捕获短语,然后,捕获的短语被加以索引。短语识别器内部保存三个列表:专有名词列表、字典以及停用词列表。短语识别器利用基于N-gram的方法来进行短语提取,其中,从概念上讲,为了捕获长度为N个词的短语,使大小为N个词的窗口在文本上滑动,并收集所有可能的短语(长度为N个词)。然后,收集的短语经过下面的三个规则以过滤没有意义的短语:
1、以标点结束的词不能位于短语的中间;
2、对于2个词或更多词的短语长度,第一个词不能是除了两个冠词“the”(定冠词)和“a/an”(不定冠词)之外的停用词,并且剩余的词不能是除了连接停用词(如“on”、“at”、“of”、“in”、“by”、“for”、“and”等)之外的停用词。这是因为上述停用词经常用于组合两个或更多词:例如,“war on terror”、“wizard of oz”、“thebeauty and the beast”等。
3、专有名词以及字典中没有出现的词被当作有意义的短语。
在一个示例中,在图2和/或图4中,除了互联网/搜索引擎50之外的所有部件在CE装置(例如,CE装置30)上。在另一示例中,在图2和/或图4中,互联网/搜索引擎50位于互联网上,字典210位于网络(本地网络或互联网)上,而其它部件位于CE装置上。尽管在这里提供的示例中,使用TV来接收隐藏式字幕信息,但是本发明可应用于接收根据本发明的能够被分析以确定并搜索用户感兴趣的信息的其它装置(例如,音乐播放器)。此外,尽管在图1中,显示了用于接收包含隐藏式字幕信息的节目的CE装置30与家庭网络连接,但是这样的家庭网络不是必需的,CE装置可以是从线缆、卫星、DSL或其它节目源接收节目的独立(stand-alone)装置,而不与家庭网络连接。这样的独立装置仅需要连接到信息源,如连接到互联网50,而不需连接到家庭/本地网络。此外,可在非CE装置(例如,图1中的装置20)中实现本发明,该非CE装置可以是独立装置,或者是连接到家庭/本地网络的装置。此外,尽管在这里的示例中,使用隐藏式字幕信息来分析并确定用户的兴趣,但是在另一实现方式中,本发明可使用其它类型的表现用户正在访问/观看的节目或内容的类型的信息。
短语提取器214包括术语提取器功能,该术语提取器功能从索引中提取最高得分的术语和短语。术语和短语被呈现给用户,并且可用于进一步的搜索以提供用户感兴趣的另外的信息。可选地,短语提取器214包括自然语言处理(NLP)标注器和一组提取规则,用于提取重要的短语。在操作中,NLP标注器用每一词的词性(即,词是“noun(名词)”、“adjective(形容词)”、“proper noun(专有名词)”等)来对隐藏式字幕文本中的每一词进行标注。提取规则定义重要的标注序列类型。例如,一个规则可以提取“一个以上的专有名词的序列”作为短语,另一规则可提取“跟随有一个或多个名词的一个或多个形容词的序列”。短语提取将这些规则应用于由词性标注器标注的文本,并提取符合这些序列的短语。还可利用合适的规则来提取单个词的关键词。此外,关键词提取器212和/或短语提取器214可使用一组规则来进行自适应关键词/短语提取。
在上述示例中,从元数据源提取来自内容元数据的信息。提取的信息(例如,来自TV节目的隐藏式字幕的有意义的关键词)被用作搜索查询,以从诸如互联网的源获得与内容(例如,TV节目)有关的进一步的信息。
在另一实施例中,本发明还提供一种基于内容类型来从内容元数据提取关键信息(短语/关键词)的方法和系统。图5示出根据本发明实施例的分析元数据信息以寻找相关信息的另一处理450的示例步骤的流程图,该处理450包括步骤:
步骤452:监控用户对内容的访问。
步骤454:获得正被访问的内容的元数据。
步骤456:选择用于信息提取的一组提取规则。
步骤458:基于选择的提取规则从内容的元数据提取关键信息。
步骤460:基于所述关键信息在可用源上搜索用户有可能感兴趣的信息。
在一个实施方式中,这包含改变关键信息提取以适应访问的内容的不同类型。例如,基于内容的类型对从诸如隐藏式字幕的元数据源提取与诸如TV节目的内容有关的关键词的过程进行适应性改变。从TV节目的隐藏式字幕文本提取的关键词基于TV节目的EPG信息而改变。
EPG指示TV节目的类型,其中,利用EPG类型信息对从隐藏式字幕提取的关键词进行参数化。基于EPG信息,利用TV节目的类型信息来确定从TV节目的隐藏式字幕提取的关键词的类型。这样,从EPG信息获得TV上当前正在观看的节目的类型,并使用获得的节目类型确定从节目的隐藏式字幕提取的关键词的类型,所述关键词的类型在获得用户(观众)有可能感兴趣的信息方面被认为是有用的。
在一个示例中,如果TV节目是诸如新闻的大容量的事实节目,则更积极地选择关键词,主要是提取更多的关键词。另一方面,如果TV节目是肥皂剧,则非常有选择地提取关键词,仅提取相信其在获得用户(观众)有可能感兴趣的信息方面将很有可能有用的关键词。这样,依据TV节目的类型来对关键词提取规则进行适应性改变。
图6示出根据本发明的关键信息提取器500的框图,该关键信息提取器500基于正被访问的内容的类型506来从内容的元数据信息504提取关键信息(词/短语)502。然后,如上所述,提取的关键信息502被用于形成查询,所述查询随后可用于从互联网寻找用户感兴趣的相关信息。提取器500在关键信息的提取过程中基于正在观看的内容节目的类型而适应性地改变。
关键信息提取器500包括表征化器(tokenizer)508、标注器510、规则引擎512、类型提取器506和规则选择器514。表征化器508将正被访问的内容的元数据504(例如,文本)表征化为句子。然后,标注器510通过确定句子中每一词的上下文(即,确定给定词是否是名词、动词、介词等)来对句子进行标注。然后,标注的句子(标注文本)被传递给规则引擎512。
类型提取器506从类型源提取正被访问的内容的类型。规则库516存储不同规则的列表。这是能够用于提取所有类型的不同关键信息的详尽的规则列表。例如,规则库516可包括提取连续的专有名词的规则、提取跟随有一列名词的形容词的另一规则等。来自规则库516的规则以及来自类型提取器506的提取的类型被提供给规则选择器514。规则选择器514包含从类型到库516的一组规则的映射。该映射既可以是预先设置的,也可以是学习的。
基于提取的类型,规则选择器514选择一组规则,该组规则将由规则引擎512用来从标注的句子提取关键信息。规则引擎512接收来自规则选择器514的一组规则以及来自标注器510的标注文本的句子。规则引擎512将设置的规则应用于标注文本,并从标注文本提取关键信息。如上所述,所述关键信息在(例如从互联网)获得与正被访问的内容有关的信息方面被认为是有用的。获得的有关信息是正被访问的内容的观众(用户)有可能感兴趣的信息。
如果所述处理没有生成许多关键词(例如,由于保守的提取方案),则可从关于正被访问的内容的信息的其它源(如正在观看的TV节目的EPG)提取关键信息。
图7示出作为关键词提取器600的关键信息提取器的实现,该关键词提取器600基于正在观看的TV节目的类型606从TV节目的隐藏式字幕(CC)604提取关键词602。然后,如上所述,提取的关键词602被用于形成查询,所述查询随后可用于从互联网寻找用户感兴趣的相关信息。提取器600对关键词的提取基于正在观看的内容节目的类型而适应性地改变。提取的关键词可用作感兴趣的重要关键词,并在搜索查询、注释TV节目等中使用。
关键词提取器600包括CC表征化器608、词性标注器610、规则引擎612、类型提取器606和规则选择器614。表征化器608将TV节目的CC文本604表征化为句子。然后,词性标注器610通过确定句子中每一词的上下文(即,确定给定词是否是名词、动词、介词等)来对句子进行标注。然后,标注的句子(标注文本)被传递给规则引擎612。类型提取器606从EPG信息供给605中提取正被访问的内容的类型。规则库616存储可用于提取所有类型的不同关键词的不同规则的列表。来自规则库616的规则以及来自类型提取器606的提取的类型被提供给规则选择器614。规则选择器614包含从类型到库616的一组规则的映射。该映射既可以是预先设置的,也可以是学习的。
基于提取的类型,规则选择器614选择一组规则,该组规则将由规则引擎612用来从标注的句子提取关键词。规则引擎612接收来自规则选择器614的一组规则以及来自标注器610的标注文本的句子。规则引擎612将设置的规则应用于标注文本,并从标注文本提取关键词。如上所述,所述关键词在(例如从互联网)获得与正被访问的TV节目有关的信息方面被认为是有用的。获得的有关信息是正被访问的TV节目的观众有可能感兴趣的信息。
在一个示例操作中,关键词提取器600实时地对实时TV信号进行操作,其中,存在TV节目的输入的隐藏式字幕文本的稳定流。CC表征化器608将隐藏式字幕文本分解为句子,以便保留隐藏式字幕文本中的句子的语法,这对于标注句子而言是重要的。在存储器缓冲器中对隐藏式字幕字符进行缓冲,当前接收的文本被分析以检测句子的结束(例如,通过监控标点、空格等来检测句子的结束)。表征(token)指句子,其中,表征化器608通过检测标点并利用试探法(heuristics)来将隐藏式字幕文本分离为句子。可使用这样的简单试探法:将跟随有空格的句点(.)、问号(?)或者感叹号(!)的出现当作句子边界(例如,句子的结束)。也可使用本领域技术人员知道的其它模型。当CC表征化器608检测到句子的结束时,其清除缓冲器并将接收的句子提供给词性标注器610作为纯文本(plain-text)句子。
词性标注器610分析纯文本句子并将标注分配给句子中的每一词,从而生成标注文本。标注指词性标注,其中,将描述句子中的每一词在句中所使用的意义(即,词的词性)的标注分配给该词。一些示例标注如下:
/NNP即,专有名词
/MOD即,情态助动词
/NNS即,复数名词等。
可使用基于规则的词性标注器,如Brill的标注器(Brill,E.1992.A simplerule-based part of speech tagger.In Proceedings of the Third Conference onApplied Natural Language Processing,152-155.Trento,Italy.(在1992年于意大利特兰托召开的关于应用自然语言处理的第三次会议的会议记录第152-155页中,Brill,E的“基于简单规则的词性标注器”))。也可使用用词的词性来标记句子中的每一词的其它标注器。例如,如果输入到标注器610的纯文本句子为“John Wayne ran home”,则从标注器610输出的标注文本为“John<proper noun>Wayne<proper noun>ran<verb-past tense>home<noun>”。这表示在标注文本中,词“John”和“Wayne”被标注为专有名词,词“ran”被标注为过去时态的动词,词“home”被标注为名词。然后,该标注文本被传递给规则引擎612。
假设句子“John Wayne ran home”出现在“记录片(Documentary)”节目中。词性标注器610将其标注为“John/NNP Wayne/NNP ran/VBDhome/NN”,其中:
/NNP→专有名词
/VBD→动词(过去时态)
/NN→名词
现在假设如上所述给出示例规则库,其中:
consecutive_proper_noun:((\w+)(/NNP))+
consecutive_singular_nouns:((\w+)(/NN))+
noun_conjunction_noun:((\w+)(/NN))+((\w+)(/CC))+((\w+)(/NN))+
adjective_consecutive_nouns:((\w+)(/ADJ))+((\w+)(/NN))+
从而根据规则选择器614,对“记录片”类型的映射为:
Documentary→consecutive_proper_noun
然后,当规则“consecutive_proper_noun”被应用到标注文本时,规则引擎612提取关键词“John Wayne”。
如上所述,规则库616保存有能够用于提取不同类型的关键词的规则列表。规则可被手动地添加到库616、或者是预先学习的、或者是随着时间而学习的。每一规则可以是规则引擎612所理解的规则表达。例如,用于提取包含连续出现的专有名词的短语的规则可以是:
((\w+)(/NNP))+                    (1)
其中,“+”表示一个或多个存在,“\w”表示字母。
这样,假定如下标注文本:
Pablo/NNP Picasso/NNP and/CC Vincent/NNP Van/NNP Gogh/NNPwere/VBD artists/NNS      (2)
应用上述规则(1)的规则引擎612应该从上述示例标注文本(2)中提取两个关键词“Pablo Picasso”和“Vincent Van Gogh”。示例规则库可如下:
consecutive_proper_noun:((\w+)(/NNP))+
consecutive_singular_nouns:((\w+)(/NN))+
nour_conjunction_noun:((\w+)(/NN))+((\w+)(/CC))+((\w+)(/NN))+
adjective_consecutive_nouns:((\w+)(/ADJ))+((\w+)(/NN))+
……
规则选择器614中的映射包括用于将TV节目的类型映射到规则库616中的规则列表的子集的类型映射。例如,从节目类型“新闻(News)”和“连续剧(Sitcom)”的类型映射可以如下:
News→consecutive_proper_noun,
      noun_conjunction_noun,
      adjective_consecutive_nouns
Sitcom→consecutive_proper_noun
……
可通过按照如下示例步骤(a)-(e)进行用户研究并分析其结果来创建类型映射:
a.让M个用户阅读给定类型G的N个TV节目的抄本并标记他们认为是好的(重要的)关键词的所有关键词K。M和N的值越大越好。例如,考虑句子“Pablo Picasso and Vincent Van Gogh wereartists.”,并假设用户选择“Pablo Picasso”、“Vincent Van Gogh”和“artists”作为感兴趣的关键词。
b.使抄本经过词性标注器610并对其进行标注;例如,对上述句子的标注应该为:Pablo/NNP Picasso/NNP and/CC Vincent/NNPVan/NNP Gogh/NNP were/VBD artists/NNS。
c.对于集合K中的每一关键词,提取分配给各个词的标注;例如,对标记的词的标注应该为:
Pablo Picasso:/NNP/NNP
Vincent Van Gogh:/NNP/NNP/NNP
Artists:/NNS
d.将在前一步骤中提取的每一标注句子转换为规则引擎612能够理解的模式;例如,上述三个序列将变为:
Pablo Picasso:((\w+)(/NNP))+
Vincent Van Gogh:((\w+)(/NNP))+
Artists:(\w+)(/NNS)
e.从序列中选择唯一模式并根据频率对其进行排序;例如,
((\w+)(/NNP))+的频率=2
(\w+)(/NNS)的频率=1
f.结果模式是用于类型G的规则的候选集。为了减小规则集的大小,排在顶部的“P”个规则或者频率超过“F”的所有规则可被选为用于类型G的最终规则集。
上述创建映射的处理也可以是随时间而学习的。在步骤(a)中,每当用户使用提取器600并且一些关键词被呈现给用户时,如果用户点击它们中的一个(表示用户找到有用的关键词),则该关键词被当作用户所标记的关键词。剩下的处理与上述步骤(b)-(f)相同。如果最终规则集已经包含新创建的规则,则新创建的规则被抛弃。除了类型映射之外,规则选择器614中的映射可包括其它映射。其它映射可以是不基于类型的默认映射,如在下面进一步描述的。
规则引擎612包括传统的模式匹配程序,其接收文本输入和一个或多个模式(规则),并提取与所述一个或多个模式匹配的所有关键词。
如果所述处理没有生成许多关键词(例如,由于保守的提取方案),则可从关于正被访问的内容的信息的其它源(如正在观看的TV节目的EPG)提取关键信息。可基于针对所有类型的固定约束(例如,少于X个关键词为不足)、基于类型的固定约束(例如,对于连续剧,少于X个关键词为不足;但是对于新闻,少于Y个关键词为不足)等来确定获得的关键词不足。可如下从节目的EPG提取关键词:EPG条目包含一些结构化条目(例如,标题、演员)和一些半结构化条目(例如,描述);以与隐藏式字幕相同的方式从EPG中的半结构化条目提取关键词;而结构化条目中的信息可照原样使用,而不需任何处理。
在一个示例中,提取器500和600的部件可在包括存储器和微处理器的TV硬件上实现,或被实现为固件等,从而提取器500和600的每个之内的部件之间的通信经函数调用。规则库可以是TV上的由规则选择器查询的数据库的形式;或者规则库可以在网络中的服务器上,其中,将经HTTP或SOAP或者其它类似的协议执行与规则选择器的通信。
图8示出另一示例关键词提取器700,其中,不需要内容的类型来从内容元数据提取关键词,以从TV节目的隐藏式字幕(CC)704提取关键词702。关键词提取器700包括CC表征化器708、词性标注器710、规则引擎712和规则选择器714。CC表征化器708、词性标注器710和规则引擎712分别与图7中的CC表征化器608、词性标注器610和规则引擎612类似。此外,类似于图7中的库616,图8中的规则库716存储能够用于提取所有类型的不同关键词的不同规则的列表。
来自规则库716的规则被提供给规则选择器714。规则选择器714包含到库716的一组规则的“默认(default)”映射,其中,所述“默认”映射用于为规则引擎712从库716中选择规则(例如,规则选择器714使用默认映射规则A、B和C等,这些映射规则不使用类型来选择规则)。规则引擎712接收来自规则选择器714的一组规则和来自标注器710的标注文本的句子。规则引擎712将设置的规则应用于标注文本并从标注文本提取关键词。
在一个示例中,如果没有与节目关联的类型,则系统使用“默认”映射。在这种情况下,应该使用非常保守的关键词提取规则,以确保只提取其是重要的关键词的概率高的关键词。例如,规则选择器可具有如下默认映射条目:
Default→consecutive_proper_noun。
图9示出关键词提取器800的另一示例,其中,使用TV节目的类型来从TV节目的隐藏式字幕(CC)804提取关键词是可选的。关键词提取器800包括CC表征化器808、词性标注器810、规则引擎812和规则选择器814。关键词提取器还包括与图7中的类型提取器类似的类型提取器806。CC表征化器808、词性标注器810和规则引擎812分别与图8中的CC表征化器708、词性标注器710和规则引擎712类似。此外,类似于图8中的库716,图9中的规则库816存储能够用于提取所有类型的不同关键词的不同规则的列表。来自规则库816的规则被提供给规则选择器814。
规则选择器814包含从类型到库816中的一组规则的类型映射。该类型映射可以是预先设置的,或者可以是学习的。基于类型提取器806所提取的类型,规则选择器814使用类型映射来从库816选择一组规则,规则引擎812将使用该组规则来从标注句子提取关键词。规则选择器814还包含到库816中的一组规则的“默认”映射(例如,如果类型未知或未使用,则使用默认映射规则A、B和C)。规则选择器814中的“默认”映射与上面针对规则选择器714描述的“默认”映射类似。
这样,如果TV节目的类型未知或未使用,则规则选择器814使用“默认”映射来从规则库816选择规则,而不依赖于TV节目的类型。如果TV节目的类型已知,则规则选择器814基于类型提取器806所提供的类型利用类型映射来从规则库816选择规则。在规则选择器814的一个示例中,即使类型提取器806提供TV节目的类型,规则选择器也不依赖于类型,而使用“默认”映射来进行规则选择。可选地,规则选择器814可接收指示规则选择器使用类型映射或“默认”映射进行规则选择的选择信号(CTL)。
规则引擎812接收来自规则选择器814的一组规则和来自标注器810的标注文本的句子。规则引擎812将设置的规则应用于标注文本并从标注文本提取关键词。
上述提取器600、700和800中的任一个都可用作图2和图4中的提取器212和/或提取器214的实现。图10示出基于图4中的系统400的采用关键词提取器800的示例系统900。如上所述,关键词提取器800在关键词提取中不需要使用节目类型。然而,关键词提取器800具有基于节目类型(从EPG供给905提取)对关键词提取进行适应性改变的能力。在这一示例中,模块202、203、205、207和800被实现在诸如数字TV 30A的CE装置中。TV 30A被示出为与LAN连接。
尽管在家庭网络的背景下提供上述示例,但是本领域技术人员应该认识到,本发明可用于独立装置,所述独立装置不是诸如LAN的家庭网络的必要部分。例如,在图10中,TV 30A不需要连接到LAN。
如本领域技术人员所知的,根据本发明的上述示例架构可以以许多方式实现,如由处理器执行的程序指令、逻辑电路、专用集成电路、固件等。已参照本发明的特定优选形式详细描述了本发明,然而,其它形式也是可能的。因此,权利要求的精神和范围不应限于这里包含的优选形式的描述。

Claims (29)

1.一种从内容元数据提取信息的方法,包括步骤:
监控用户对内容的访问,其中,所述内容包括TV节目,TV节目的元数据包括与TV节目关联的隐藏式字幕信息;
选择用于信息提取的一组提取规则;
基于选择的提取规则从内容的元数据提取关键信息,
其中,提取关键信息的步骤包括:将元数据变换为文本,去除文本中的包括本身没有意义的词的停用词,基于选择的提取规则从剩余文本提取关键信息,利用所有词的频率来从过去n秒内收集的所有词中提取关键信息,将TV节目的隐藏式字幕文本表征化为一个或多个句子,基于句子中每一词的上下文来对句子中的每一词进行标注,并基于限定标注序列类型的提取规则从每一标注的句子中提取关键词。
2.如权利要求1所述的方法,还包括步骤:确定内容的类型。
3.如权利要求2所述的方法,其中,选择一组提取规则的步骤还包括步骤:基于内容类型选择一组提取规则。
4.如权利要求1所述的方法,其中,确定内容的类型的步骤包括:从EPG提取TV节目的类型。
5.如权利要求3所述的方法,其中,选择一组提取规则的步骤还包括步骤:基于内容类型从规则库中选择一组提取规则,其中,所述规则库包括用于提取各种关键词的规则的列表。
6.如权利要求3所述的方法,其中,基于内容类型选择一组提取规则的步骤还包括:通过从内容到规则库中的多个规则中的一组规则的映射来选择提取规则,所述规则库包括用于提取各种关键词的规则。
7.如权利要求1所述的方法,还包括步骤:基于所述关键信息在可用源上搜索用户有可能感兴趣的信息。
8.如权利要求7所述的方法,还包括步骤:提供用户可能感兴趣的信息。
9.如权利要求7所述的方法,其中,搜索可用源的步骤还包括:基于所述关键信息形成查询,并利用所述查询搜索外部网络。
10.如权利要求1所述的方法,其中,经消费类电子装置来访问内容,从而监控步骤还包括步骤:监控用户与该消费类电子装置的交互。
11.如权利要求10所述的方法,其中,提取关键信息的步骤包括:基于选择的提取规则,从经所述消费类电子装置访问的内容的元数据提取关键信息。
12.如权利要求11所述的方法,其中,监控步骤还包括:对用户选择经所述消费类电子装置访问哪一内容进行监控。
13.如权利要求12所述的方法,其中,监控步骤还包括:对经频道提供的隐藏式字幕信息进行监控,其中,用户选择经所述消费类电子装置访问该频道。
14.如权利要求7所述的方法,还包括步骤:
将搜索结果作为用户有可能感兴趣的信息提供给用户;
接收用户对所述用户有可能感兴趣的信息的选择;
基于用户选择的信息在可用源上进一步搜索用户有可能感兴趣的另外的信息。
15.如权利要求10所述的方法,其中:
经消费类电子装置访问所述内容,所述消费类电子装置连接到局域网;
搜索可用源的步骤还包括:基于所述关键信息形成查询并利用该查询来搜索互联网。
16.一种从内容元数据提取信息的装置,包括:
监控器,被配置为监控通过所述装置对内容的访问,其中,所述内容包括TV节目,TV节目的元数据包括与TV节目关联的隐藏式字幕信息;
规则选择器,被配置为选择用于信息提取的一组提取规则;
信息提取器,被配置为基于选择的提取规则从内容的元数据提取关键信息,
其中,信息提取器被进一步配置为:将元数据变换为文本,去除文本中的包括本身没有意义的词的停用词,基于选择的提取规则从剩余文本提取关键信息,利用所有词的频率来从过去n秒内收集的所有词中提取关键信息,其中,信息提取器包括表征化器、标注器和规则引擎,该表征化器被配置为将TV节目的隐藏式字幕文本表征化为一个或多个句子,该标注器被配置为基于句子中每一词的上下文来对句子中的每一词进行标注,该规则引擎被配置为基于提取规则从每一标注的句子中提取关键词。
17.如权利要求16所述的装置,还包括:类型提取器,被配置为确定内容的类型。
18.如权利要求17所述的装置,其中,规则选择器还被配置为基于内容类型选择一组提取规则。
19.如权利要求16所述的装置,其中,类型提取器还被配置为通过从EPG提取TV节目的类型来确定内容的类型。
20.如权利要求18所述的装置,其中,规则选择器还被配置为基于内容类型从规则库中选择一组提取规则,其中,所述规则库包括用于提取各种关键词的规则的列表。
21.如权利要求18所述的装置,其中,规则提取器还被配置为通过从内容到规则库中的多个规则中的一组规则的映射来选择提取规则,所述规则库包括用于提取各种关键词的规则。
22.如权利要求16所述的装置,还包括:搜索模块,被配置为基于所述关键信息在可用源上搜索用户有可能感兴趣的信息。
23.如权利要求22所述的装置,还包括:用户接口,被配置为将可能感兴趣的信息提供给用户。
24.如权利要求22所述的装置,其中,搜索模块还被配置为基于所述关键信息形成查询,并利用所述查询搜索外部网络。
25.如权利要求16所述的装置,其中,所述监控器还被配置为对经频道提供的隐藏式字幕信息进行监控,其中,用户选择经所述装置访问该频道。
26.如权利要求22所述的装置,还包括:用户接口,被配置为将搜索结果作为用户有可能感兴趣的信息提供给用户,并接收用户对所述用户有可能感兴趣的信息的选择,
其中,搜索模块还被配置为基于用户选择的信息在可用源上进一步搜索用户有可能感兴趣的另外的信息。
27.如权利要求25所述的装置,其中,所述装置包括消费类电子装置。
28.如权利要求27所述的装置,其中,所述消费类电子装置被配置为连接到局域网。
29.如权利要求25所述的装置,其中,所述装置包括TV。
CN2008100826213A 2007-02-28 2008-02-27 从内容元数据提取相关信息的方法和装置 Expired - Fee Related CN101267518B (zh)

Applications Claiming Priority (6)

Application Number Priority Date Filing Date Title
US90396207P 2007-02-28 2007-02-28
US60/903,962 2007-02-28
US11/789,609 2007-04-25
US11/789,609 US8209724B2 (en) 2007-04-25 2007-04-25 Method and system for providing access to information of potential interest to a user
US11/821,938 US8115869B2 (en) 2007-02-28 2007-06-26 Method and system for extracting relevant information from content metadata
US11/821,938 2007-06-26

Publications (2)

Publication Number Publication Date
CN101267518A CN101267518A (zh) 2008-09-17
CN101267518B true CN101267518B (zh) 2011-05-18

Family

ID=39715425

Family Applications (1)

Application Number Title Priority Date Filing Date
CN2008100826213A Expired - Fee Related CN101267518B (zh) 2007-02-28 2008-02-27 从内容元数据提取相关信息的方法和装置

Country Status (3)

Country Link
US (1) US8115869B2 (zh)
KR (1) KR101472931B1 (zh)
CN (1) CN101267518B (zh)

Families Citing this family (110)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US7490092B2 (en) 2000-07-06 2009-02-10 Streamsage, Inc. Method and system for indexing and searching timed media information based upon relevance intervals
US8042132B2 (en) 2002-03-15 2011-10-18 Tvworks, Llc System and method for construction, delivery and display of iTV content
WO2003026275A2 (en) 2001-09-19 2003-03-27 Meta Tv, Inc. Interactive user interface for television applications
US7703116B1 (en) 2003-07-11 2010-04-20 Tvworks, Llc System and method for construction, delivery and display of iTV applications that blend programming information of on-demand and broadcast service offerings
US8220018B2 (en) 2002-09-19 2012-07-10 Tvworks, Llc System and method for preferred placement programming of iTV content
US8578411B1 (en) 2003-03-14 2013-11-05 Tvworks, Llc System and method for controlling iTV application behaviors through the use of application profile filters
US11381875B2 (en) 2003-03-14 2022-07-05 Comcast Cable Communications Management, Llc Causing display of user-selectable content types
US8819734B2 (en) 2003-09-16 2014-08-26 Tvworks, Llc Contextual navigational control for digital television
US7818667B2 (en) 2005-05-03 2010-10-19 Tv Works Llc Verification of semantic constraints in multimedia data and in its announcement, signaling and interchange
US8209724B2 (en) * 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US8843467B2 (en) 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US8510453B2 (en) 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8200688B2 (en) * 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8863221B2 (en) 2006-03-07 2014-10-14 Samsung Electronics Co., Ltd. Method and system for integrating content and services among multiple networks
US20080250010A1 (en) * 2007-04-05 2008-10-09 Samsung Electronics Co., Ltd. Method and system for determining and pre-processing potential user queries related to content in a network
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US9043197B1 (en) * 2006-07-14 2015-05-26 Google Inc. Extracting information from unstructured text using generalized extraction patterns
US8935269B2 (en) 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US20090055393A1 (en) * 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US9286385B2 (en) 2007-04-25 2016-03-15 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
JP2009025968A (ja) * 2007-07-18 2009-02-05 Fujifilm Corp 関連語辞書作成装置、方法、及びプログラム、並びにコンテンツ検索装置
US20090228777A1 (en) * 2007-08-17 2009-09-10 Accupatent, Inc. System and Method for Search
US8275764B2 (en) * 2007-08-24 2012-09-25 Google Inc. Recommending media programs based on media program popularity
US8191088B2 (en) * 2007-09-14 2012-05-29 At&T Intellectual Property I, L.P. Apparatus and method for managing media content
JP2009094658A (ja) * 2007-10-05 2009-04-30 Hitachi Ltd 関連情報提供装置、及び関連情報提供方法
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US20090132462A1 (en) * 2007-11-19 2009-05-21 Sony Corporation Distributed metadata extraction
KR101392273B1 (ko) * 2008-01-07 2014-05-08 삼성전자주식회사 키워드 제공 방법 및 이를 적용한 영상기기
US8145648B2 (en) * 2008-09-03 2012-03-27 Samsung Electronics Co., Ltd. Semantic metadata creation for videos
US8938465B2 (en) 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information
JP2010087976A (ja) * 2008-10-01 2010-04-15 Sony Corp 情報処理装置、情報取得方法、情報取得プログラム及び情報検索システム
US11832024B2 (en) 2008-11-20 2023-11-28 Comcast Cable Communications, Llc Method and apparatus for delivering video and video-related content at sub-asset level
US8713016B2 (en) 2008-12-24 2014-04-29 Comcast Interactive Media, Llc Method and apparatus for organizing segments of media assets and determining relevance of segments to a query
US20100161441A1 (en) * 2008-12-24 2010-06-24 Comcast Interactive Media, Llc Method and apparatus for advertising at the sub-asset level
US9442933B2 (en) 2008-12-24 2016-09-13 Comcast Interactive Media, Llc Identification of segments within audio, video, and multimedia items
CN101771957B (zh) * 2008-12-26 2012-10-03 中国移动通信集团公司 一种用户兴趣点确定方法与装置
US11531668B2 (en) * 2008-12-29 2022-12-20 Comcast Interactive Media, Llc Merging of multiple data sets
US8176043B2 (en) * 2009-03-12 2012-05-08 Comcast Interactive Media, Llc Ranking search results
JP5171718B2 (ja) * 2009-03-31 2013-03-27 株式会社東芝 コンテンツ推薦装置、方法、及びプログラム
US20100250614A1 (en) * 2009-03-31 2010-09-30 Comcast Cable Holdings, Llc Storing and searching encoded data
US10225625B2 (en) * 2009-04-06 2019-03-05 Vitac Corporation Caption extraction and analysis
US8533223B2 (en) * 2009-05-12 2013-09-10 Comcast Interactive Media, LLC. Disambiguation and tagging of entities
CN102473249A (zh) * 2009-06-29 2012-05-23 德山真旭 工作流程处理程序、信息处理装置以及工作流程处理方法
US9892730B2 (en) * 2009-07-01 2018-02-13 Comcast Interactive Media, Llc Generating topic-specific language models
US8909683B1 (en) 2009-07-17 2014-12-09 Open Invention Network, Llc Method and system for communicating with internet resources to identify and supply content for webpage construction
US8713078B2 (en) 2009-08-13 2014-04-29 Samsung Electronics Co., Ltd. Method for building taxonomy of topics and categorizing videos
US20110225152A1 (en) * 2010-03-15 2011-09-15 Microsoft Corporation Constructing a search-result caption
US9645996B1 (en) * 2010-03-25 2017-05-09 Open Invention Network Llc Method and device for automatically generating a tag from a conversation in a social networking website
WO2011139346A2 (en) * 2010-04-30 2011-11-10 Thomson Licensing Primary screen view control through kinetic ui framework
US8918803B2 (en) * 2010-06-25 2014-12-23 At&T Intellectual Property I, Lp System and method for automatic identification of key phrases during a multimedia broadcast
US8423555B2 (en) 2010-07-09 2013-04-16 Comcast Cable Communications, Llc Automatic segmentation of video
JP4977241B2 (ja) * 2010-07-16 2012-07-18 株式会社東芝 表示装置及び表示方法
US8701043B2 (en) * 2010-08-26 2014-04-15 Verizon Patent And Licensing Inc. Methods and systems for dynamically providing access to enhanced content during a presentation of a media content instance
KR101700365B1 (ko) * 2010-09-17 2017-02-14 삼성전자주식회사 미디어 컨텐츠 관련 정보 제공 방법, 이 방법을 수행할 수 있는 디바이스와 서버 및 저장 매체
KR20120060692A (ko) * 2010-12-02 2012-06-12 삼성전자주식회사 디스플레이장치 및 컨텐츠 검색방법
US8935300B1 (en) 2011-01-03 2015-01-13 Intellectual Ventures Fund 79 Llc Methods, devices, and mediums associated with content-searchable media
US8745683B1 (en) * 2011-01-03 2014-06-03 Intellectual Ventures Fund 79 Llc Methods, devices, and mediums associated with supplementary audio information
US8452774B2 (en) * 2011-03-10 2013-05-28 GM Global Technology Operations LLC Methodology to establish term co-relationship using sentence boundary detection
CN102739973B (zh) * 2011-05-11 2018-05-04 新奥特(北京)视频技术有限公司 一种实现字幕梵高油画特效的方法
US9043444B2 (en) 2011-05-25 2015-05-26 Google Inc. Using an audio stream to identify metadata associated with a currently playing television program
US8484313B2 (en) * 2011-05-25 2013-07-09 Google Inc. Using a closed caption stream for device metadata
US10467289B2 (en) 2011-08-02 2019-11-05 Comcast Cable Communications, Llc Segmentation of video according to narrative theme
CN103782284B (zh) * 2011-09-12 2021-05-11 英特尔公司 使用发现来理解用户行为、兴趣和喜好
US9009143B2 (en) 2011-10-03 2015-04-14 Microsoft Corporation Use of off-page content to enhance captions with additional relevant information
CN102510445B (zh) * 2011-10-14 2015-04-01 上海文广科技(集团)有限公司 节目源智能信息制作系统及制作方法
US20130151936A1 (en) * 2011-12-12 2013-06-13 Microsoft Corporation Page preview using contextual template metadata and labeling
US8751424B1 (en) * 2011-12-15 2014-06-10 The Boeing Company Secure information classification
US20140373082A1 (en) * 2012-02-03 2014-12-18 Sharp Kabushiki Kaisha Output system, control method of output system, control program, and recording medium
JP5330559B2 (ja) * 2012-03-26 2013-10-30 株式会社東芝 電子機器及び表示制御方法
CN103455908A (zh) * 2012-05-30 2013-12-18 Sap股份公司 云环境中的头脑风暴
TWI470999B (zh) 2012-06-19 2015-01-21 Wistron Corp 編輯與儲存串流的方法、裝置、系統
US20140109137A1 (en) * 2012-10-11 2014-04-17 Faisal Mushtaq Method and apparatus for user interaction with programs utilizing closed captioning data content
US10395642B1 (en) * 2012-11-19 2019-08-27 Cox Communications, Inc. Caption data fishing
US10880609B2 (en) 2013-03-14 2020-12-29 Comcast Cable Communications, Llc Content event messaging
US10277945B2 (en) * 2013-04-05 2019-04-30 Lenovo (Singapore) Pte. Ltd. Contextual queries for augmenting video display
KR20140133357A (ko) 2013-05-10 2014-11-19 삼성전자주식회사 디스플레이 장치 및 그 ui 화면 제공 방법
KR101799294B1 (ko) 2013-05-10 2017-11-20 삼성전자주식회사 디스플레이 장치 및 이의 제어 방법
US9817911B2 (en) * 2013-05-10 2017-11-14 Excalibur Ip, Llc Method and system for displaying content relating to a subject matter of a displayed media program
CN103309993B (zh) * 2013-06-20 2016-09-14 天脉聚源(北京)传媒科技有限公司 一种关键词的提取方法及装置
KR102123062B1 (ko) 2013-08-06 2020-06-15 삼성전자주식회사 콘텐츠에 관한 정보를 획득하는 방법 및 이를 이용한 영상 표시 장치, 그리고 콘텐츠에 관한 정보를 제공하는 서버 시스템.
US9544650B1 (en) * 2013-08-20 2017-01-10 Google Inc. Methods, systems, and media for presenting news items corresponding to media content
WO2015038749A1 (en) * 2013-09-13 2015-03-19 Arris Enterprises, Inc. Content based video content segmentation
US10002187B2 (en) * 2013-11-26 2018-06-19 Oracle International Corporation Method and system for performing topic creation for social data
US9996529B2 (en) * 2013-11-26 2018-06-12 Oracle International Corporation Method and system for generating dynamic themes for social data
CN103631975A (zh) * 2013-12-26 2014-03-12 成都科来软件有限公司 一种数据提取方法及装置
US9615122B2 (en) * 2014-01-30 2017-04-04 Echostar Technologies L.L.C. Methods and apparatus to synchronize second screen content with audio/video programming using closed captioning data
US8913187B1 (en) * 2014-02-24 2014-12-16 The Directv Group, Inc. System and method to detect garbled closed captioning
CN110177290B (zh) 2014-04-27 2021-10-26 Lg电子株式会社 用于发送或接收服务指南分段的方法和设备
US9189514B1 (en) 2014-09-04 2015-11-17 Lucas J. Myslinski Optimized fact checking method and system
US11783382B2 (en) 2014-10-22 2023-10-10 Comcast Cable Communications, Llc Systems and methods for curating content metadata
EP3026584A1 (en) * 2014-11-25 2016-06-01 Samsung Electronics Co., Ltd. Device and method for providing media resource
KR102185700B1 (ko) * 2014-11-28 2020-12-02 삼성전자주식회사 디스플레이 장치 및 이의 정보 제공 방법
CN106713973A (zh) * 2015-07-13 2017-05-24 中兴通讯股份有限公司 搜索节目的方法及装置
US9923860B2 (en) 2015-07-29 2018-03-20 International Business Machines Corporation Annotating content with contextually relevant comments
KR102468763B1 (ko) * 2016-02-05 2022-11-18 삼성전자 주식회사 영상처리장치 및 그 제어방법
US10726054B2 (en) 2016-02-23 2020-07-28 Carrier Corporation Extraction of policies from natural language documents for physical access control
CN107180058A (zh) * 2016-03-11 2017-09-19 百度在线网络技术(北京)有限公司 一种用于基于字幕信息进行查询的方法和装置
KR102557574B1 (ko) * 2016-05-17 2023-07-20 엘지전자 주식회사 디지털 디바이스 및 그 제어 방법
US9900632B1 (en) 2016-12-30 2018-02-20 Echostar Technologies L.L.C. Viewing suggestions based on closed-captioned content from multiple tuners
WO2018203351A1 (en) * 2017-05-05 2018-11-08 Vidhi Techinnovation Opportunities Network Private Limited A method and system for extraction of event data from user devices
US11140450B2 (en) * 2017-11-28 2021-10-05 Rovi Guides, Inc. Methods and systems for recommending content in context of a conversation
CN111656794A (zh) 2017-12-14 2020-09-11 乐威指南公司 基于标记的内容聚合相关媒体内容的系统和方法
US20190236211A1 (en) * 2018-01-31 2019-08-01 Dell Products L. P. Method for dynamic monitoring of organization content and proactive suggestion of changes for effective search engine optimization
WO2019210987A1 (en) * 2018-05-01 2019-11-07 Telefonaktiebolaget Lm Ericsson (Publ) Providing personalized messages in adaptive streaming
CN108984582B (zh) * 2018-05-04 2023-07-28 中国信息安全研究院有限公司 一种查询请求处理方法
CN109614604B (zh) * 2018-12-17 2022-05-13 北京百度网讯科技有限公司 字幕处理方法、装置及存储介质
KR20200084413A (ko) * 2018-12-21 2020-07-13 삼성전자주식회사 컴퓨팅 장치 및 그 동작 방법
US10856041B2 (en) * 2019-03-18 2020-12-01 Disney Enterprises, Inc. Content promotion using a conversational agent
EP3901875A1 (en) 2020-04-21 2021-10-27 Bayer Aktiengesellschaft Topic modelling of short medical inquiries
EP4036933A1 (de) 2021-02-01 2022-08-03 Bayer AG Klassifizierung von mitteilungen über arzneimittel

Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393107A (zh) * 2000-07-27 2003-01-22 皇家菲利浦电子有限公司 充实视频的屏幕文字触发字
CN1723458A (zh) * 2002-12-11 2006-01-18 皇家飞利浦电子股份有限公司 用于利用视频内容获得文本关键字或短语以提供至基于网络资源的内容相关链接的方法和系统
CN1808430A (zh) * 2004-11-01 2006-07-26 西安迪戈科技有限责任公司 智能、图示和自动化互联网和计算机信息的检索和挖掘方法

Family Cites Families (130)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US5715445A (en) 1994-09-02 1998-02-03 Wolfe; Mark A. Document retrieval system employing a preloading procedure
US5790935A (en) 1996-01-30 1998-08-04 Hughes Aircraft Company Virtual on-demand digital information delivery system and method
US5983237A (en) 1996-03-29 1999-11-09 Virage, Inc. Visual dictionary
US5867799A (en) 1996-04-04 1999-02-02 Lang; Andrew K. Information system and method for filtering a massive flow of information entities to meet user information classification needs
US7069575B1 (en) 1997-01-13 2006-06-27 Sedna Patent Services, Llc System for interactively distributing information services
US5995959A (en) 1997-01-24 1999-11-30 The Board Of Regents Of The University Of Washington Method and system for network information access
US5974406A (en) 1997-08-18 1999-10-26 International Business Machines Corporation Automated matching, scheduling, and notification system
US6480844B1 (en) 1998-03-25 2002-11-12 At&T Corp. Method for inferring behavioral characteristics based on a large volume of data
EP0963115A1 (en) 1998-06-05 1999-12-08 THOMSON multimedia Apparatus and method for selecting viewers' profile in interactive TV
US6334127B1 (en) 1998-07-17 2001-12-25 Net Perceptions, Inc. System, method and article of manufacture for making serendipity-weighted recommendations to a user
US7720723B2 (en) 1998-09-18 2010-05-18 Amazon Technologies, Inc. User interface and methods for recommending items to users
US6317722B1 (en) 1998-09-18 2001-11-13 Amazon.Com, Inc. Use of electronic shopping carts to generate personal recommendations
US7284202B1 (en) 1998-10-09 2007-10-16 Microsoft Corporation Interactive multi media user interface using affinity based categorization
US7110998B1 (en) * 1998-10-13 2006-09-19 Virtual Gold, Inc. Method and apparatus for finding hidden patterns in the context of querying applications
US6253238B1 (en) 1998-12-02 2001-06-26 Ictv, Inc. Interactive cable television system with frame grabber
US6412073B1 (en) 1998-12-08 2002-06-25 Yodiee.Com, Inc Method and apparatus for providing and maintaining a user-interactive portal system accessible via internet or other switched-packet-network
US6842877B2 (en) 1998-12-18 2005-01-11 Tangis Corporation Contextual responses based on automated learning techniques
US6637028B1 (en) 1999-02-18 2003-10-21 Cliq Distribution, Inc. Integrated television and internet information system
JP2000242661A (ja) * 1999-02-23 2000-09-08 Fujitsu Ltd 関連情報検索装置および関連情報検索処理を実行するプログラムを記録した記憶媒体
GB9904662D0 (en) 1999-03-01 1999-04-21 Canon Kk Natural language search method and apparatus
US6493703B1 (en) 1999-05-11 2002-12-10 Prophet Financial Systems System and method for implementing intelligent online community message board
US20010003214A1 (en) 1999-07-15 2001-06-07 Vijnan Shastri Method and apparatus for utilizing closed captioned (CC) text keywords or phrases for the purpose of automated searching of network-based resources for interactive links to universal resource locators (URL's)
JP4743740B2 (ja) 1999-07-16 2011-08-10 マイクロソフト インターナショナル ホールディングス ビー.ブイ. 自動化された代替コンテンツ推奨を作成する方法及びシステム
US7181438B1 (en) 1999-07-21 2007-02-20 Alberti Anemometer, Llc Database access system
US7158986B1 (en) 1999-07-27 2007-01-02 Mailfrontier, Inc. A Wholly Owned Subsidiary Of Sonicwall, Inc. Method and system providing user with personalized recommendations by electronic-mail based upon the determined interests of the user pertain to the theme and concepts of the categorized document
US6774926B1 (en) 1999-09-03 2004-08-10 United Video Properties, Inc. Personal television channel system
US8528019B1 (en) 1999-11-18 2013-09-03 Koninklijke Philips N.V. Method and apparatus for audio/data/visual information
US7720712B1 (en) 1999-12-23 2010-05-18 Amazon.Com, Inc. Placing a purchase order using one of multiple procurement options
US6981040B1 (en) 1999-12-28 2005-12-27 Utopy, Inc. Automatic, personalized online information and product services
JP3718402B2 (ja) 2000-03-07 2005-11-24 株式会社東芝 情報配信システム、情報提供装置、情報蓄積装置及び情報提供方法
US7260579B2 (en) 2000-03-09 2007-08-21 The Web Access, Inc Method and apparatus for accessing data within an electronic system by an external system
US7062561B1 (en) 2000-05-23 2006-06-13 Richard Reisman Method and apparatus for utilizing the social usage learned from multi-user feedback to improve resource identity signifier mapping
GB2366478B (en) 2000-08-16 2005-02-09 Roke Manor Research Lan services delivery system
US7062488B1 (en) 2000-08-30 2006-06-13 Richard Reisman Task/domain segmentation in applying feedback to command control
AU2001294099A1 (en) 2000-08-31 2002-03-13 Docubase Reconfiguration and preservation of setup data
WO2002043310A2 (en) 2000-10-20 2002-05-30 Wavexpress, Inc. System and method of providing relevant interactive content to a broadcast display
GB0026353D0 (en) 2000-10-27 2000-12-13 Canon Kk Apparatus and a method for facilitating searching
US20020162120A1 (en) 2001-04-25 2002-10-31 Slade Mitchell Apparatus and method to provide supplemental content from an interactive television system to a remote device
US20020161767A1 (en) 2001-04-30 2002-10-31 Shapiro Aaron M. System and method for updating content on a plurality of content server computers over a network
US6826512B2 (en) 2001-06-28 2004-11-30 Sony Corporation Using local devices as diagnostic tools for consumer electronic devices
US7028024B1 (en) 2001-07-20 2006-04-11 Vignette Corporation Information retrieval from a collection of information objects tagged with hierarchical keywords
US7793326B2 (en) 2001-08-03 2010-09-07 Comcast Ip Holdings I, Llc Video and digital multimedia aggregator
US7389307B2 (en) * 2001-08-09 2008-06-17 Lycos, Inc. Returning databases as search results
US6792421B2 (en) 2001-08-13 2004-09-14 Genesis Group Inc. System and method for retrieving location-qualified site data
JP2003099442A (ja) 2001-09-26 2003-04-04 Toshiba Corp キー概念抽出規則作成方法、キー概念抽出方法、キー概念抽出規則作成装置、キー概念抽出装置、そのためのプログラム及び記録媒体
US20030074547A1 (en) 2001-10-11 2003-04-17 Haines Robert E. Hardcopy output engine consumable supply management and method
US7158961B1 (en) 2001-12-31 2007-01-02 Google, Inc. Methods and apparatus for estimating similarity
US20030131013A1 (en) 2002-01-07 2003-07-10 Cameron Pope Automated system and methods for determining relationships between information resources
US7343365B2 (en) 2002-02-20 2008-03-11 Microsoft Corporation Computer system architecture for automatic context associations
JP3627715B2 (ja) 2002-03-27 2005-03-09 ソニー株式会社 情報処理装置および方法、記録媒体、プログラム、並びに情報処理システム
AUPS138502A0 (en) 2002-03-27 2002-05-09 Aceinc Pty Limited Browsing tools and methods
US7716199B2 (en) 2005-08-10 2010-05-11 Google Inc. Aggregating context data for programmable search engines
US7203940B2 (en) 2002-04-29 2007-04-10 Hewlett-Packard Development Company, Lp. Automated installation of an application
US7899915B2 (en) 2002-05-10 2011-03-01 Richard Reisman Method and apparatus for browsing using multiple coordinated device sets
US8006268B2 (en) * 2002-05-21 2011-08-23 Microsoft Corporation Interest messaging entertainment system
US6766523B2 (en) 2002-05-31 2004-07-20 Microsoft Corporation System and method for identifying and segmenting repeating media objects embedded in a stream
JP2004056462A (ja) 2002-07-19 2004-02-19 Sony Corp 映像検索支援方法及び映像検索支援装置、並びに放送受信装置
EP1860579A1 (en) 2002-08-30 2007-11-28 Sony Deutschland Gmbh Method to split a multiuser profile
US8370203B2 (en) 2002-10-07 2013-02-05 Amazon Technologies, Inc. User interface and methods for recommending items to users
US20040073944A1 (en) 2002-10-15 2004-04-15 General Instrument Corporation Server-based software architecture for digital television terminal
US7020746B2 (en) 2003-01-28 2006-03-28 Microsoft Corporation Method and system for an atomically updated, central cache memory
US7885963B2 (en) 2003-03-24 2011-02-08 Microsoft Corporation Free text and attribute searching of electronic program guide (EPG) data
US7194460B2 (en) 2003-03-31 2007-03-20 Kabushiki Kaisha Toshiba Search device, search system, and search method
US7225187B2 (en) 2003-06-26 2007-05-29 Microsoft Corporation Systems and methods for performing background queries from content and activity
US7162473B2 (en) 2003-06-26 2007-01-09 Microsoft Corporation Method and system for usage analyzer that determines user accessed sources, indexes data subsets, and associated metadata, processing implicit queries based on potential interest to users
GB2403636A (en) 2003-07-02 2005-01-05 Sony Uk Ltd Information retrieval using an array of nodes
US7693827B2 (en) 2003-09-30 2010-04-06 Google Inc. Personalization of placed content ordering in search results
US20070061352A1 (en) 2003-12-03 2007-03-15 Koninklijke Philips Electronic, N.V. System & method for integrative analysis of intrinsic and extrinsic audio-visual
US7761885B2 (en) 2004-04-28 2010-07-20 Fujitsu Limited Task computing
US7363294B2 (en) 2003-12-19 2008-04-22 Fuji Xerox Co., Ltd. Indexing for contextual revisitation and digest generation
US7716158B2 (en) 2004-01-09 2010-05-11 Microsoft Corporation System and method for context sensitive searching
US20050177555A1 (en) 2004-02-11 2005-08-11 Alpert Sherman R. System and method for providing information on a set of search returned documents
US8041713B2 (en) 2004-03-31 2011-10-18 Google Inc. Systems and methods for analyzing boilerplate
JP4366249B2 (ja) 2004-06-02 2009-11-18 パイオニア株式会社 情報処理装置、その方法、そのプログラム、そのプログラムを記録した記録媒体、および、情報取得装置
JP4701175B2 (ja) 2004-06-30 2011-06-15 パナソニック株式会社 記録媒体並びに記録媒体に情報を記録する記録装置及び記録方法
US7617176B2 (en) 2004-07-13 2009-11-10 Microsoft Corporation Query-based snippet clustering for search result grouping
US7603349B1 (en) 2004-07-29 2009-10-13 Yahoo! Inc. User interfaces for search systems using in-line contextual queries
US7634461B2 (en) 2004-08-04 2009-12-15 International Business Machines Corporation System and method for enhancing keyword relevance by user's interest on the search result documents
US8407239B2 (en) 2004-08-13 2013-03-26 Google Inc. Multi-stage query processing system and method for use with tokenspace repository
US7386542B2 (en) 2004-08-30 2008-06-10 The Mitre Corporation Personalized broadcast news navigator
JP4588395B2 (ja) 2004-09-24 2010-12-01 富士通株式会社 情報処理端末
US20060074883A1 (en) 2004-10-05 2006-04-06 Microsoft Corporation Systems, methods, and interfaces for providing personalized search and information access
US20060084430A1 (en) 2004-10-14 2006-04-20 Ng Eric M System and method for categorizing information into zones to determine delivery patterns
US7853562B2 (en) 2004-11-02 2010-12-14 Sap Ag System and method for obtaining information from a data management system
KR100657010B1 (ko) 2004-12-22 2006-12-14 한국전자통신연구원 홈게이트웨이와 서비스 게이트웨이 플랫폼을 이용한 댁내UPnP 장치에 대한 댁외 멀티미디어 서비스 제공자의멀티미디어 서비스 장치 및 방법
JP2006186426A (ja) * 2004-12-24 2006-07-13 Toshiba Corp 情報検索表示装置、情報検索表示方法および情報検索表示プログラム
US7512601B2 (en) 2005-01-18 2009-03-31 Microsoft Corporation Systems and methods that enable search engines to present relevant snippets
US7565345B2 (en) 2005-03-29 2009-07-21 Google Inc. Integration of multiple query revision models
US20060242283A1 (en) 2005-04-21 2006-10-26 Dell Products L.P. System and method for managing local storage resources to reduce I/O demand in a storage area network
US7433935B1 (en) 2005-04-29 2008-10-07 Hewlett-Packard Development Company, L.P. Self-adapting plug-in service
WO2007004110A2 (en) 2005-06-30 2007-01-11 Koninklijke Philips Electronics N.V. System and method for the alignment of intrinsic and extrinsic audio-visual information
US7882262B2 (en) 2005-08-18 2011-02-01 Cisco Technology, Inc. Method and system for inline top N query computation
US20070198485A1 (en) 2005-09-14 2007-08-23 Jorey Ramer Mobile search service discovery
US20080242279A1 (en) 2005-09-14 2008-10-02 Jorey Ramer Behavior-based mobile content placement on a mobile communication facility
US20090029687A1 (en) 2005-09-14 2009-01-29 Jorey Ramer Combining mobile and transcoded content in a mobile search result
EP1934703A4 (en) 2005-09-14 2010-01-20 Deepdive Technologies Inc DEVICE AND METHOD FOR INDICATING AND BROWSING NETWORKED INFORMATION
US7895193B2 (en) 2005-09-30 2011-02-22 Microsoft Corporation Arbitration of specialized content using search results
US20070107019A1 (en) 2005-11-07 2007-05-10 Pasquale Romano Methods and apparatuses for an integrated media device
US20070130585A1 (en) 2005-12-05 2007-06-07 Perret Pierre A Virtual Store Management Method and System for Operating an Interactive Audio/Video Entertainment System According to Viewers Tastes and Preferences
US7792858B2 (en) 2005-12-21 2010-09-07 Ebay Inc. Computer-implemented method and system for combining keywords into logical clusters that share similar behavior with respect to a considered dimension
KR100728025B1 (ko) 2006-01-02 2007-06-14 삼성전자주식회사 UPnP 네트워크에서 외부의 유료 컨텐트를 획득하기위한 방법 및 장치
US8060357B2 (en) 2006-01-27 2011-11-15 Xerox Corporation Linguistic user interface
US7644072B2 (en) 2006-01-31 2010-01-05 Perfect Market, Inc. Generating a ranked list of search results via result modeling
US7844603B2 (en) 2006-02-17 2010-11-30 Google Inc. Sharing user distributed search results
US20080250010A1 (en) * 2007-04-05 2008-10-09 Samsung Electronics Co., Ltd. Method and system for determining and pre-processing potential user queries related to content in a network
US8115869B2 (en) 2007-02-28 2012-02-14 Samsung Electronics Co., Ltd. Method and system for extracting relevant information from content metadata
US8843467B2 (en) 2007-05-15 2014-09-23 Samsung Electronics Co., Ltd. Method and system for providing relevant information to a user of a device in a local network
US8209724B2 (en) 2007-04-25 2012-06-26 Samsung Electronics Co., Ltd. Method and system for providing access to information of potential interest to a user
US20080235209A1 (en) 2007-03-20 2008-09-25 Samsung Electronics Co., Ltd. Method and apparatus for search result snippet analysis for query expansion and result filtering
US20070214123A1 (en) 2006-03-07 2007-09-13 Samsung Electronics Co., Ltd. Method and system for providing a user interface application and presenting information thereon
US9100723B2 (en) 2006-03-07 2015-08-04 Samsung Electronics Co., Ltd. Method and system for managing information on a video recording
US8510453B2 (en) 2007-03-21 2013-08-13 Samsung Electronics Co., Ltd. Framework for correlating content on a local network with information on an external network
US8200688B2 (en) 2006-03-07 2012-06-12 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US8195650B2 (en) 2007-02-28 2012-06-05 Samsung Electronics Co., Ltd. Method and system for providing information using a supplementary device
US20070220037A1 (en) 2006-03-20 2007-09-20 Microsoft Corporation Expansion phrase database for abbreviated terms
US20070233287A1 (en) 2006-03-30 2007-10-04 Samsung Electronics Co., Ltd. Dynamic generation of tasks in resource constrained devices
US8442973B2 (en) 2006-05-02 2013-05-14 Surf Canyon, Inc. Real time implicit user modeling for personalized search
US7685192B1 (en) 2006-06-30 2010-03-23 Amazon Technologies, Inc. Method and system for displaying interest space user communities
JP4372134B2 (ja) 2006-09-29 2009-11-25 株式会社日立製作所 データ比較機能を有するストレージシステム
US7822738B2 (en) 2006-11-30 2010-10-26 Microsoft Corporation Collaborative workspace context information filtering
US8935269B2 (en) 2006-12-04 2015-01-13 Samsung Electronics Co., Ltd. Method and apparatus for contextual search and query refinement on consumer electronics devices
US10664850B2 (en) 2006-12-29 2020-05-26 Provenance Asset Group Llc Providing advertising content to at least one communicating terminal
US7921176B2 (en) 2007-01-03 2011-04-05 Madnani Rajkumar R Mechanism for generating a composite email
US20080183681A1 (en) 2007-01-29 2008-07-31 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices
US20090055393A1 (en) 2007-01-29 2009-02-26 Samsung Electronics Co., Ltd. Method and system for facilitating information searching on electronic devices based on metadata information
US20080183596A1 (en) 2007-01-31 2008-07-31 Ebay Inc. Bid system for presentation of data items
US7552114B2 (en) 2007-03-07 2009-06-23 International Business Machines Corporation System, and method for interactive browsing
US20090077065A1 (en) 2007-09-13 2009-03-19 Samsung Electronics Co., Ltd. Method and system for information searching based on user interest awareness
US8176068B2 (en) 2007-10-31 2012-05-08 Samsung Electronics Co., Ltd. Method and system for suggesting search queries on electronic devices
US8938465B2 (en) 2008-09-10 2015-01-20 Samsung Electronics Co., Ltd. Method and system for utilizing packaged content sources to identify and provide information based on contextual information

Patent Citations (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN1393107A (zh) * 2000-07-27 2003-01-22 皇家菲利浦电子有限公司 充实视频的屏幕文字触发字
CN1723458A (zh) * 2002-12-11 2006-01-18 皇家飞利浦电子股份有限公司 用于利用视频内容获得文本关键字或短语以提供至基于网络资源的内容相关链接的方法和系统
CN1808430A (zh) * 2004-11-01 2006-07-26 西安迪戈科技有限责任公司 智能、图示和自动化互联网和计算机信息的检索和挖掘方法

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
JP特开2003-99442A 2003.04.04

Also Published As

Publication number Publication date
KR20080080028A (ko) 2008-09-02
US20080204595A1 (en) 2008-08-28
US8115869B2 (en) 2012-02-14
CN101267518A (zh) 2008-09-17
KR101472931B1 (ko) 2014-12-15

Similar Documents

Publication Publication Date Title
CN101267518B (zh) 从内容元数据提取相关信息的方法和装置
US20230197069A1 (en) Generating topic-specific language models
US11197036B2 (en) Multimedia stream analysis and retrieval
CN102265276B (zh) 基于上下文的推荐系统
Szomszor et al. Semantic modelling of user interests based on cross-folksonomy analysis
CN101296362B (zh) 向用户提供对可能感兴趣的信息的访问的方法与系统
US9245001B2 (en) Content processing systems and methods
JP5105802B2 (ja) 情報処理装置
CN102119385B (zh) 用于在内容检索服务系统内检索媒体内容的方法和子系统
CN105069103B (zh) App搜索引擎利用用户评论的方法及系统
US8478759B2 (en) Information presentation apparatus and mobile terminal
US9218414B2 (en) System, method, and user interface for a search engine based on multi-document summarization
CN1965319A (zh) 信息检索装置、输入辅助装置、方法及程序
JP6429382B2 (ja) コンテンツ推薦装置、及びプログラム
JP4370850B2 (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN101595481A (zh) 用于在电子装置上促进信息搜索的方法和系统
WO2002101588A1 (fr) Systeme de gestion de contenus
CN102246164A (zh) 基于用户意图的信息搜索方法以及信息提供方法
CN102982800A (zh) 具有影音文件处理功能的电子装置及影音文件处理方法
JP2005056361A (ja) 情報処理装置および方法、プログラム、並びに記録媒体
CN103384883A (zh) 利用Top-K处理使语义丰富
CN106815284A (zh) 新闻视频的推荐方法及推荐装置
JP2004272355A (ja) 情報提示方法および情報提示システムならびに情報提示処理プログラム
JP2012038333A (ja) 情報処理装置
KR102279125B1 (ko) 취향필터에 기반한 추천 정보 제공 단말 및 장치

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20110518

Termination date: 20200227