CN101346718A - 用于向用户提供选定内容项的方法 - Google Patents
用于向用户提供选定内容项的方法 Download PDFInfo
- Publication number
- CN101346718A CN101346718A CNA2005800524078A CN200580052407A CN101346718A CN 101346718 A CN101346718 A CN 101346718A CN A2005800524078 A CNA2005800524078 A CN A2005800524078A CN 200580052407 A CN200580052407 A CN 200580052407A CN 101346718 A CN101346718 A CN 101346718A
- Authority
- CN
- China
- Prior art keywords
- metadata
- content item
- content
- user
- context
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/387—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using geographical or spatial information, e.g. location
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/38—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/30—Information retrieval; Database structures therefor; File system structures therefor of unstructured textual data
- G06F16/33—Querying
- G06F16/335—Filtering based on additional data, e.g. user or group profiles
- G06F16/337—Profile generation, learning or modification
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/40—Information retrieval; Database structures therefor; File system structures therefor of multimedia data, e.g. slideshows comprising image and additional audio data
- G06F16/43—Querying
- G06F16/435—Filtering based on additional data, e.g. user or group profiles
- G06F16/437—Administration of user profiles, e.g. generation, initialisation, adaptation, distribution
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F16/00—Information retrieval; Database structures therefor; File system structures therefor
- G06F16/50—Information retrieval; Database structures therefor; File system structures therefor of still image data
- G06F16/58—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually
- G06F16/583—Retrieval characterised by using metadata, e.g. metadata not derived from the content or metadata generated manually using metadata automatically derived from the content
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/2866—Architectures; Arrangements
- H04L67/30—Profiles
- H04L67/306—User profiles
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/55—Push-based network services
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/50—Network services
- H04L67/60—Scheduling or organising the servicing of application requests, e.g. requests for application data transmissions using the analysis and optimisation of the required network resources
- H04L67/63—Routing a service request depending on the request content or context
-
- H—ELECTRICITY
- H04—ELECTRIC COMMUNICATION TECHNIQUE
- H04L—TRANSMISSION OF DIGITAL INFORMATION, e.g. TELEGRAPHIC COMMUNICATION
- H04L67/00—Network arrangements or protocols for supporting network services or applications
- H04L67/01—Protocols
- H04L67/02—Protocols based on web technology, e.g. hypertext transfer protocol [HTTP]
Abstract
本发明公开了一种用于向用户提供选定内容项的方法。内容项的选择是以预先指定给内容项的元数据以及以后产生和关联的元数据为基础的,其中预先指定给内容项的元数据通常是原创内容元数据,而以后产生和关联的元数据则被称为派生内容元数据;此外,内容项的选择还可以基于上下文元数据,尤其是派生上下文元数据。派生元数据是根据与所要应用的算法相对应的推导规则而自动产生的,其中举例来说,该算法被应用于内容项的内容、原创内容元数据以及上下文元数据。用户简档可以用于改善选择质量;此外,本发明还公开了一种根据机器学习技术来构建和维护用户简档的方法。
Description
技术领域
本发明涉及一种用于向用户提供选定内容项的方法。本发明旨在用于那些通过诸如数据网络(例如因特网)或电话网络(例如UMTS网络)之类的电信手段而被提供的基于内容的先进服务。
本发明与内容过滤、信息检索、服务个性化以及用户归档(userprofiling)领域相联系。
特别地,在被应用于丰富的多媒体内容项、也就是包含不同媒体内容组件(文本、图像、音频、视频、......)的内容项时,本发明将是非常有益的。
背景技术
每一天,在世界上都会有大量信息发布,这些信息可以通过印刷品、电视、因特网之类的不同信息媒体而被人们得到。此外,信息量也在快速增长。
不幸的是,对个人来说,当前可用信息源提供的庞大信息量通常是不可抗拒的,而个人则有可能无法或者没有兴趣在这些信息中拣选其感兴趣的项目。因此,目前需要一种服务或能力来为用户仅仅提供其感兴趣的信息。
长期以来,较为普遍的是根据“关键词”来过滤内容项。关键词由用户提供给软件应用;该软件应用既可以处于用户计算机本地,也可以运行在与用户计算机相连、例如通过因特网相连的远端计算机上。该软件应用会向用户返回与用户指定的关键词相关的所有可用内容项。
关键词是一种普通类型的元数据。在过去,“元数据”被定义成是“与信息相关的信息”;举个例子,对“文章”的“标题”和“摘要”来说,由于它们提供了关于文章内容的信息,因此它们是元数据,而文章的内容则是信息本身。
为了过滤内容信息,目前还开发了更复杂的方法。这些方法是以使用元数据标引不同内容项为基础的,特别地,所述元数据可以是“原创元数据(authored metadata)”,也就是通过内容项作者或是他人而与内容项关联的元数据。
一般来说,有效过滤内容项需要关于用户的知识,例如,该用户知识可以是用户习惯和/或用户偏好。
在Erika Savia等人发表于Proc.8th Finnish ArtificialIntelligence Conference,Human and Artificial InformationProcessing,第61-69页,1998的论文“Metadata Based Matching ofDocuments and User Profiles”中可以发现一份关于通过使用元数据和用户简档来过滤文档的有趣评述。
从国际专利申请WO02/41579中可以知道一种用于聚集和传送多媒体数据的方法。多媒体数据依照其内容而被分析,元数据提取模块提取相应元数据,以及预备用户简档。在从中心单元接收多媒体数据之前,用户借助通信设备来设置用户简档中的至少一部分用户数据和/或修改该数据。多媒体数据借助元数据并且根据用户简档而被选择,此外还借助再封装模块而从选定的多媒体数据中产生以用户特定方式优化的、面向内容的多媒体数据。所述以用户特定方式优化且面向内容的多媒体数据将会保存在中心单元的内容模块的数据库中,并被提供给用户。
根据这份国际专利申请(第8页第6~14行),元数据是根据基于内容标引技术来检索的,例如,该标引技术可以是美国专利5,210,868和5,414,644描述的技术之一。
发明内容
本发明涉及一种用于向用户提供内容项的方法,尤其涉及的是在考虑用户偏好的情况下提供选定内容项的方法。
本发明的基本思想是自动产生元数据,以及使用这些所产生的元数据来选择要提供的内容项。
申请人认识到,手动产生元数据、即手动产生一般原创元数据的处理是一个极其耗时的活动(我们是无法跟上日益增长的已发布信息的量),此外,该处理还很容易出错,并且通常不是面向服务的。因此,在实践中是很难达到适于过滤数量庞大的已发布信息的精度的。
申请人认识到,具有精确的用户简档以及具有构建和自动更新这些用户简档的能力是非常重要的。
此外,申请人还注意到,在提供内容时可以很有利地使用交互上下文来构建或更新用户简档。
根据本发明的方法可以由向用户提供个性化内容递送服务的服务供应商来提供。此外,上述考虑因素在以PULL(拖拉)模式和PUSH(推送)模式提供内容项的时候都是适用的。
根据本发明,内容是自动生成的,优选地,上下文元数据同样是自动生成的。派生元数据(derived metadata)是根据推导规则(derivation rules)自动生成的,并且该推导规则与所应用的算法是对应的,其中举例来说,所述算法是应用于内容项的内容、原创内容元数据以及原始上下文元数据的算法。
上述特征为根据本发明的选择方法提供了灵活性和动力。
除了显性和/或隐性用户反馈之外,在这里还可以很有利地使用派生元数据来构建和维护用户简档。以此方式可以精确构建用户简档,并且该用户简档可以随时间精确维护。优选地,构建和维护(也就是更新)用户简档的处理是通过使用机器学习技术来执行的。
本发明包括与内容项处理相关的第一个方面。内容处理与内容项的恰当选择基本对应。在优选实施例中,本发明还涉及与用户简档处理相关的第二个方面,其中该方面与恰当构建和维护用户简档的处理基本对应。
由于精确的内容选择可以依照用户简档匹配来执行,换言之,内容项是对照用户简档来匹配的,因此,这两个方面是相互联系的。为了构建和维护用户简档,较为有利的是使用与选定内容有关的用户反馈(显性和/或隐性)。
根据本发明的第一个方面,在接收到来自用户的内容请求时执行下列步骤:
-从上述请求开始产生一个查询;
-根据该查询来识别第一集合的内容项;
-识别那些有可能与该第一集合中的每个内容项关联的预先指定的内容元数据(通常是原创的);
-优选地,识别那些代表与上述请求相关联的上下文信息的原始上下文元数据,以及
-根据推导规则来为每一个内容项自动生成派生元数据,其中该推导规则与应用于内容项以及优选还应用于与所述内容项相关联的预先指定的内容元数据(如果存在的话)的算法相对应。更为优选的是,这些算法还被应用于原始上下文元数据。
优选地,在生成了派生元数据之后,第一内容项集合被保存在内容项储存库中。更为优选的是,依照用户请求产生并且与内容项相关联的派生元数据同样会保存在内容项储存库中,以便在以后使用,从而避免重复执行元数据推导处理。
当已经产生了与所述第一集合的每一个内容项相关联的派生元数据时,这时会将第二选定内容项集合提供给用户,其中所述第二集合包含在第一内容项集合内部。根据本发明的优选实施例,第二内容项集合是通过执行下列步骤提供的:
-为每一个内容项识别(派生和预先指定的)内容元数据;
-优选地,为每一个内容项识别上下文(派生的和原始的)元数据;
-识别产生该请求的用户所具有的用户简档,
-根据至少某些派生元数据来将所述第一集合的内容项与用户简档相匹配,以及为该集合的内容项产生一个排序;
-根据所述排序,将第二内容项集合提供给用户,其中所述第二集合与根据所述排序排列的第一集合相对应,或者(优选地)与包含最佳排序内容项的内容项子集相对应,以及
-优选地,收集关于所提供的内容项的用户反馈(显性和/或隐性的)。
对属于与用户反馈相关联的所述第二集合的内容项来说,每一个内容项都对应于一个交互事件,其中该交互事件优选作为一个记录而被保存在交互历史储存库中。由此,根据本发明的优选实施例,为了更新用户简档,执行下列步骤:
-检索与产生请求的用户相关的多个交互历史记录,其中每一个记录都包括一个内容项以及与所述内容项相关联的至少一个用户反馈(显性和/或隐性),并且该用户反馈通常是以用户投票表示的。优选地,这些记录还包括用户请求、原始上下文元数据以及与内容项相关联的内容元数据,其中该内容元数据是推导得到并且是预先指定的;
-选择用于构建该用户的预测模型的机器学习算法;
-将每一个记录(也就是所存储的每一个交互事件)编码成特征矢量,其中该特征矢量是被适配成与选定的机器学习算法结合使用的形式表示。所述特征矢量包含与关联于特定内容项的元数据相对应的多个元素,其中该元数据是推导得到以及(如果存在的话)是预先指定的,此外,该特征矢量还包含用户反馈。如果在记录中并未给出推导得到的元数据,那么可以从内容项储存库中检索这些元数据,其中该内容储存库包含第一集合的所有内容项,并且通常包含依照查询所选择的内容项;
-将选定的机器学习算法应用于所述特征矢量,其中每一个矢量与一个交互事件相对应,由此构建预测模型(用户模型);
-(更为优选的是)验证所构建的预测模型,以及
-通过使用新预测模型取代旧预测模型来更新上述用户的简档。
由此,根据本发明的优选方面,在考虑用户反馈的情况下,通过将机器学习算法应用于派生元数据,并且优选应用于预先指定的元数据,可以在第一内容项集合内部定义一个排序,由此提供第二内容项集合。更为优选的是,上下文元数据(原始的和派生的)是作为应用了机器学习方法的特征矢量中的独立特征而被考虑的。如果在交互历史储存库的记录中不存在派生上下文元数据,那么,由于原始上下文元数据的元数据推导的计算通常并不繁重,因此,他们可以从原始上下文元数据中同时(on-the-fly)被推导得到。
附图说明
通过结合附图来考虑下文中的描述,可以更清楚地了解本发明,其中:
图1显示的是实施根据本发明的方法实施例的系统的框图,
图2显示的是根据本发明来处理内容项的主要步骤的流程图,
图3显示的是根据本发明来处理用户简档的主要步骤的流程图,以及
图4示意性显示了一种被适配成存储内容项和相关元数据并且可以用于本发明的数据结构。
具体实施方式
在详细描述本发明之前,在下文中将会提供某些术语定义和描述。
基于内容的服务
在本说明书中,基于内容的服务是任何一种通过利用已有内容项集合来构建有可能对服务的订户有价值的信息内容的软件应用。聚集以及向用户呈现选定内容的方式是由服务应用逻辑来定义的。
用户可以采用PULL或PUSH这两种模式以及通过服务前端来与基于内容的服务进行交互;基于内容的服务可以提供一种或两种模式。在PULL模式中,用户通过直接访问服务前端来发起交互,其中该用户有可能提供特定输入,以便即时获取预期内容。在PUSH模式中,当用户预订(并且有可能在后续时间)基于内容的服务时,用户可以提供输入,并且该输入可以在以后产生服务内容。根据这些输入,当产生内容时,用户将被告知访问服务前端,以便获取该内容。
内容项(CONTENT ITEM)
在本技术领域中,内容项是用于基于内容的服务的用户内容交互的基本单元。基于内容的服务提供了通常充当服务订户(即用户)请求应答的内容项。内容项是作为服务递送的单个实体而被用户察觉的事物。但是,内容项也可以包括一个或多个内容成分。举例来说,如果内容项是足球比赛视频,那么该项目可以包括作为内容成分的两个比赛半场。
关于内容项的示例是:
-电影或电视节目,例如来自按需点播媒体递送环境的电影或电视节目;
-新闻文章,例如来自在线新闻阅读器的新闻文章;
-单独的万维网URL结果,例如来自万维网搜索引擎的万维网URL结果;
-曲目,例如来自内容共享网络环境的曲目;
-图片,例如来自在线媒体目录的图片;
-网页,例如来自因特网导航的网页;
-产品页面,例如来自电子商务目录的产品页面。
通常,内容项是包含一个或多个内容成分的结构化对象。
每一个内容成分都是多媒体元素,例如文本、图像、音频、视频、三维模型、矢量图形、图形布局。
关于文本成分的示例是:在线报纸文章的文本、新闻文章的文本部分、包含在网页中的文本、电子商务目录中的产品文本描述。关于图像成分的示例是:包含在网页中的图片和绘图、包含在新闻页面中的照片、包含在在线媒体目录中的图片。关于音频成分的示例是:包含按需点播媒体递送环境中的曲目的音频文件、包含内容共享环境中的曲目的音频文件、电影中的音轨、新闻文章中的音轨。关于视频成分的示例是:包含按需点播媒体递送环境的电影或电视节目的文件、包含内容共享环境中的视频的文件、新闻页面的视频部分。关于三维模型成分的示例是:代表在线电子商务目录中的器具的3D模型。关于矢量图形成分的示例是:网页中的Flash动画,SVG(可缩放矢量图形)文档。关于图形布局的示例是网页的图形布局。
举例来说,关于多成分内容项的示例是:与某条新闻相关并且包含文本成分(也就是描述该新闻的简短文本)、音频-视频成分(也就是描述和显示该新闻的音频-视频序列)以及音频成分(也就是描述该新闻的音频序列)的新闻项目。
内容元数据(CONTENT METADATA)
在过去,“元数据”被简单地定义为“关于信息的信息”。
更具体地说(并且根据W3【“www”】联盟),内容元数据通常包含描述指定内容项的数据结构,并且可以由计算机之类的机器自动处理。
内容元数据可以描述属于内容项的每一个内容成分,或者将该内容项作为一个整体来进行描述。
可供内容供应商使用的内容项通常具有元数据,例如标识标引(例如主题、字段、......)。当内容项可供基于内容的服务使用时,与该内容项相关联的元数据将被称为预先指定的元数据。预先指定的元数据通常是“原创元数据”,它是一种由他人或内容项作者而关联于内容项的内容元数据,所述他人或内容项作者通常位于内容供应商组织内部。原创元数据通常是借助注释处理而被手动指定给每一个内容项的。
元数据具有不同的种类,例如:文本元数据、关键词元数据、分类元数据(具有处于有限值集合以内的值的分类标签)、数字元数据。元数据可以具有更复杂的结构,其中举例来说,该结构可以是从先前类型(结构化元数据)组合中推导得到的结构,或是与根据RDF(资源描述框架)的语义网络(语义网络元数据)相对应的结构。
关于文本元数据的示例是:与网页中的图片相关联的文本描述(在这里可以提供与页面中的每一个图片的内容相关联的多个原创元数据)、网页内容的文本概述(与网页整体相关联的原创元数据)、与曲目项目相关联的曲目歌词。关于关键词元数据的示例是:用于描述新闻项目所覆盖的主题的关键词列表、与电影项目特征(如IMDB【互联网电影数据库】中的电影项目特征)相关联的关键词列表、用于描述场景主要特征以及图片项目中描述的主题的关键词列表。关于分类元数据的示例是:声明新闻项目的新闻分类(在预定新闻分类集合内部)的“分类”标签、声明曲目音乐流派(在预定的音乐流派集合内部)的“流派”标签、声明电影项目是“黑白”还是“彩色”的“彩色”标签。关于数字元数据的示例是:与电影项目的出品年份相对应的整数、与电影项目的持续时间(例如以分钟为单位)相对应的整数、与在电子商务目录中购买的产品项目的价格相对应的货币数量。
举例来说,结构化元数据可以应用于电影项目;在实践中,电影可以具有一个演职员表,并且该演职员表可以被表示成演员姓名以及演员年龄、演员在电影中的角色、演员性别等等的列表。关于结构化元数据表示的典型实例是由MPEG-7描述标准提供的。
上下文元数据(CONTEXT METADATA)
交互上下文(简称为“上下文”)是用于基于内容的服务的用户内容交互的一个重要元素。实际上,每一个用户内容交互都是在上下文内部发生的,并且该上下文通常会影响用户在某个指定上下文内部使项目引起关注以及在别的上下文中不使该项目引起关注的用户偏好。
交互上下文信息还可以关联于一个或多个元数据,这些元数据被称为上下文元数据。
该交互上下文是由不同的方面形成的。通常,最重要的方面是:“日期和时间”(何时发生交互)、“用户位置”(何处发生交互)、“交互设备”(供用户用于交互使用的设备)、“内容通道”(通过该通道来发生交互)、“环境状态”(交互期间)、“物理世界状态”(交互期间)、“用户状态”(交互期间)。
“用户位置”可以采用若干种方式以及若干种形式来提供,例如:从GPS系统或蜂窝网络获取的空间坐标、由短距离无线信标系统提供的逻辑坐标、传送关于用户所在位置的元数据描述。
举例来说,“交互设备”的特征可以是:设备的移动性(也就是移动或固定设备)、设备的图形显示能力(例如大小、分辨率、显示颜色数量)、设备的声音能力(例如音频通道数量),它的商标和模型。
在诸如按需点播媒体递送环境之类的某些环境中,每一个交互都包括选择“内容通道”,例如电视频道或电影供应商。
举例来说,“环境状态”可以从交互设备中的环境选项的设置中得到。举个例子,移动电话设备可以被设置成“会议”、“工作”或“家庭”模式,或者其状态可以被设置成“振铃”或“静音”模式。
举例来说,与“物理世界状态”相关的信息可以由检测温度、照明状态、湿度、压力、风速的传感器提供。
举例来说,与“用户状态”相关联的信息可以由检测用户身体加速度或是其某些生理参数的传感器来提供,其中举例来说,这些生理参数可以是心率、血压、皮肤导电性(以便确定其紧张/放松状态)。
在下文中,从一个或多个物理设备直接得到的上下文元数据将被称为“原始上下文元数据”。举例来说,该物理设备可以是定时器、传感器、开关(硬件或软件)。通常,这些设备是集成在包含用户接口的终端设备(例如移动电话、个人计算机等等)内部的。
元数据表示(MEADATA REPRESENTATION)
为了简化各种类型元数据的存取和处理,较为有利的是使用一种统一和便于扩展的格式。
目前业已发现的是,MPEG-7描述标准已特别适合本发明。在本说明书稍后描述的实施例中,该标准已被用作所有元数据、即原创和派生元数据的格式。特别地,内容项元数据是作为零个或多个“相关材料”块列表来组织的(参见图4),其中每一个相关材料都描述了一个可以引用实际内容或是代表元数据的XML【可扩展标记语言】块的同种信息块。引用始终都会指向相关的附件块,而所述附件块则转而保持实际内容(或元数据)或是提供可以发现内容(或元数据)所在的URL【统一资源定位符】。这种组织可以适合不同的存储策略,同时向内容成分以及元数据提供集中接入点。除了包含在每个相关材料中的信息之外,内容元数据还可以保持每一个已发布内容应该拥有的通用信息群组,例如创建日期,或是服务应用逻辑所需要的其他信息,例如用于指示是否可以认为内容可用的有效状态标记。
以下给出的是依照MPEG-7标准编码并且报告了成分的某些公共特征的“相关材料”。
上述“相关材料”指的是下文中用于实际媒体原始数据、尤其是图像的“相关附件”,其中该“相关附件”是根据MPEG-7标准编码的。
相同的方法还可以用于引入派生元数据:新的“相关材料”将被添加到列表中,如果需要的话,用于标引新的“相关附件”的引用可以适用于不适合这个“相关附件”模式的元数据XML块。
虽然所描述的元数据表示是优选的,但是应该理解,本发明并不局限于这种元数据表示。
派生元数据(DERIVED METADATA)
本发明提供了除预先指定的元数据以及原始上下文元数据之外的其他元数据,由于这些元数据是从交互事件内部的内容信息和/或上下文信息或是作为一个或多个交互事件的结果而被推导得到的,因此,这些元数据被称为“派生元数据”。
特别地,派生内容元数据可以直接从内容项中得到,也就是说,它可以直接从内容项的内容中得到,此外,派生内容元数据也可以间接地从内容项中得到,例如从关联于内容项的原创内容元数据中得到。当内容项被发布并且随后被软件程序生成时,派生内容元数据并不是直接可用的。
类似地,派生内容元数据可以直接从上下文项中得到,也就是说,它可以从交互事件的上下文中得到,或者从上下文项(即从关联于上下文项的上下文元数据)中间接得到。当检测到交互事件上下文并且随后由软件程序生成该交互事件上下文时,派生内容元数据并不是直接可用的。
派生元数据可以提供关于内容和上下文的更完整和更有用的信息。
派生元数据特别适合由软件程序自动处理。
在下文中将会述及关于元数据推导(derivation)的若干示例。
对从文本项内容(也就是文本自身)中推导得到的元数据来说,其示例是在文本中出现的单词连同每一个单词的出现次数的列表,并且它被称为文本的“词袋(bag of word)”表示;这些元数据给出了关于文本的整体词汇合成的信息。
对从文本项内容(也就是文本自身)中推导得到的元数据来说,它的其他示例包括文本量度,也就是针对文本所计算的数值参数,例如文本的全局长度、句子的平均长度或是属于文本的段落,句法结构的平均嵌套深度,Gunning的Fog索引(例如用于英文文本)以及Guplease索引(例如用于意大利语文本)。
举例来说,对从图像项的内容(也就是图像自身)中推导得到的元数据来说,其示例包括:
-亮度直方图,它是光强度在数字图像像素上的分布——它给出的是关于图像上的量度和对比度的信息;
-颜色直方图,它是基色分量(红、绿、蓝)在数字图像像素上的分布——它给出的是关于图像颜色组成的信息;
-图像的空间频率分量,举例来说,该分量是借助二维傅里叶变换计算的——它给出的是关于图像中的图案和纹理的呈现的信息;
-几何分类元数据,举例来说,该元数据是借助几何散列技术产生的——它给出的是关于图像中诸如线条、弧线、椭圆形、多边形之类的形状的呈现的信息;
-图案分类元数据,举例来说,该元数据是通过图案识别算法产生的——它给出的是关于图像中的特定信息,例如人脸、动物、植物、风景、建筑、标记、技术绘图、涂色、漫画的呈现的信息;
-文本元数据,举例来说,该元数据是通过光学字符识别技术产生的——它给出的是关于在图像中出现的字母、数字和单词的信息;
举例来说,从声音项的内容(也就是从声音自身)中得到的元数据包括:
-音频频谱成分,举例来说,该成分是借助快速傅里叶变换计算的——它给出的是关于声音的特性和组成的信息;
-音频波形——它给出的是关于声音动态特性的信息;
-图案分类元数据,举例来说,该元数据是通过图案识别算法产生的——它给出的是关于特定特征,例如特定音乐、语音、拍击声、爆炸声在音轨中的呈现的信息;
-文本元数据,举例来说,该元数据是通过语音识别技术产生的——它从音轨中提取发出声音的单词或句子。
通过使用特定分析和算法,可以从视频项内容(也就是从视频自身)中推导得出元数据。
场景分段分析技术可以给出关于视频时间结构的信息。例如,这种分析可以告知电影包括指定数量的场景,其中该场景的百分比是用强烈的运动行为表征的,而另一个百分比则是用声音很大的音乐的呈现来表征的。
运动对象识别算法可以给出关于特定对象在视频中的呈现的信息,其中该呈现是用特定的运动行为表征的,例如正在行走的人、交谈或唱歌的人、行驶中的汽车、正在掉落的物体、正在打开的门。
如果将视频分解成一系列静止图像,那么,倘若存在将图像序列上的最终得到的元数据平均的方式,则可以将某些用于静止图像的元数据提取技术应用于视频。
举例来说,从3D模型中推导得到的元数据包括:
-整体面积、整体体积、凸性、分形维度;
-图案分类元数据,其中举例来说,该元数据是通过图案识别算法产生的——它给出的是关于特定3D形状,例如方框、管道、轮形、线路、人形、物体形状的呈现的信息。
如先前所述,通常,元数据是可以从其他任何元数据中得到的。
举例来说,从数值元数据开始,符号范围可以通过使用能够聚集数值的离散化技术来产生;这是一种提供关于数值的更紧凑和更语义性的表示的方式。
元数据还可以通过使用本体(ontology)来得到。本体是一种使用了机器可读表示的概念化形式。本体可以用于组织元数据中的分类和关系;这样则允许将用户偏好模型构建到高阶语义分类和概念上。
举例来说,关于本体的信息可以在W3联盟网站(当前位于地址“http://www.w3.org”)以及Christiane Fellbaum编著并由MIT Press于1998年5月出版的“WordNet:An Electronic Lexical Database”一书中找到。
在下文中提供了与通过本体得到的元数据相关的两个示例。
用于时间的简单本体是依照“日间时间”和“夜间时间”的时间值分类;用于日期的简单本体是依照“工作日”和“周末日”的日期值分类。在用户偏好模型的构造中,时间值元数据和日期值元数据是没有意义的;而“日间时间/夜间时间”和“工作日/周末日”元数据则有可能会更为有效。举个例子,用户偏好模型可以声明用户喜爱在周末日夜间与关联于某个分类的内容项进行交互,而在同时包含日间和夜间在内的工作日中则不喜欢这些内容项。
本体特别适合产生分类元数据。让我们以三个文本项A、B、C为例,其中每一个文本项都包含了一篇新闻文章。文章A讲述的是人类肺部的计算机模型,并且包含(除了别的因素之外)元数据单词“计算机”和“哮喘”。文章B讲述的是机器人辅助手术,并且包含了元数据单词“软件”和“外科医生”。文章C讲述的是因特网,并且包含了元数据单词“网站”。通过将元数据单词与词汇本体相联系,可以扩充文章A和B,其中举例来说,所述扩充是通过抽象分类“医疗”来实施的,并且该抽象范畴可以添加到这两篇文章的元数据中。与之类似的是,所有这三篇文章A、B、C的元数据可以通过抽象分类“计算机科学”和“技术”来扩充。由此,用户对这些文章的兴趣有可能涉及该抽象分类,而不是单个字词。
元数据推导(METADATA DERIVATION)
本发明的一个重要方面是产生(也就是推导)元数据。这一点是根据推导规则(derivation rules)来实现的。
推导规则与应用于内容项和/或上下文信息和/或元数据的算法相对应,对应用了推导算法的数据来说,该数据通常被称为源。
推导规则规定的是所要应用的算法,其中该规定是通过引用实施该算法的插件模块来实现的,此外,该推导规则还规定了所要处理的源。
特别地,在这里可以提供下列类型的源:
●内容成分;
●原创内容元数据;
●原始上下文元数据;
●派生元数据(也就是从其他推导规则获取的元数据);
●扩展分析。
举例来说,推导规则可以借助规定上述元素(也就是用于实施所要使用的算法的模块、所需要的参数,以及所要使用的输入源)的XML【可扩展标记语言】文档来描述。
在下文中给出了关于推导规则的某些实例。
第一组实例涉及新闻浏览器应用。在这个应用中,内容项是新闻文章。每一个内容项都包含了两个内容成分:新闻文章标题和主体,并且这二者全都采用了文本形式。每一个内容项的内容都与作为原创元数据的文章的日期、分类、来源以及作者名称相关联;特别地,这个元数据包含在内容项中。
第一元数据推导规则是如下定义的:
通过执行插件模块提供的名为“BagOfWords(词袋)”的算法,该规则规定:获取构成新闻文章主体的文本数据,以此作为输入(源),以及产生其“词袋”表示,以此作为输出(目的地),也就是在主体中出现的单词连同每一个单词的出现数量的列表。
第二元数据推导规则是如下定义的:
通过执行名为“WordOntology”的插件模块所提供的算法,该规则规定:获取构成新闻文章主体的文本数据,以此作为输入,以及产生相关的概念词集合,以此作为输出。
该规则执行以下步骤:
●从源文本中产生“词袋”
●对照“LexicalOntology1”词汇本体来匹配源自所获取的“词袋”的每一个单词。对每一个匹配单词来说,它会提取:
-与单词相关联的上位体(hypernyms),两个等级以上(hypernym=2)。类似LexicalOntology1的词汇本体将被组织成树。如果从树的叶子朝着根部运动,那么这意味着从特定含义的单词朝着代表一个或多个抽象概念的单词移动。如果给出了某个单词,那么树中位于该单词上方的单词将被称为“上位体”(例如“医生”-“个人”-“活物”;“医生”-“专业”-“工作者”)。实际上,在本体中可以具有一个以上的树:
-与单词相关联的顶级语义分类(topsemanticlevel=“真”)(例如,单词“医生”属于顶级语义分类“医学”)。
●对所提取的概念(上位体和顶级语义分类)的出现进行计数,由此仅仅保持至少出现了三次的概念(minoccur=3)。通过执行这个处理,可以限制最终的概念数量,由此仅仅保持最接近的概念。
总的结果是一个新闻文章文本主体的语义表示,该表示采用了来自词汇本体的概念单词集的形式,并且每一个表示都具有其出现次数。
以下的第三和第四推导规则分别与上文中的第一和第二推导规则类似,但是其来源是新闻项标题而不是主体。然而应该指出的是,如在“Destination tag(目的地标签)”中声明的那样,从标题产生的元数据将会形成一个与从主体产生的元数据相分离的元数据集合。
以下规则将会通过执行插件模块“TextMetrics(文本量度)”提供的算法来产生与新闻主体长度相对应的数值元数据,并且这个元数据是作为其内单词的计数来提供的。
以下规则将会产生与新闻文章主体中的平均句子长度相对应的数值元数据。
以下规则将会产生用于表述估计得到的阅读新闻文章主体的易读性的数值元数据。
以下的三个规则将会产生与新闻主体文本中的日期、图表(数字、百分比、价格)以及人名的出现次数相对应的三个数值元数据。
第二组实例涉及音乐目录浏览器应用。在这个应用中,项目是音乐片段。每一个项目都包含了单个内容成分:编码音乐片段的音频文件(例如以MP3格式)。每一个项目还包含了音乐的标题、日期、流派、表演者姓名以及作者姓名,以此作为原创元数据。
在下文中定义了第二集合的四个元数据推导规则:
上述规则产生了分别表示“节拍速度”(也就是音乐片段的节奏特征的量化量度)、“人声效果”(也就是音乐片段中人声成分相对于器乐成分的加权)、“声音亮度”(也就是声音亮度的量化量度)以及“音量动态特性”(也就是声音音量随时间而发生的改变的量化量度)。该规则可以通过执行名为“AdvancedSpectralAnalysis”的插件模块提供的算法,以及通过应用于编码在音频文件中的音频信号的频谱分析技术来实现。
以下规则产生的是用于表述音乐片段年代的文本标记元数据,其中该元数据是从该片段的年份开始的。该规则可以通过由名为“NumericalDiscretizer”的插件模块提供的离散化技术、也就是语义描述(年代)中的数值元数据的伸缩范围来实现。
以下规则产生的是用于表述关于音乐主要表演者的流行度的粗略估计的数值元数据。该估计是通过将主要表演者的姓名提交到由名为“SearchEngineQuery”的插件模块所提供的万维网搜索引擎以及获取估计的点击(包含该姓名的网站)次数作为结果来实现的。
使用扩展分析源的推导规则
扩展分析提供了一种可以通过推导规则来影响的特殊类型的来源。这种来源规定了分析过程在储存库中包含的项目的整个子集(乃至所有项目)上的应用,以便获取关于域结构的整体分析。换句话说,使用扩展分析的推导规则并不局限于仅仅使用单个项目中包含的信息来提取元数据,而是可以为每一个项目产生新的元数据,并且这个新的元数据考虑了项目自身的整体结构。所述域是推导技术的应用领域,也就是向用户提供个性化选定内容的领域。
这些算法实际执行的是由扩展分析所规定的分析,并且这些算法可以由专用软件模块或是通用元数据生成器模块来执行;如果提供了专用模块,那么该专用模块可以是一个在需要时由通用元数据生成器模块调用的“插件”模块。
以下是基于扩展分析的推导规则;该规则作用于如上所述的音乐目录应用。
在上述推导规则中作为扩展分析而被规定的分析会采用四个派生数值元数据作为输入,这些数值元数据是通过应用先前示例中阐述的推导规则来获取的。这四个数值描述了每一个音乐片段的四个相关音频特征。
扩展分析规定的是对包含在内容储存库中的所有项目(也就是音乐片段)执行“群集分析”。群集分析是一种已知的统计技术,其中如果用相似值表征的项目群组(也就是群集)代表的是项目域中令人感兴趣的规则,那么该统计技术将被用于识别这些群组。对音乐域来说,最终得到的群集可以将共享相似音频外部特征、例如紧密性的音乐片段聚集到相同的音乐流派中。
实际执行该分析的算法是由名为“NumbericalClusterAnalysis”的插件模块提供的。
特别地,本示例中的扩展分析规定了所要应用的群集分析方法(Ward方法),必须应用分析的项目的范围(储存库中的所有项目),以及所要提取的群集的最大数量(10个群集)。
该分析允许推导规则为指定项目(音乐片段)产生用于指示群集与其紧密度的元数据。这个新的元数据标识的是音乐片段在群集所表示的“音乐风景”中的位置。
机器学习方法
机器学习方法允许计算机系统从属于特定应用领域(也就是域)的实际数据集合执行自动学习(也就是通过软件程序)。在给出了这种数据集合的情况下,机器学习方法能从数据自身当中提取图案和关系。
已被学习的图案和关系会由机器学习方法以一种形式量化模型来进行编码,其中该模型根据所使用的机器学习技术而采用不同的形式。关于模型形式的示例包括逻辑规则、数学等式以及数学图表。
机器学习方法的目标是更好地理解和量化数据内部的图案以及数据之间的关系,以便获取作为数据表示的模型。
大多数机器学习方法都使用特征矢量表示。如果将这些方法应用于构建与所提供的内容相关的用户偏好的预测模型,那么每一个特征矢量都会与一个内容项相关联,并且包括:
-独立特征,其中每一个特征都与一个关联于该内容项以及优选关联于原始或派生上下文元数据的派生或预先指定的元数据相对应,以及
-一个或多个目标特征,这些特征是由用户作为反馈(显性或隐性)提供并与所提供的内容项相关的分数表示的。举例来说,该反馈是由从1~10的数值表示的,其中较高的值对应正反馈。
然后,数据集合的每一个实例被表示为特征矢量。对单个目标特征来说,代表实例的矢量是“n+1”维的,并且采用如下形式:
<特征1,特征2,....,特征n,目标特征>
该特征矢量模型是域数据的形式表示,并且适合大多数机器学习方法。
在Tom Mitchell的“Machine Learning”,McGraw-Hill,1997中可以找到关于机器学习方法及其应用的大量论述。
优选地,数据集(将要由机器学习方法处理,以便构建用户简档的预测模型)包含了内容元数据(原创和派生)以及上下文元数据(原始和派生),并且以此作为独立特征。而用户反馈则是目标特征。机器学习方法的目标是发现一个用于预测用户偏好的模型(被称为用户模型或预测模型),也就是用于表述元数据与用户反馈之间的关系的机器学习模型。然后,当新内容项可用时,由此获取的预测模型可以用于估计用户对这些新内容项的评价。
对用特征矢量表示的数据集来说,该数据集的实例对应于单个交互事件,其中用户将会表述其对一个内容项的偏好,并且将会采用如下形式:
<内容元数据1,...,内容元数据m,上下文元数据1,...,上下文元数据p,用户投票>
其中m+p=n。
如果用户表达了对于多个内容项的偏好,那么将会创建多个特征矢量,并且这些特征矢量在形式上可以用矩阵(n+l)xq来表示,其中q是交互事件数量。举例来说,如果用户表达了其对10个内容项的偏好,那么将会创建矩阵(n+l)x10。然后,选定的机器学习算法将被应用于该矩阵。
目前有若干种公知的机器学习方法可以用于这个目的,这其中包括决策树,关联规则、神经网络以及贝叶斯方法,以及那些专门设计用于构建用户偏好模型的任务的方法。
在下文中参考先前所述的音乐目录应用而给出了在构建用户简档的过程中使用机器学习方法的示例。
在本示例中,例示内容项(音乐片段)是用两段元数据表示的:
-MusicGenre,音乐流派(作为原创数据提供),
-MusicBeatSpeed,每分钟的音乐片段的节拍(作为通过应用“MusicBeatSpeed”推导规则的派生元数据提供)。
交互上下文是用下列(派生)上下文元数据表示的:
-“Time(时间)”,它可以具有“日间”或“夜间”这两个值中的任何一个,并且该元数据论述的是用户与内容项的交互是在日间还是夜间发生(作为派生元数据并且通过应用基于简单时间本体的推导规则来提供)。
用户偏好是由以下特征给出的:
-“UserVote(用户投票)”,它可以具有“喜欢”或“不喜欢”这两个值中的任何一个,并且这个元数据论述的是用户为音乐片段提供的是肯定还是否定分数。
由此,参考先前了解的关于所述域的常规机器学习表示,用于用户表达其对音乐片段偏好的单个事件可以采用如下的矢量形式:
<MusicGenre,MusicBeatSpeed,Time,UserVote>
以下的用户/项目交互数据集合是作为示例给出的:
ID | Genre | MusicBeatSpeed | Time | UserVote |
1 | 摇滚 | 128 | 日间 | 喜欢 |
2 | 舞曲 | 130 | 日间 | 喜欢 |
3 | 舞曲 | 125 | 夜间 | 不喜欢 |
4 | 舞曲 | 130 | 夜间 | 不喜欢 |
5 | 摇滚 | 130 | 夜间 | 不喜欢 |
6 | 古典 | 55 | 日间 | 不喜欢 |
7 | 古典 | 60 | 日间 | 不喜欢 |
8 | 舞曲 | 70 | 夜间 | 喜欢 |
9 | 爵士 | 65 | 夜间 | 喜欢 |
10 | 古典 | 75 | 夜间 | 喜欢 |
11 | 爵士 | 60 | 夜间 | 喜欢 |
12 | 摇滚 | 125 | 日间 | 不喜欢 |
13 | 舞曲 | 135 | 夜间 | 喜欢 |
通过将决策树机器学习方法应用于上述数据集合,可以产生包含下列规则的用户偏好模型。
IF Time=″日间″AND MusicBeatSpeed>=125 THEN UserVote=″喜欢″
IF Time=″夜间″AND MusicBeatSpeed<=75 THEN UserVote=″喜欢″
应该指出的是,用于产生预测分数的上述用户偏好规则并不是用于产生派生元数据的推导规则。
上文中依照用户偏好规则表述的简单预测模型论述的是,这个特定用户在日间喜欢快节奏音乐(MusciBeatSpeed>=125),而在夜间则更喜欢镇静的音乐(MusicBeatSpeed<=75)。
应该指出的是,这个模型对上述数据集合的大多数情形都是成立的(12/13),但并不是对所有情形全都成立。
实施例详述
在下文中将会特别参考图1框图(服务应用)来提供关于本发明有利实施例的详细描述;在该图中使用了两个符号,即代表软件模块的矩形形状和代表储存库的圆柱形形状。
这个实施例参考的是为用户提供基于内容的服务的服务供应商。该服务可以是PULL类型的,也可以是PUSH类型的,还可以同时是这两种类型的。
基于内容的服务将选定内容项提供给用户。内容项可以由服务供应商直接或间接地递送给用户,其中举例来说,该内容项可以通过提供内容项所在或是可以访问内容的地址(例如因特网地址)来递送。内容项通常是由内容供应商通过分组数据网(例如因特网)或移动电话网(例如UMTS网络)之类的通信网络直接提供的。
基于内容的服务提供了构建和维护用户简档,以便提供更好的内容项选择。
这种基于内容的服务可以分成两种活动:
-处理内容项,
-处理用户简档。
处理内容项
处理内容项的活动包括:
-接收来自用户的请求,
-根据用户请求来选择内容项,
-优选地,根据用户的呈现简档来格式化选定内容项和将所述内容项呈现给用户(也就是依照服务应用逻辑个性化内容呈现),以及
-将选定内容项提供给用户。
在PULL模式中,一旦接收到用户请求,那么服务供应商将会根据该请求来识别一组内容项,然后,该服务供应商将会对这组内容项执行上述步骤;这意味着某些选定内容项通常是在用户请求之后不久作为针对用户的答复而提供的。
在PUSH模式中,服务供应商接收来自用户的请求,并且在不立即回复以及通常不立即处理的情况下将其存储,然后存在两种可能性。根据第一种可能性,服务供应商周期性识别所有新发布的内容项,然后它会对所有新发布的内容项执行上述步骤。根据第二种可能性,服务供应商在发布内容项的时候就立即识别该内容项,然后则会对新发布的内容项执行上述步骤。在PUSH模式中,内容项的提供可以分两个步骤来执行:首先,服务供应商简单地向用户告知其感兴趣的某些内容项可用,然后,一旦用户表达了其接收这些内容项的愿望,那么服务供应商将会发送(直接或间接)这些内容项;此外,用户还可以表达其只接收这些内容项中的一部分的意愿。
用户的每一个输入都会由服务前端模块(SFEM)、例如PC或移动终端接收和处理。用户的请求将会发送到服务应用逻辑模块(SALM),该模块则会嵌入特定于所要提供的基于内容的服务的逻辑。此外,模块SFEM向模块SALM发送与用户请求相关联的原始上下文元数据(例如日期和时间,用户位置等等)。
当模块SALM接收到来自模块SFEM的用户请求时,它会产生相应的内容查询(图2中的步骤201)。根据这个内容查询(从用户请求中推导)及其服务逻辑,模块SALM将会依照该内容查询而在内容项储存库CIR中识别第一内容项集合(图2中的步骤202)。举例来说,依照该内容查询,服务应用逻辑会在储存库CIR中识别与电影和电视连续剧相关的第一内容项集合。
储存库CIR存储了内容项以及预先指定给所存储的内容项的内容元数据(通常是原创元数据)。如以下部分中更详细说明的那样,储存库CIR还可以存储与内容项相关联的派生内容元数据,其中该内容元数据是从先前的元数据生成处理产生、也就是从先前的内容查询中触发的。
如果将用户反馈施加到所述第一内容项集合,那么,由于服务应用可以向用户询问的输入数量、例如显性偏好(“我喜欢”或“我不喜欢”)通常是受到限制的,因此将会出现可用性问题。此外,在很多情况下,关于这种输入的精确的形式化是不能实行的。
为了避免不良过滤,以及为用户保持精确内容的最终目标,模块SALM将会要求匹配器模块(MMM)根据用户简档来产生所述第一集合的内容项排序(图2中的步骤203)。然后,模块SALM从模块MMM接收的排序可以由模块SALM使用,以便滤除低分数内容项,选择最佳分数内容项,以及重排序所保留的内容项。这个处理可以根据已知的方法来完成。
由此,模块SALM将会借助MMM来过滤这个第一集合的内容项(图2中的步骤204),以便选择所识别的第一内容项集合内部的第二内容项集合。模块MMM是过滤活动的关键部件,并且它负责考虑用户的简档(或用户简档),这一点将会在下文中进行说明。优选地,通过MMM的过滤活动所获取的第二内容项集合是第一内容项集合的一个子集,尽管如此,虽然第二内容项集合是根据排序偏好来进行排序的,但是,在这里并不排除第二内容项集合包含了第一集合的所有内容项,由此用户可以依照与项目相关的排序来查看这些项目。
模块SALM累积、变换并且格式化子集中的内容项,以便将其呈现给用户(图2中的步骤205);与呈现选定的内容项不同,在这里可以仅仅将其告知用户。并且呈现和/或通知处理是由模块SFEM执行的。
根据本发明的优选实施例,图1的架构包括:
-用户简档储存库(UPR),
-元数据生成器模块(MGM)。
模块MGM提供了一组推导规则,以便产生派生元数据(内容和/或上下文)。这些推导规则是以推导算法为基础的。在图1的实施例中,这些算法处于模块MGM外部,并且是由推导算法模块(DAM)提供的,而该模块则是通过“插件”技术实现的;这样做允许具有本地和远端存储的算法,并且该算法将会由模块MGM进行调用。
模块MMM:
-从储存库UPR中检索当前用户的用户简档;以及
-从储存库CIR中为所述第一内容项集合中的每一个内容项检索与之关联的内容元数据,其中该内容元数据是预先指定的(通常是原创的)以及可能是派生的(作为先前交互事件的结果)。
此外,模块MMM从其他模块接收与当前上下文相关联的上下文元数据。特别地,原始上下文元数据是通过模块SALM而从模块SFEM接收的,以及派生上下文元数据是从模块MGM接收的。
模块MMM将原始上下文元数据发送到模块MGM,由此请求产生派生元数据(至少从原始上下文元数据开始),此外它还接收所产生的派生上下文元数据。这样一来,至少某些上下文元数据可以是同时(on the fly)推导得到的,也就是在与用户交互的过程中推导得到的。
然后,模块MMM会将用户简档应用于与所识别的第一内容项集合内部的每一个内容项相关联的内容元数据(预先指定的和派生的),并且优选将其应用于与当前上下文相关联的上下文元数据(原始和派生的)。这样一来,模块MMM将会对照用户简档来匹配第一内容项集合。在本实施例中,用户简档至少包含了一个预测模型(优选是通过机器学习方法产生的)。该预测模型被应用于所述第一集合的每一个内容项,并且为每一个内容项产生一个预测投票。与第一内容项集合相关联的预测投票集合将会由模块MMM使用,以便产生第一集合的内容项排序。所述排序将被提供给模块SALM,该模块则会定义一个第二内容项集合,该第二内容项集合是依照内容项的有序集合或是依照作为所述排序的结果而被选择的第一内容项集合的子集(例如只包括第一集合中最佳排序的内容项)来形成。
优选地,本发明的实施例还提供:
-用户交互记录器模块IRM,以及
-交互历史储存库IHR。
交互历史可以采取记录序列的形式,每个记录包含一些例如与用户请求(或相应的查询)、系统回复、上下文、元数据、用户反馈有关的信息。优选地,使用合成格式(例如链接或索引而不是物理项)。通常,交互历史的每个记录对应于不同的交互事件。
模块IRM的任务是更新交互历史(图2中的步骤206)。为此,模块IRM直接将用户请求(从模块SFEM接收的)记录到储存库IHR中。此外,模块SALM还通过模块IRM将其对用户请求的答复(以内容项形式)记录到储存库IHR中。通过模块IRM,模块SALM还可以将预测投票和/或用于答复用户的所有或部分(内容和/或上下文)元数据记录到储存库IHR中。
非常有利的是,为了节省储存库IHR中的存储空间,在储存库IHR中仅存储一种类型的元数据,即原始上下文元数据(这是因为在任何时间,其他元数据可以从储存库CIR中检索得到,或者由模块MGM产生);该处理可以由直接从模块SFEM接收此类元数据的模块IRM来执行。
服务应用可以要求用户提供其反馈,其中该反馈与在对请求的答复中提供的内容项相关;模块SALM也可以将模块SFEM用于这个目的。来自用户的典型反馈是用投票表示的(它可以直接与预测投票相比较)。在这种情况下,模块SALM可以通过模块IRM而将这类显性反馈存入储存库IHR中。非常有利的是,服务应用逻辑被设计成让用户自主选择是否提供显性反馈。
作为替换,当服务应用逻辑没有提供来自用户的显性反馈时,这时可以对用户行为进行监视,以便从中得到隐性反馈(举例来说,该处理可以由模块SFEM执行);举个例子,投票可以与用户在阅读新闻服务所提供的新闻项目中花费的时间相关联。在这种情况下,模块IRM可以将隐性反馈记录到储存库IHR中。
用户反馈的处理和记录(图2的步骤207)既可以是显性的,也可以是隐性的,该处理可以在每次答复之后执行,或者在服务交互会话结束时执行。
应该指出的是,如果内容项包含了多个内容成分,那么反馈还可以涉及整个内容项;非常有利的是,作为替换或补充,该反馈可以与内容项中的每一个成分有关。举个例子,用户可以总体表达与电影相关的投票,或者为其视频成分和音频成分表达单独的投票。在这种情况下,单独的投票是作为交互历史而被记录的。
处理用户简档
处理用户简档的活动包括创建(构建)和维护(例如更新)用户简档。在图1的架构中,用户简档被保存在储存库UPR中,并且用户简档构建器模块PBM被提供用于执行处理用户简档的活动。
非常有利的是,这个活动可以“脱机”执行,例如在用户交互数量较少的夜间执行。
根据本实施例,模块PBM执行下列步骤:
-从储存库IHR中检索用户的交互历史(图3中的步骤301)(其中该交互历史是完整的交互历史,或是与从最后一次用户简档更新到当前时间的时间范围相对应的部分交互历史)。该交互历史至少包括事件,并且通常包括一组事件。时间通常包括内容查询(对应于用户请求)、原始上下文元数据,以及依照该查询以及优选依照用户反馈提供的选定内容项集合;
-根据交互历史中包含的信息来选择适合构建用户偏好预测模型的恰当的机器学习算法(图3中的步骤302);
-PBM为交互历史中的每一个交互事件Ei产生一个“n+1”维的特征矢量,该特征矢量通常是单个矢量Vi(图3中的步骤303,步骤304和步骤305),其中n是与内容元数据(预先指定和派生的)相关的特征数量以及与上下文元数据(原始和派生的)相关的特征数量的总和。
-将选定的机器学习算法应用于先前步骤中产生的特征矢量(关联于事件Ei、Ej、Ek、......的Vi、Vj、Vk......),以便构建引入到用户简档中的新的预测模型(步骤306)。机器学习算法一次仅仅能够处理一个单独的特征矢量,或者它们也可以设法一次处理一组特征矢量(与前述实例中相同,其中该模型是通过处理与十三个交互事件相对应的十三个矢量来产生的);
-(优选地)对照预订接受判据(通常是“优于先前”类型的判据)来验证新构建的预测模型的性能,以此作为用户简档更新条件(步骤307)。举个例子,一种有效的已知验证技术是“十等分交互验证(ten-fold cross-validation)”,该技术基于事件的十种不同划分(举例来说,90%的事件用于构建模型,10%的事件用于验证模型)。根据特定实施方式,验证可以集成在机器学习方法内,以及
-通过在储存库UPR中用新模型替换先前模型来更新用户简档(步骤308)。
与交互事件Ei相关的特征矢量Vi的生成处理可以依照下列步骤来执行:
-检索原始内容元数据;
-将原始上下文元数据(记录在交互历史中)发送到模块MGM,请求从原始上下文元数据中产生派生上下文元数据;将原始上下文元数据和派生上下文元数据(从模块MGM中获取)编码到维度为p的上下文特征矢量Vix中(在图3的流程图中,以上的两个步骤是用单个步骤303表示的);
-从储存库CIR中检索内容元数据(原创和派生的);
-将内容元数据编码到维度为m的内容特征矢量Vic中,其中m+p=n(在图3中,上述两个步骤被表示为单个步骤304);
-将内容特征矢量Vic加入先前步骤中产生的上下文特征矢量Vix中,并且将作为目标特征的用户投票t添加到n+1维的单个特征矢量中,Vi=<Vix,Vic,t>(图3中的步骤305);
-识别机器学习方法算法,以及
-将所述机器学习方法算法应用于所述特征矢量Vi,以便获取用户偏好的预测模型。
应该指出的是,即使先前不存在预测模型,上文列举的步骤也是可以使用的,换言之,这些步骤不但可以用于更新用户简档,而且还可以用于构建新的用户简档。在这种情况下,举例来说,如果为任何内容都假设一个正反馈,那么将会使用一个虚构的用户模型。
如果用户表达了关于多成分内容项中的每一个成分的反馈,那么模块PBM应该考虑这类更详细的反馈。
在以上描述中假设用户只具有一个用户简档。但是,本发明还可以扩展到用户具有更多用户简档并且可以在其间切换的情形。举例来说,当上下文元数据不足以精确描述交互上下文时,例如当终端很难自动确定用户在家还是在办公室(除非用户在交互设备中设置了环境选项)时,这种处理将会是非常有利的。
用户简档选择可以在交互会话开始时进行,并且该选择通常包括多个请求以及具有隐性或显性反馈的相应答复。
作为替换,用户简档选择也可以在反馈操作的每一个时刻同时进行。
举例来说,假设用户在电影浏览应用中发现了他很喜欢的一部恐怖电影。该用户给出了关于该项目的很高的第一投票,由此规定该第一投票参考的是“个人”简档。由于恐怖电影对他的孩子并不是很好,因此,它还为这部电影给出了很低的第二投票,由此这一次规定了第二投票参考的是“家庭”简档。作为替换,用户可以设置其简档之一作为当前简档;用户给出的投票将参考所设定的简档。当用户请求关于电影的排序或推荐时,他需要指定给出所述推荐所要依照的简档。
在提供多个用户简档的实施例中,图1的模块需要考虑这种多重性。模块IRM还需要在储存库IHR中记录关于用户简档的信息。模块PBM需要选择所要更新的正确用户简档。模块MMM需要选择和使用正确的用户简档来产生内容项排序。
Claims (22)
1.一种用于向用户提供选定内容项的方法,包括以下步骤:
A)根据用户请求来识别第一内容项集合,其中第一内容元数据被预先指定给所述第一集合的内容项,
B)至少根据第一推导规则来为所述第一集合的内容项自动产生第二内容元数据,所述推导规则与至少应用于所述第一集合的内容项的算法相对应,
C)将所述第二内容元数据与所述第一集合的内容项相关联,以及
D)根据所述第一内容元数据和所述第二内容元数据来提供源自所述第一集合的第二选定内容项集合。
2.根据权利要求1所述的方法,其中所述算法还被应用于所述第一内容元数据的至少一些。
3.根据前述任一权利要求所述的方法,其中步骤B)还根据与所述选定内容项的交互上下文相关的第一上下文元数据来执行,以便自动产生第二上下文元数据。
4.根据前述任一权利要求所述的方法,其中所述第二内容元数据是从应用于多个内容项的算法中推导的。
5.根据前述任一权利要求所述的方法,其中步骤D)还根据所述用户的用户简档来执行。
6.根据权利要求5所述的方法,其中所述用户简档包括预测模型。
7.根据权利要求5或6所述的方法,其中在步骤D)中,针对所述第一集合的每一个内容项的排序是根据所述第二内容元数据以及所述预测模型提供的,由此根据所述排序定义所述第二内容项集合。
8.根据权利要求7所述的方法,其中针对所述第一集合的每一个内容项的排序是根据所述第二内容元数据、所述第二上下文元数据、以及所述用户简档来提供的,并且所述方法还包括根据所述排序来选择所述第二内容项集合。
9.根据前述任一权利要求所述的方法,其中所述第二内容项集合是作为针对所述用户的相应请求的答复提供的。
10.根据权利要求6所述的方法,还包括以下步骤:将来自所述用户的反馈与所述第二集合的至少一个内容项相关联。
11.根据权利要求10所述的方法,还包括以下步骤:记录所述第二集合的至少一个内容项以及来自所述用户的并与所述至少一个被记录内容项相关联的反馈。
12.根据权利要求11所述的方法,还包括以下步骤:记录用于选择所述至少一个内容项的所述第二元数据的至少一部分。
13.根据权利要求11或12所述的方法,还包括以下步骤:记录所述用户请求。
14.根据权利要求11~13中任一权利要求所述的方法,还包括以下步骤:至少根据所述被记录内容项以及用户反馈来构建或更新所述用户的预测模型。
15.根据权利要求14所述的方法,还包括以下步骤:记录所述第二元数据的至少一部分,以及至少根据所记录的第二元数据来构建或更新所述用户的预测模型。
16.根据权利要求15所述的方法,其中所述预测模型是通过应用于至少所述第二内容元数据的至少一种机器学习算法来构建或更新的。
17.根据权利要求16所述的方法,其中所述机器学习算法还应用于至少一些上下文元数据。
18.根据权利要求6所述的方法,其中用户简档包括至少两个预测模型。
19.根据前述任一权利要求所述的方法,其中所述第二内容项集合是由服务供应商提供的。
20.根据前述任一权利要求所述的方法,其中所述选定内容项是通过电信网络提供的。
21.一种计算机程序产品,该产品可以加载到至少一个计算机的存储器中,并且包括用于执行权利要求1~20中任一权利要求所述的方法的软件代码部分。
22.一种基于内容的服务,该服务包括以下步骤:收集来自用户的内容请求,以及根据权利要求1~20中任一权利要求所述的方法来向用户提供选定的内容项。
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
PCT/EP2005/011580 WO2007048432A1 (en) | 2005-10-28 | 2005-10-28 | Method of providing selected content items to a user |
Publications (1)
Publication Number | Publication Date |
---|---|
CN101346718A true CN101346718A (zh) | 2009-01-14 |
Family
ID=36609290
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CNA2005800524078A Pending CN101346718A (zh) | 2005-10-28 | 2005-10-28 | 用于向用户提供选定内容项的方法 |
Country Status (5)
Country | Link |
---|---|
US (1) | US8843482B2 (zh) |
EP (1) | EP1949263B1 (zh) |
JP (1) | JP2009514075A (zh) |
CN (1) | CN101346718A (zh) |
WO (1) | WO2007048432A1 (zh) |
Cited By (5)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081515A (zh) * | 2009-11-27 | 2011-06-01 | 国际商业机器公司 | 提供上下文感知的输入数据的方法和设备 |
CN102693573A (zh) * | 2012-04-20 | 2012-09-26 | 中南大学 | 高密度通讯环境下通讯数据收发方法 |
CN104281641A (zh) * | 2013-07-12 | 2015-01-14 | 汤姆逊许可公司 | 丰富多媒体内容的方法和对应设备 |
CN106062730A (zh) * | 2013-09-19 | 2016-10-26 | 西斯摩斯公司 | 用于主动构成内容以便在连续社交通信中使用的系统和方法 |
CN107078706A (zh) * | 2014-11-20 | 2017-08-18 | 英特尔公司 | 自动音频调整 |
Families Citing this family (97)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US7809663B1 (en) * | 2006-05-22 | 2010-10-05 | Convergys Cmg Utah, Inc. | System and method for supporting the utilization of machine language |
US7908270B2 (en) * | 2006-12-22 | 2011-03-15 | Yahoo! Inc. | System and method for managing access to media assets |
JP4538757B2 (ja) * | 2007-12-04 | 2010-09-08 | ソニー株式会社 | 情報処理装置、情報処理方法、およびプログラム |
JP5032183B2 (ja) * | 2007-04-12 | 2012-09-26 | 株式会社東芝 | 情報推薦システムおよび情報推薦方法 |
IL183391A (en) * | 2007-05-24 | 2011-06-30 | Peretz Shoval | Filtering method based on ontology and content for personal newspapers |
US9235848B1 (en) | 2007-07-09 | 2016-01-12 | Groupon, Inc. | Implicitly associating metadata using user behavior |
US20090055433A1 (en) * | 2007-07-25 | 2009-02-26 | Gerard Group International Llc | System, Apparatus and Method for Organizing Forecasting Event Data |
FR2921503B1 (fr) * | 2007-09-20 | 2010-01-29 | Alcatel Lucent | Dispositif d'indexage automatique de contenus |
FR2929480B1 (fr) * | 2008-03-28 | 2013-01-11 | Alcatel Lucent | Procede de determination de donnees complementaires relatives a au moins un contenu, procede pour transmettre ces donnees complementaires, dispositif de traitement et serveur d'applications associes |
US20090265277A1 (en) * | 2008-04-21 | 2009-10-22 | Thomas Mullen | Universal content catalog |
US9209975B2 (en) | 2008-10-15 | 2015-12-08 | Ricoh Company, Ltd. | Secure access of electronic documents and data from client terminal |
EP2113850A3 (en) * | 2008-04-30 | 2009-11-11 | Ricoh Company, Limited | Managing electronic data with index data corresponding to said electronic data and secure access of electronic documents and data from client terminal |
US20100042615A1 (en) * | 2008-08-12 | 2010-02-18 | Peter Rinearson | Systems and methods for aggregating content on a user-content driven website |
US20100082684A1 (en) * | 2008-10-01 | 2010-04-01 | Yahoo! Inc. | Method and system for providing personalized web experience |
US20100131571A1 (en) * | 2008-11-25 | 2010-05-27 | Reuveni Yoseph | Method application and system for characterizing multimedia content |
US8676775B2 (en) * | 2008-12-12 | 2014-03-18 | At&T Intellectual Property I, L.P. | Support 3-screen user experience in the context of a services marketplace |
US8700072B2 (en) | 2008-12-23 | 2014-04-15 | At&T Mobility Ii Llc | Scalable message fidelity |
US8893040B2 (en) * | 2008-12-23 | 2014-11-18 | At&T Mobility Ii Llc | Systems, devices, or methods for accessing information employing a tumbler-style graphical user interface |
US8145622B2 (en) * | 2009-01-09 | 2012-03-27 | Microsoft Corporation | System for finding queries aiming at tail URLs |
US8301624B2 (en) | 2009-03-31 | 2012-10-30 | Yahoo! Inc. | Determining user preference of items based on user ratings and user features |
US20130219333A1 (en) * | 2009-06-12 | 2013-08-22 | Adobe Systems Incorporated | Extensible Framework for Facilitating Interaction with Devices |
US9460092B2 (en) * | 2009-06-16 | 2016-10-04 | Rovi Technologies Corporation | Media asset recommendation service |
US8612435B2 (en) * | 2009-07-16 | 2013-12-17 | Yahoo! Inc. | Activity based users' interests modeling for determining content relevance |
US9424368B2 (en) * | 2009-09-18 | 2016-08-23 | International Business Machines Corporation | Storing and retrieving tags |
US9473828B2 (en) * | 2010-01-28 | 2016-10-18 | Futurewei Technologies, Inc. | System and method for matching targeted advertisements for video content delivery |
US8577896B2 (en) | 2010-06-08 | 2013-11-05 | Netflix, Inc | Interest based row selection |
EP2608065A4 (en) * | 2010-08-20 | 2014-02-26 | Rakuten Inc | DEVICE FOR PROVIDING INFORMATION, METHOD FOR PROVIDING INFORMATION, PROGRAM THEREFOR AND MEDIUM FOR RECORDING INFORMATION |
US20120084155A1 (en) * | 2010-10-01 | 2012-04-05 | Yahoo! Inc. | Presentation of content based on utility |
JP5503509B2 (ja) * | 2010-11-22 | 2014-05-28 | 日本電信電話株式会社 | 信頼関係強度推定装置、信頼関係強度推定方法、評価値予測装置、評価値予測方法、及びプログラム |
DE202011110377U1 (de) * | 2010-12-03 | 2013-09-20 | Titus Inc. | System eines hierarchischen Metadaten Managements und Anwendung |
US10140320B2 (en) | 2011-02-28 | 2018-11-27 | Sdl Inc. | Systems, methods, and media for generating analytical data |
US9424509B2 (en) | 2011-03-09 | 2016-08-23 | T-Mobile Usa, Inc. | System for application personalization for a mobile device |
EP2506171A1 (en) * | 2011-04-01 | 2012-10-03 | Waters Technologies Corporation | Graphical user interfaces for scientific data information sytems |
EP2506160A1 (en) * | 2011-04-01 | 2012-10-03 | Waters Technologies Corporation | Unified data structures for scientific data information systems |
US20120272258A1 (en) * | 2011-04-21 | 2012-10-25 | Winnol Llc | Methods and systems for displaying content |
US9326033B2 (en) * | 2011-06-17 | 2016-04-26 | Microsoft Technology Licensing, Llc | Movie discovery system |
JP5280495B2 (ja) * | 2011-07-19 | 2013-09-04 | 株式会社コナミデジタルエンタテインメント | アミューズメントシステム |
US8849819B2 (en) * | 2011-08-05 | 2014-09-30 | Deacon Johnson | System and method for controlling and organizing metadata associated with on-line content |
US9984054B2 (en) | 2011-08-24 | 2018-05-29 | Sdl Inc. | Web interface including the review and manipulation of a web document and utilizing permission based control |
WO2013063718A1 (en) * | 2011-11-01 | 2013-05-10 | Yahoo! Inc. | Method or system for recommending personalized content |
US20130159230A1 (en) * | 2011-12-15 | 2013-06-20 | Toyota Infotechnology Center Co., Ltd. | Data Forgetting System |
US8892350B2 (en) | 2011-12-16 | 2014-11-18 | Toyoda Jidosha Kabushiki Kaisha | Journey learning system |
US20130159919A1 (en) | 2011-12-19 | 2013-06-20 | Gabriel Leydon | Systems and Methods for Identifying and Suggesting Emoticons |
JP5857124B2 (ja) * | 2012-05-24 | 2016-02-10 | 株式会社日立製作所 | 画像解析装置、画像解析システム、画像解析方法 |
US9479552B2 (en) * | 2012-05-30 | 2016-10-25 | Verizon Patent And Licensing, Inc. | Recommender system for content delivery networks |
US8849843B1 (en) | 2012-06-18 | 2014-09-30 | Ez-XBRL Solutions, Inc. | System and method for facilitating associating semantic labels with content |
US20140067486A1 (en) * | 2012-08-29 | 2014-03-06 | International Business Machines Corporation | Systems, methods, and computer program products for prioritizing information |
US9135327B1 (en) | 2012-08-30 | 2015-09-15 | Ez-XBRL Solutions, Inc. | System and method to facilitate the association of structured content in a structured document with unstructured content in an unstructured document |
US20140067799A1 (en) * | 2012-08-31 | 2014-03-06 | Cbs Interactive Inc. | Techniques to track music played |
US9916306B2 (en) | 2012-10-19 | 2018-03-13 | Sdl Inc. | Statistical linguistic analysis of source content |
US9633363B2 (en) | 2012-11-08 | 2017-04-25 | Thnx, Llc | System and method of incentivized advertising |
US9047278B1 (en) * | 2012-11-09 | 2015-06-02 | Google Inc. | Identifying and ranking attributes of entities |
US9117280B2 (en) | 2013-08-29 | 2015-08-25 | Microsoft Technology Licensing, Llc | Determining images of article for extraction |
US9319486B2 (en) | 2013-09-25 | 2016-04-19 | Google Inc. | Predicting interest levels associated with publication and content item combinations |
US10849850B2 (en) * | 2013-11-21 | 2020-12-01 | D2L Corporation | System and method for obtaining metadata about content stored in a repository |
US10817791B1 (en) | 2013-12-31 | 2020-10-27 | Google Llc | Systems and methods for guided user actions on a computing device |
US9519408B2 (en) | 2013-12-31 | 2016-12-13 | Google Inc. | Systems and methods for guided user actions |
US10075510B2 (en) | 2014-03-13 | 2018-09-11 | Google Llc | Analytics-based update of digital content |
US10317859B2 (en) * | 2014-05-21 | 2019-06-11 | Paypal, Inc. | Personal music player |
US9043196B1 (en) | 2014-07-07 | 2015-05-26 | Machine Zone, Inc. | Systems and methods for identifying and suggesting emoticons |
US9792372B2 (en) * | 2014-07-11 | 2017-10-17 | Yahoo Holdings, Inc. | Using exogenous sources for personalization of website services |
CN105528356B (zh) * | 2014-09-29 | 2019-01-18 | 阿里巴巴集团控股有限公司 | 结构化标签生成方法、使用方法及装置 |
US10050912B2 (en) * | 2014-10-27 | 2018-08-14 | At&T Intellectual Property I, L.P. | Subscription-based media push service |
US10296956B2 (en) | 2015-01-14 | 2019-05-21 | Sap Se | Method, system, and computer-readable medium for product and vendor selection |
US10476742B1 (en) * | 2015-09-24 | 2019-11-12 | Amazon Technologies, Inc. | Classification of auto scaling events impacting computing resources |
WO2017059250A1 (en) | 2015-09-30 | 2017-04-06 | Hampton Creek, Inc. | Systems and methods for identifying entities that have a target property |
US10032463B1 (en) * | 2015-12-29 | 2018-07-24 | Amazon Technologies, Inc. | Speech processing with learned representation of user interaction history |
CN108701125A (zh) * | 2015-12-29 | 2018-10-23 | Mz知识产权控股有限责任公司 | 用于建议表情符号的系统和方法 |
US20170272435A1 (en) | 2016-03-15 | 2017-09-21 | Global Tel*Link Corp. | Controlled environment secure media streaming system |
US10614057B2 (en) | 2016-11-04 | 2020-04-07 | Microsoft Technology Licensing, Llc | Shared processing of rulesets for isolated collections of resources and relationships |
US10452672B2 (en) | 2016-11-04 | 2019-10-22 | Microsoft Technology Licensing, Llc | Enriching data in an isolated collection of resources and relationships |
US11475320B2 (en) | 2016-11-04 | 2022-10-18 | Microsoft Technology Licensing, Llc | Contextual analysis of isolated collections based on differential ontologies |
US10402408B2 (en) | 2016-11-04 | 2019-09-03 | Microsoft Technology Licensing, Llc | Versioning of inferred data in an enriched isolated collection of resources and relationships |
US10885114B2 (en) | 2016-11-04 | 2021-01-05 | Microsoft Technology Licensing, Llc | Dynamic entity model generation from graph data |
US10481960B2 (en) | 2016-11-04 | 2019-11-19 | Microsoft Technology Licensing, Llc | Ingress and egress of data using callback notifications |
EP3340130A1 (en) * | 2016-12-23 | 2018-06-27 | Hexagon Technology Center GmbH | Method for prediction of soil and/or plant condition |
US20190026473A1 (en) * | 2017-07-21 | 2019-01-24 | Pearson Education, Inc. | System and method for automated feature-based alert triggering |
US10405007B2 (en) | 2017-07-27 | 2019-09-03 | Global Tel*Link Corporation | Systems and methods for a video sharing service within controlled environments |
US10122825B1 (en) | 2017-07-27 | 2018-11-06 | Global Tel*Link Corporation | Systems and methods for providing a visual content gallery within a controlled environment |
US10015546B1 (en) * | 2017-07-27 | 2018-07-03 | Global Tel*Link Corp. | System and method for audio visual content creation and publishing within a controlled environment |
US11213754B2 (en) | 2017-08-10 | 2022-01-04 | Global Tel*Link Corporation | Video game center for a controlled environment facility |
CN110710199B (zh) * | 2017-08-22 | 2021-03-02 | 株式会社东芝 | 智能摄像机、图像处理装置以及数据通信方法 |
JP6668298B2 (ja) * | 2017-08-30 | 2020-03-18 | 株式会社東芝 | スマートカメラ、画像処理装置、スマートカメラシステム、データ送信方法およびプログラム |
US11176486B2 (en) * | 2017-12-28 | 2021-11-16 | International Business Machines Corporation | Building and matching electronic standards profiles using machine learning |
US11238367B1 (en) * | 2018-06-11 | 2022-02-01 | Meta Platforms, Inc. | Distribution of content based on machine learning based model by an online system |
CN112740715A (zh) * | 2018-09-20 | 2021-04-30 | 诺基亚技术有限公司 | 一种用于人工智能的装置和方法 |
US11188579B2 (en) * | 2019-04-08 | 2021-11-30 | Adobe Inc. | Personalized dynamic content via content tagging and transfer learning |
KR20210006595A (ko) * | 2019-07-09 | 2021-01-19 | 삼성전자주식회사 | 전자장치와 그의 제어방법, 서버, 및 기록매체 |
US11477223B2 (en) * | 2020-01-15 | 2022-10-18 | IronNet Cybersecurity, Inc. | Systems and methods for analyzing cybersecurity events |
US20210216820A1 (en) * | 2020-01-15 | 2021-07-15 | Bayerische Motoren Werke Aktiengesellschaft | Context Modeling in User Behavior Learning |
US20210231449A1 (en) | 2020-01-23 | 2021-07-29 | Bayerische Motoren Werke Aktiengesellschaft | Deep User Modeling by Behavior |
US11188707B1 (en) | 2020-05-08 | 2021-11-30 | Bold Limited | Systems and methods for creating enhanced documents for perfect automated parsing |
US11734499B2 (en) * | 2021-02-12 | 2023-08-22 | Avaya Management L.P. | Smart content indicator based on relevance to user |
EP4227824A1 (en) * | 2022-02-11 | 2023-08-16 | Siemens Aktiengesellschaft | Method and system for generating metadata tags for a plurality of engineering objects |
US11762898B1 (en) | 2022-03-31 | 2023-09-19 | Dropbox, Inc. | Generating and utilizing digital media clips based on contextual metadata from digital environments |
KR102468630B1 (ko) | 2022-08-05 | 2022-11-22 | 주식회사 레이첼블루 | 아이템 가치평가를 통한 아이템 바꿔쓰기 매칭 플랫폼 서비스 제공 장치 및 방법 |
JP7329293B1 (ja) * | 2023-06-09 | 2023-08-18 | Snafty株式会社 | 情報処理装置、方法、プログラム、およびシステム |
Family Cites Families (9)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US5210868A (en) * | 1989-12-20 | 1993-05-11 | Hitachi Ltd. | Database system and matching method between databases |
US5414644A (en) * | 1993-11-24 | 1995-05-09 | Ethnographics, Inc. | Repetitive event analysis system |
US6460036B1 (en) * | 1994-11-29 | 2002-10-01 | Pinpoint Incorporated | System and method for providing customized electronic newspapers and target advertisements |
AU2001253161A1 (en) * | 2000-04-04 | 2001-10-15 | Stick Networks, Inc. | Method and apparatus for scheduling presentation of digital content on a personal communication device |
WO2002007405A2 (en) | 2000-07-17 | 2002-01-24 | Blue Ripple, Inc. | Content distribution |
WO2002041579A1 (de) | 2000-11-09 | 2002-05-23 | Swisscom Ag | Verfahren zur aggregation und zum übermitteln von multimediadaten |
US20030115278A1 (en) * | 2001-12-13 | 2003-06-19 | Goker Mehmet H. | Method and system for personalizing content to be delivered to a group factoring into account individual interests of each group member |
US7451130B2 (en) * | 2003-06-16 | 2008-11-11 | Google Inc. | System and method for providing preferred country biasing of search results |
EP1484692B1 (en) * | 2003-06-04 | 2013-07-24 | Intel Corporation | Content recommendation device with user feedback |
-
2005
- 2005-10-28 JP JP2008536936A patent/JP2009514075A/ja not_active Withdrawn
- 2005-10-28 CN CNA2005800524078A patent/CN101346718A/zh active Pending
- 2005-10-28 WO PCT/EP2005/011580 patent/WO2007048432A1/en active Application Filing
- 2005-10-28 EP EP05806545.9A patent/EP1949263B1/en not_active Not-in-force
- 2005-10-28 US US12/084,241 patent/US8843482B2/en not_active Expired - Fee Related
Cited By (11)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN102081515A (zh) * | 2009-11-27 | 2011-06-01 | 国际商业机器公司 | 提供上下文感知的输入数据的方法和设备 |
US9104439B2 (en) | 2009-11-27 | 2015-08-11 | International Business Machines Corporation | Providing context-aware input data |
US9501207B2 (en) | 2009-11-27 | 2016-11-22 | International Business Machines Corporation | Providing context-aware input data |
US10241991B2 (en) | 2009-11-27 | 2019-03-26 | International Business Machines Corporation | Providing context-aware input data |
US10706224B2 (en) | 2009-11-27 | 2020-07-07 | International Business Machines Corporation | Providing context-aware input data |
US10726199B2 (en) | 2009-11-27 | 2020-07-28 | International Business Machines Corporation | Providing context-aware input data |
CN102693573A (zh) * | 2012-04-20 | 2012-09-26 | 中南大学 | 高密度通讯环境下通讯数据收发方法 |
CN102693573B (zh) * | 2012-04-20 | 2016-11-16 | 中南大学 | 高密度通讯环境下通信数据收发方法 |
CN104281641A (zh) * | 2013-07-12 | 2015-01-14 | 汤姆逊许可公司 | 丰富多媒体内容的方法和对应设备 |
CN106062730A (zh) * | 2013-09-19 | 2016-10-26 | 西斯摩斯公司 | 用于主动构成内容以便在连续社交通信中使用的系统和方法 |
CN107078706A (zh) * | 2014-11-20 | 2017-08-18 | 英特尔公司 | 自动音频调整 |
Also Published As
Publication number | Publication date |
---|---|
US8843482B2 (en) | 2014-09-23 |
WO2007048432A1 (en) | 2007-05-03 |
EP1949263B1 (en) | 2016-09-07 |
JP2009514075A (ja) | 2009-04-02 |
EP1949263A1 (en) | 2008-07-30 |
US20090234784A1 (en) | 2009-09-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN101346718A (zh) | 用于向用户提供选定内容项的方法 | |
CN111444428A (zh) | 基于人工智能的信息推荐方法、装置、电子设备及存储介质 | |
Carrer-Neto et al. | Social knowledge-based recommender system. Application to the movies domain | |
CN112214685A (zh) | 一种基于知识图谱的个性化推荐方法 | |
CN111259263B (zh) | 一种物品推荐方法、装置、计算机设备及存储介质 | |
CN108595660A (zh) | 多媒体资源的标签信息生成方法、装置、存储介质及设备 | |
CN106062730A (zh) | 用于主动构成内容以便在连续社交通信中使用的系统和方法 | |
AU2011269676A1 (en) | Systems of computerized agents and user-directed semantic networking | |
CN112131472A (zh) | 信息推荐方法、装置、电子设备和存储介质 | |
CN112231563B (zh) | 一种内容推荐方法、装置及存储介质 | |
Jin et al. | Reinforced similarity integration in image-rich information networks | |
WO2021155691A1 (zh) | 用户画像生成方法、装置、存储介质及设备 | |
CN113254711B (zh) | 一种互动图像的显示方法、装置、计算机设备和存储介质 | |
JP5367872B2 (ja) | 選択されたコンテンツアイテムをユーザーに提供する方法 | |
CN110990670B (zh) | 一种成长激励型图书推荐方法及推荐系统 | |
Elahi et al. | Recommender systems: Challenges and opportunities in the age of big data and artificial intelligence | |
Wang et al. | An enhanced multi-modal recommendation based on alternate training with knowledge graph representation | |
Qu et al. | A novel approach based on multi-view content analysis and semi-supervised enrichment for movie recommendation | |
Xu et al. | Do adjective features from user reviews address sparsity and transparency in recommender systems? | |
CN116051192A (zh) | 处理数据的方法和装置 | |
CN116578729B (zh) | 内容搜索方法、装置、电子设备、存储介质和程序产品 | |
Daras et al. | Introducing a unified framework for content object description | |
CN115964560B (zh) | 基于多模态预训练模型的资讯推荐方法及设备 | |
CN116956183A (zh) | 多媒体资源推荐方法、模型训练方法、装置及存储介质 | |
Chen et al. | Exploiting aesthetic features in visual contents for movie recommendation |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
C12 | Rejection of a patent application after its publication | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20090114 |