CN1618232A - 有限确认 - Google Patents

有限确认 Download PDF

Info

Publication number
CN1618232A
CN1618232A CNA028275977A CN02827597A CN1618232A CN 1618232 A CN1618232 A CN 1618232A CN A028275977 A CNA028275977 A CN A028275977A CN 02827597 A CN02827597 A CN 02827597A CN 1618232 A CN1618232 A CN 1618232A
Authority
CN
China
Prior art keywords
description
audio
visual content
information
describe
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA028275977A
Other languages
English (en)
Other versions
CN100403788C (zh
Inventor
H·K·里辛三世
A·塔巴塔拜
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Sony Electronics Inc
Original Assignee
Sony Electronics Inc
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Sony Electronics Inc filed Critical Sony Electronics Inc
Publication of CN1618232A publication Critical patent/CN1618232A/zh
Application granted granted Critical
Publication of CN100403788C publication Critical patent/CN100403788C/zh
Anticipated expiration legal-status Critical
Expired - Fee Related legal-status Critical Current

Links

Images

Classifications

    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N9/00Details of colour television systems
    • H04N9/79Processing of colour television signals in connection with recording
    • H04N9/80Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback
    • H04N9/82Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only
    • H04N9/8205Transformation of the television signal for recording, e.g. modulation, frequency changing; Inverse transformation for playback the individual colour picture signal components being recorded simultaneously only involving the multiplexing of an additional signal and the colour video signal
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/20Servers specifically adapted for the distribution of content, e.g. VOD servers; Operations thereof
    • H04N21/23Processing of content or additional data; Elementary server operations; Server middleware
    • H04N21/235Processing of additional data, e.g. scrambling of additional data or processing content descriptors
    • H04N21/2353Processing of additional data, e.g. scrambling of additional data or processing content descriptors specifically adapted to content descriptors, e.g. coding, compressing or processing of metadata
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N21/00Selective content distribution, e.g. interactive television or video on demand [VOD]
    • H04N21/80Generation or processing of content or additional data by content creator independently of the distribution process; Content per se
    • H04N21/85Assembly of content; Generation of multimedia applications
    • H04N21/854Content authoring
    • HELECTRICITY
    • H04ELECTRIC COMMUNICATION TECHNIQUE
    • H04NPICTORIAL COMMUNICATION, e.g. TELEVISION
    • H04N5/00Details of television systems
    • H04N5/76Television signal recording
    • H04N5/78Television signal recording using magnetic recording
    • H04N5/782Television signal recording using magnetic recording on tape

Abstract

说明了一种用于处理视听内容的描述的方法和设备(图4)。按照一个实施例,创建视听内容的一个描述(104),定义关于该视听内容的描述的重用的信息。进一步,将该视听内容的描述和重用信息存储在一个描述性数据储存库(104)中,以便随后能重用这个描述。

Description

有限确认
发明领域
本发明涉及多媒体数据处理,更具体来说,涉及根据语义描述的多媒体数据处理。
发明背景
动画专家组(MPEG)开发关于视听内容的标准。MPEG标准方案的一个组成部分包括MPEG-7标准,其目的是提供用户可能感兴趣的视听内容的描述。特别地,开发MPEG-7标准是为了标准化描述视听内容的信息。MPEG-7标准可被用于各种领域,包括视听事项(items)的存储和从数据库的检索,广播媒体选择,远程购物,多媒体表示、因特网上的个性化新闻服务,等等。
按照MPEG-7标准,视听内容的描述由描述符(descriptors)和描述规则(description schemes)组成。描述符表示视听内容的特征,并定义每个特征表示的语法和语义。描述规则(DS)规定它们的组成部分(components)之间的关系的结构和语义。这些组成部分既可以是描述符也可以是描述规则。可以在一个树中或在一个图(graph)中组织一个描述规则的概念方面(conceptual aspects)。该图结构由一个代表一个描述规则的各元素(elements)的节点集合和一个规定各节点之间关系的边集合定义。
视听内容的描述(即描述符和描述规则)被划分为分段(segment)描述和语义(semantic)描述。分段描述从视听内容的结构的角度描述视听内容。就是说,这些描述是围绕代表视听内容的物理的空间、时间或时空的组成部分的分段构造的。每个分段可以由基于信号的特征(颜色、纹理、形状、运动、声频特征等等)和一些初级(elementary)语义信息描述。
语义描述从概念的观点描述视听内容,就是说,语义描述描述视听内容的实际含义而不是它的结构。分段描述和语义描述由一个连接(links)集合联系起来,这允许在内容结构和语义这二者一起的基础上对视听内容进行描述。这些连接将不同的语义概念与由分段描述所描述的视听内容内的实例(instances)联系起来。
当前的语义描述的描述能力有限,因为它们描述特定的语义实体(entities),而不标识这些特定的语义实体与其它有关的语义实体之间的关系。例如,当前的语义描述的模型包括各种语义实体的多个描述规则,这些语义实体诸如是事件、对象、状态、抽象概念等。一个事件DS描述一个有意义的时间定位(temporal localization)。例如,一个事件DS可以与现实世界或媒体中的一个具体实例(例如婚礼)相关联。一个对象DS在语义上描述一个特定对象(例如一个在一个图像中表示的汽车)。一个状态DS标识(例如一个对象或事件的)实体在给定的空间位置中或在给定的媒体位置中在给定的时间的语义特性(semantic properties)。一个概念DS描述不是通过从具体对象和事件中抽象(abstraction)而生成的抽象元素(abstract elements)。诸如自由或神秘等概念是概念描述所描述的实体的典型例子。
以上描述规则描述特定实体。然而,一个描述如果只由它自己描述一个个别实体,则不可能是完整的。多数人类描述和通信都是通过把信息集中在一起而完成的,在任何交流中,信息都很少得到完全的描述。言谈中存在着暗示,使双方建立适度相容的或相似的心态(mentalmodels),在这个上下文中讨论所要讨论的信息。所以,一个描述要精确地和完全地描述内容,必须含有各种与该内容相关的额外信息。这个额外信息可包括背景信息、上下文信息、标识所描述的内容与其它实体之间的关系的信息、等等。
此外,当前不存在用于产生暗喻和比喻的描述的机制。一个传统的意见是,语义描述只应描述视听内容,因此不需要产生暗喻描述。然而,人类一直在用暗喻和比喻而没有意识到在这样用。诸如“feelinglike a fish out of water”(觉得如虎行平地)、“getting close tothe deadline”(接近期限)、“flying like a bird”(如鸟飞翔)之类的暗喻和比喻是人类沟通中固有的。因此,把暗喻和比喻的描述从可能的描述清单中排除是不合乎要求的。
此外,当前的语义描述是静态的。当由一个现有的语义描述所描述的材料改变时,就必须重新执行产生一个描述的过程,以生成一个描述该改变的材料的新的语义描述。
因此,需要一种用于生成能够完整、准确地描述视听的或其它的任何语义情景的语义描述的工具。这样一个工具也应能生成动态地反映被描述的材料的变化的描述。
发明内容
说明一种用于处理视听内容的描述的方法和设备。按照一个实施例,创建视听内容的一个描述,并定义关于该描述的重用(reuse)的信息。进一步将该视听内容的描述和对应的重用信息存储在一个描述数据的储存库中,使这个描述随后能被重用。
附图说明
通过各附图中图示的例子非限定性地解释本发明。附图中相同的标注号指类似的元件。
图1和2是用于生成精神空间(mental spaces)的现有技术实施例;
图3表示视听内容的语义描述的各种结构形式的层次(hierarchy);
图4是用于处理视听内容的语义描述的系统的一个实施例的框图;
图5是用于提供视听内容的分布式描述的一个实施例的流程图;
图6是用于重用视听内容的描述的一个实施例的流程图;
图7是视听内容的描述的动态重用的一个实施例的流程图;
图8表示一个示例性的语义镶嵌组合体(semantic mosaic);和
图9是一个计算机系统的一个实施例的框图。
具体实施方式
说明一种用于处理视听内容的描述的方法和设备。在以下详细说明中,为了能彻底理解本发明,陈述了许多具体的细节。然而,对于所属技术领域的熟练人员来说,显然也可以脱离这些具体细节而实施本发明。在有些例子中,对众所周知的结构和装置用框图的形式表示,而不是详细地表示,以免不突出本发明。
接下来的详细说明的有些部分,是以对计算机存储器内的数据位的操作的算法和符号表示的形式给出的。这些算法说明和表示,是数据处理技术领域中的熟练人员用来最有效地向该领域中的其他熟练人员传达他们的工作实质的工具。这里,算法一般被设想成一个产生一个期望的结果的自相容的(self-consistent)步骤序列。步骤是那些要求对物理量进行物理操作的步骤。一般来说,尽管并非必要,这些量采取的是能被存储、传送、组合、比较和以其它方式被操作的电或磁信号的形式。已经证明,主要是为了普通使用,将这些信号称为位、值、元素(elements)、符号、字符、项(terms)、数字等等是方便的。
不过应当记住,所有这些或类似的术语应当要与适当的物理量相关联,并且仅仅是应用于这些量的方便标记。在以下讨论中除非另外地特别声明或显而易见,假设在整个说明书中,使用了诸如“处理”或“计算”或“确定”或“显示”等等的术语的讨论,指的是计算机系统或类似的电子计算装置的操作(action)或过程,该操作或过程处理在计算机系统的寄存器或存储器内的以物理(电子)量表现的数据并将其转换成在计算机系统存储器或寄存器或其它的这种信息存储、传输或显示装置内的以物理(电子)量类似表现的其它数据。
本发明也涉及用于执行本文中所述操作的设备。这个设备可以按照所需用途被专门地构造,也可以包含一个通用计算机,该通用计算机被存储在该计算机中的计算机程序有选择地启动或重新配置。这样一个计算机程序可以被存储在一个计算机可读存储介质中,例如一但不限于一任何类型的盘中,包括软盘、光盘CD-ROMs和磁光盘(magnetic-optical disks)、只读存储器(ROMs)、随机存取存储器(RAMs)、EPROMs,EEPROMs、磁或光卡、或任何类型的适合存储电子指令的介质,它们各自连接到一个计算机系统总线。
本文中介绍的算法和显示器(displays)并不是固有地与任何特定的计算机或其它设备有关的。可以使用带有按照本文教导的程序的各种通用计算机,构造执行所要求的方法步骤的更专用的设备可能也很方便。各种这些系统所需的结构将在以下说明中出现。此外,本发明并不是参照任何特定程序设计语言进行说明的。应当知道,可以用各种程序设计语言来实现本文中所述的本发明的教导。
本发明涉及生成视听内容描述的方方面面。如上所述,目前的描述工具缺少生成能以完整、准确的方式描述视听内容的描述的能力。这种局限是由目前的语义描述的特定于实体的(entity-specific)性质引起的。就是说,每个语义描述描述一个特定实体,描述方式独立于与这个特定实体有关的上下文和背景信息。然而,这种方法同支配是语义描述的原型的语言的感知和解释的规则相矛盾。这些规则有些是以使用所属领域中众所周知的精神空间(mental space)理论为基础的。
精神空间通过引入不包含在语言中的许多信息而为沟通(communication)提供上下文,由此提供一种用语言解释语义内容的机制。这个信息是用映象(maps)引进的。这些映象通过使用(即″吸收”(recruiting))代表用于解释的预定构造的框架(frames)、从一个精神空间向另一个投射(projecting)结构以及从多于一个的其它精神空间集成或抽象(abstracting)引入的材料而起作用。相应地,每个精神空间可代表一个包含实体、关系和框架的扩展描述。为了正确地定义描述中的所有实体,几个精神空间可以立即是活动的(active)。这些精神空间互相成为关系的一部分。因为精神空间互相借用结构和实体,这些精神空间的映射(mappings)是必需的。整个复合体构成被表达的描述的一个背景,并完成向有关实体附加语义意义的过程。
图1和2是用于创建精神空间的现有技术实施例。参看图1,通过吸收(recruiting)一些框架10并从已有精神空间20和30借用结构而生成一个新的精神空间50。参看图2,通过混合或集成两个现有的精神空间62和64而创建一个新的精神空间70。然后可以通过对全部三个精神空间(新的精神空间70以及现有的精神空间62和64)的概括(abstracting)而创建一个类属(generic)空间66。类属空间66包括对于精神空间62、64和70来说是共同的结构。
本发明用精神空间模型,以便能创建能够完全描述任何语义情形的语义描述。在一个实施例中,用于创建整个语义描述的工具是以多个描述范畴(categories)为基础的。这些范畴可包括对象、事件、状态、情节(episodes)、框架、描述结构和精神空间。这里所用的术语“对象”指的是一个真实(real)对象的描述,或若干个真实对象的复合体或抽象的描述。对象含有状态。每个状态是附属于对象和关系的属性的一个集合。通过扩展,状态可以是精神空间的属性集合。对象可以有子对象,对象状态可以有子状态。一个状态变化就是一个事件。因此,一个事件可以是对象或关系的(包括代表精神空间的)描述中的诸要素中的任何要素的变化。因为状态可以有子状态,所以事件可以有子事件。
也可以使状态附属于情节,一个事件可以是情节的描述中的诸要素中的任何要素的变化。一个情节是一个语义上重要的时间范围(timespan)。情节可以与对象的行为相符、与事件的发生相符、与关系的变化或被用于向对象、事件和关系提供上下文的精神空间相符。如果语义上重要的时间范围被适当地包含在一个情节中,则它们是子情节(subepisodes)
一个框架就是一个用于解释或描述一个语义对象集合的假定的或重新定义的规则集合。就此而论,框架本身就可以是原型的描述,或者它们可以是规则集合、定义集合和描述结构集合。描述结构是对象、情节、状态和关系的抽象。一个精神空间就是许多对象、关系和框架,加上嵌置来自描述或来自其它精神空间的描述结构的映射的集合。
语义内容的一个完整描述可以由上述各范畴的描述的任何组合组成。此外,该完整描述应当包括在被包括在该语义内容的完整描述中的语义实体之间的关系(relationships)的描述。实体之间的关系或者是一种联系(relation),或者是一种映射。因为联系可被表达为映射的合成(compositions),所以也能用术语”映射”来还可标识一个联系。关系可以是各种类型的,例如蕴含(inclusion)、容纳(containment)、相似(similarity)、相对位置、等等。
对象之间的关系构成结构。此外,对象、状态和事件向一个情节的映射也是结构。构成根本的精神空间的映射是结构。状态可以被表示为从被状态描述的实体到属性值的空间的映象。甚至对象也能被描述成结构:对象与从任何点集(point set)到对象本身的映射、或者与从对象本身到一个点集的任何映射,是一一对应的。因此,结构是语义描述构造的一个固有部分。
结构可采取各种各样的形式,包括射(morphisms)、图(graphs)、范畴(categories)、函子(functors)、自然变换(naturaltransformations)等等。射是一个范畴中的对象之间的箭头。一个范畴由两个集合组成:一个对象集合和一个射集合,它们遵从以下两个规则:
1)对于每个对象,必定有一个向其自己的射,称作“身份”(identity)射;
2)如果f是一个从A向B的射,g是一个从B向C的射,则必定有一个从A向C的射(通常写成(gof)的形式),这相当于首先确定f,然后确定g。
有可能定义范畴之间的映射。范畴之间的映射必须是从对象向对象的和从射向射的。范畴之间的映射也需要是按照该映射从任何射的源和目标到其图像的源和目标的(这是一个定义图的范畴的射的规则)。范畴之间的映射必须满足两个约束,即范畴约束(categoricalconstraints):
1)它们必须从身份映象(identity maps)映射到身份映象;和
2)它们必须保留合成,即,如果F把A映射到X,把B映射到Y,把C映射到Z,并且把f映射到h和把g映射到p,则F必须把(gof)映射到(poh)。任何服从上述约束的映射(map)都被称作是“范畴的”(categorical)。
两个范畴之间的范畴映射被叫做函子(functor)。函子在范畴之间映射,例如F映射范畴C到范畴D。有可能以C和D像对象一样、F像箭头一样(射)地来看这个映射。如果G映射范畴H到范畴J,则我们能作出一种新映射,即把C映射到H,把D映射到J,以及把F映射到H。如果这个新映射服从范畴约束,则它被称作自然变换。
图3表示视听内容的语义描述的各种结构形式的层次。射302是一种在两个对象304之间的映射。每个范畴310由一个对象集合(例如包括对象340)和一个射集合(例如包括射302)组成。函子306是一种在范畴310之间的映射。自然变换308是一种在函子之间的映射。自然变换之间不需要进行映射,因为该层次可以用“函子范畴”(functorcategories)继续。
这样,视听内容的一个完整描述就可以包括各种语义实体(例如对象、事件、状态、情节、框架、描述结构和精神空间)的描述,加上表达该完整描述的结构的描述。尽管这个方法提供了能够以完整、准确的方式描述任何语义描述的语义描述,它可能向作为结果的语义描述增加显著程度的复杂性。本发明的一个实施例通过分配视听内容的已有描述来解决这个复杂性问题。在这个实施例中,已有描述能被存档,然后被重用,以创建新的描述,如下文将要详细说明的那样。
图4是用于处理视听内容的描述的系统100的一个实施例的框图。系统100包含一个或多个服务器计算机112,它们与诸如客户机112的一个或多个客户机计算机相连。客户机112与服务器102的通信,可以通过任何有线或无线通信连接,例如包括诸如因特网的公共网络,诸如以太网、内部网或局域网(LAN)的局部网络,或者各种网络的组合。客户机112和服务器102的每一个都可以是任何类型的计算装置,诸如台式电脑、工作站、膝上型电脑、大型机等等。
在一个实施例中,服务器102含有存储视听内容的各种描述的数据储存库104。在一个实施例中,数据储存库104只含有视听内容的语义描述,即描述视听内容的实际意义的描述。作为选择,数据储存库104除了语义描述,还存储其它类型的描述(例如分段描述)。描述是与它们描述的视听内容独立地被存储的。在一个实施例中,每个描述都与相关联的重用信息被存储,而重用信息指明这个描述如何能被重用、用于创建视听内容的其它描述。重用信息的功能将在下文更详细地说明。
客户机112包括一个用于通过重用视听内容的已有描述创建新描述的工具。在一个实施例中,这个工具包括重用模块106、描述处理器108和重用信息创建器110。在一个实施例中,客户机112也包括一个数据储存库114,用于在本地存储视听内容的描述。
重用模块106负责寻找为创建视听内容的新描述而能被重用的已有描述数据。在一个实施例中,这个描述数据驻留在一个或多个服务器102的数据储存库104中。作为选择,这个描述数据的一些或全部可在本地驻留在数据储存库114中。已有描述数据可包括视听数据的描述的部分或全部。如上所述,每个描述都是与相关联的重用信息存储。重用模块106负责分析这个重用信息,以确定对于该特定描述来说,哪类重用是允许的。
描述处理器108负责用已有描述数据和相关联的重用信息创建视听内容的新描述。重用信息创建器119负责为新创建的视听内容的描述定义重用信息。在一个实施例中,该新描述被存储在本地数据储存库114中。作为选择,将该新描述传送到服务器102,在数据储存库104中存储。无论在哪一个实施例中,新描述都是与相关联的重用信息一起存储的,以便能在以后重用这个描述。
图5是用于提供视听内容的分布式描述的一个实施例的流程图。在处理块504,一个新的视听内容的描述被创建。在一个实施例中,该新的描述是通过重用一个或多个已有的描述被创建的,如下文结合图6更详细地说明的那样。作为选择,通过从多个已有的描述中概括一即抽取已有描述中的共同属性一而创建一个新的描述。在一个实施例中,新的描述是一个描述符。作为选择,新的描述是一个描述规则(DS)。如上所述,描述符代表是视听内容的特征,并定义每个特征表示的语法和语义。描述规则规定它们的组成部分之间的关系的结构和语义。这些组成部分既可以是描述符也可以是描述规则。在一个实施例中,新的描述是一个语义描述。一个语义描述可以描述诸如事件、对象、状态、关系、情节、描述结构和精神空间等语义实体、或者上述语义实体的任何组合。
在处理块506,定义关于所创建的描述的随后的重用的信息。这个信息指示对于这个描述来说哪种重用是允许的。例如,重用信息可以指示,是否这个描述能被嵌置在另一个描述中而不改变这个描述的本来的意思,或者是否能将这个描述再次划分成当为重用而被抽取时保持它们的意思的各个组成部分。重用信息也可以指示是否能转换该描述,以便能重用这个描述。例如,重用信息可以规定,是否能镜反射(mirror)一个眼睛的描述,以产生另一个眼睛的描述。此外,重用信息还可指出当该描述被重用时该描述是否能保持其传递(transitive)能力。例如,重用信息可以规定当这个描述被嵌置到一个更大的描述中时该描述是否将起一个子集的作用。
在处理块508,将描述和相关联的重用信息存储在一个描述数据储存库中,以便以后能重用这个描述。重用信息可以以与各种重用类型相关联的一个标志集合的形式、以规定该描述所允许的重用类型的组合的一个数目的形式、或者以任何其它形式被存储。在一个实施例中,该描述被存储在网络服务器上,并可以被多个客户机计算机通过网络(例如因特网或局部网)访问。作为选择,该描述也可被存储在本地的客户机计算机上并可以被客户机计算机的用户访问。无论在哪一个实施例中,该描述都能在以后被重用,以根据与这个描述相关联的重用信息创建新的描述。
图6是重用视听内容的描述的一个实施例的流程图。在处理块604,寻找应当被包括在新描述中的已有描述性数据。在一个实施例中,已有的描述性数据包括从存储在网络服务器上的多个描述中选择的一个或多个视听内容描述(或描述的各部分)。例如,一个描述提供者可创建多个可能潜在地有广泛用途的描述,并在网站上公布它们,供将来重用。在另一个例子中,在网站上公布的描述可以是通过从各种已有的描述中抽取共同的特征而创建的概括(或模板)。在这个例子中,这样的描述可以与一个说明这个描述是个概括的标志(indicator)一起被存储。在另一个例子中,从一个本地描述数据储存库中选择已有描述性数据或其各部分。
在处理块606,分析与所选择的描述性数据相关联的重用信息,以确定如何能重用所选择的描述性数据。如上所述,重用信息可以指示是否所选择的描述性数据能被包含、细分或变换,或者是否所选择的描述性数据是过渡的。
在处理块608,用所选择的描述性数据和相关联的重用信息创建一个新描述。在一个实施例中,新描述包括一个对所选择的描述性数据的引用,而不是数据本身,由此避免创建一个大而复杂的描述。由于描述性数据可包含多个描述(或它们的各部分),该描述可包括对多个描述的引用。例如,一个新的DS可包括对诸如对象描述规则、事件描述规则、状态描述规则、关系描述规则、情节描述规则、描述性结构描述规则和精神空间描述规则等描述规则的引用。根据重用的形式,需要从每个已有描述向一个新的描述的映射。在一个实施例中,这样的映射在每次需要创建一个新描述时被定义。作为选择,在一个新描述中引用一个归档版本的映射。
在一个实施例中,创建一个新描述的方法是,将已有描述性数据转换成一个描述的一部分,然后将这个部分描述映射到一个新描述。例如,在当前的MPEG-7标准下,完整的语义描述可包括多个对象描述规则、时间描述规则和概念描述规则。概念描述规则是用来允许封装复杂的概括,本身又可以包含对象描述规则、时间描述规则和概念描述规则。由于概念描述规则能被包含在对象和事件的描述中,创建一个对象或事件的新描述就要求将已有概念描述规则转换成新描述的一部分,然后将这个概念描述规则映射到新描述。
在另一个实施例中,创建一个新描述的方法是,访问已有描述的一部分,将这个部分描述映射成新的描述,由此使得能够重用已有描述的一部分,而不是整个已有描述。例如,可以访问已有概念描述规则内含有的对象描述规则并将其映射成视听材料的新描述。在一个实施例中,从已有描述中抽取部分描述,将其转换成独立的描述,然后嵌置到新描述内。
在另一个实施例中,创建一个新描述的方法是,选择各种已有描述(或它们的部分),用组合描述的规则词典(dictionary)中的组合规则组合它们。已有描述被映射到词典条目,然后执行规则,以创建一个新描述。然后,将对应的对象用新描述的各部分标识。规则和描述可位于本地机器上、在一个数据储存库中,或在几个数据储存库中,并可被描述处理器执行。数据储存库可以有用于形成描述的规则以及要使用的已有描述,它们都被整理在词典中。
在一个实施例中,用现有技术中任何能够执行不同视听数据的描述之间的图运算(graph operations)的机制将已有描述或者已有描述的各部分映射到一个新描述。作为选择,为此可以使用面向对象的继承(inheritance)机制。例如,私人继承(private inheritance)允许属性和方法的继承而不要获得数据类型关系。相应地,私人继承能被用来例如将已有描述的一部分映射到一个新描述。公共继承(Publicinheritance)提供一种生成范畴结构(categorical structure)的机制。因此,公共继承本能被用来例如将一个被转换成一个新描述的一部分的已有描述,映射到该新描述。此外,私人继承和公共继承二者都能被用来把已有描述映射到新描述。例如,这两种类型的继承都可以被用来把已有描述映射成概括(abstractions),然后进一步将各概括映射成一个综合这些概括的新描述。
在一个实施例中,描述的多重重用使得能够按范畴对描述进行实际的(de facto)标准化(与纯粹的(pure)标准化相对)。就是说,与在不可能知道在MPEG-7标准被采纳后在应用中出现的范畴的MPEG-7的开头强加的纯粹标准化成对比,可以通过-通过多重重用—标识那些有最多应用和用途的范畴来自然地创建标准。
按照本发明的一个实施例,视听内容的描述的创建是在视听内容的创建的同时通过动态地重用已有描述而进行的。例如,在连续报道国家灾难(national disaster)的同时描述一个专注于国家灾难的新闻节目时,可以动态地更新该新闻节目的描述,以创建演变的内容的新描述。
图7是视听内容的描述的动态重用的一个实施例的流程图。在处理块704,视听内容的第一描述被创建。在处理块706,如上文更详细说明的那样定义与第一描述相关联的重用信息。在一个实施例中,第一描述和相关联的重用信息然后被存储在本地数据储存库中。
在处理块708,重用第一描述,以根据重用信息创建被修改了的视听内容的第二描述。第二描述是在被修改的视听内容的创建的同事被创建的。在一个实施例中,通过更新第一描述的参数值而创建第二描述。在另一个实施例中,通过组合第一描述与其它新的或已有的描述数据而创建第二描述。在另一个实施例中,通过重用第一描述一些部分并丢弃第一描述的不再适用的其它部分而创建第二描述。例如,在一个在线情节(online episode)的描述期间,情节的对象之间的关系以及描述它们所需的结构都可能变化。于是,当前的描述可能需要修改,修改方式是更新其参数值,引入新描述或新部分描述以描述出现的行为,丢弃当前描述的不再需要的部分。
在一个实施例中,动态重用是利用诸如IBMTM的系统对象模型(SOM)的面向对象的建模进行的。SOM是一种允许二进制对象被不同应用共享的体系结构,它使得一个结构的描述、关系、属性在该结构演变期间能被动态改变。
本发明的一个实施例用语义镶嵌组合体来创建视听内容的新描述。语义镶嵌组合体利用相邻描述之间的相互关系被混合在一起的各种描述的集合。图8表示一个示例性的语义镶嵌组合体800。镶嵌组合体800由包括描述1-18的多个视听内容描述组成。创建镶嵌组合体800时,互相相关的描述被混合。例如,描述1和2有一个它们在该处携带相同信息的点。这个点被用来将描述2和1混合在一起。描述2也可与描述3有另一个共同点。这另一点可被用来混合描述2与描述3。第三个共同点可被用来将描述2与描述5混合在一起,如此等等。结果,描述2被与所有与描述2相关但是可能互相之间没有任何关系的描述1、3、4、5混合。因此,语义镶嵌组合体800给出一个不是特定地描述任何语义材料、但是包括代表各种语义内容的描述的本地片断(local pieces)的描述。本地片断可组合若干表述以描述某个语义实体。视上下文而定,被包括在某个本地片断中的描述的数量可以有变化。例如,在一个上下文中,描述5、10和11的组合可以提供视听内容的一个完整描述。在另一个上下文中,可能需要描述5、、9、10、12和13的组合才能提供视听内容的一个完整描述。在创建一个新描述时,可以重用适当的本地片断来创建新描述。在每个本地片断中含有的描述有以前定义的关系。因此,仅仅从语义镶嵌组合体中抽取适当的本地片断就可以创建新描述。作为选择,也可以将本地片断与其它描述性数据组合,以形成新描述。
图9是一个计算机系统900的一个实施例的框图。在该计算机系统900内可以执行一个指令集合,以使机器执行以上讨论过的任何一个方法。在替代性实施例中,机器可包含网络路由器、网络交换器、网络桥接器、个人数字助理(PDA)、蜂窝电话、Web设备或任何能执行一个规定由机器采取的行动的指令序列的机器。
计算机系统900包括处理器902、主存储器904和静态存储器906,它们通过总线908互相通信。计算机系统900可进一步包括视频显示单元910(例如液晶显示器(LCD)或阴极射线管(CRT))。计算机系统900也包括数字字母输入装置912(例如键盘)、光标控制装置914(例如鼠标器)、盘驱动单元916、信号生成装置920(例如扬声器)和网络接口装置922。
盘驱动单元916包括一个计算机可读介质924,上面存储有一个体现以上讨论过的任何一个或所有方法的指令集合(即软件)926。图中也显示软件926全部或部分驻留在主存储器904和/或处理器902内。软件926可进一步通过网络接口装置922被传送或接收。就本说明书来说,术语“计算机可读介质”应被认为包括任何能够存储或解码一个用于由计算机执行的、使计算机执行本发明的任何一个方法的指令序列。术语“计算机可读介质”应因此被认为包括一但不仅仅限于一固态存储器、光盘或磁盘、以及载波信号。
至此已经说明了用于处理视听内容的描述的方法和设备。尽管是参照具体的典型实施例对本发明进行说明的,显然在不偏离本发明更广义的精神和范围的情况下可以做出各种修改和改变。因此说明书和附图应被认为是示例性的而非限制性的。

Claims (41)

1.一种处理视听内容的描述的方法,该方法包含:
创建视听内容的一个第一描述(504);
定义关于第一描述的重用的信息(506);和
将第一描述和关于第一描述的重用的信息存储(508)在一个描述性数据储存库(104)中,以便随后能重用第一描述。
2.权利要求1的方法,其中,第一描述是语义描述。
3.权利要求1的方法,其中,第一描述是描述规则。
4.权利要求1的方法,其中,关于第一描述的重用的信息指示是否第一描述能被嵌置到视听内容的一个第二描述中而不改变第一描述原来的意思。
5.权利要求1的方法,其中,关于第一描述的重用的信息指示是否第一描述能被划分成多个部分描述,该多个部分描述的每个都适合随后的重用。
6.权利要求1的方法,其中,关于第一描述的重用的信息指示是否第一描述能在被重用以创建视听内容的一个第二描述时被转换。
7.权利要求1的方法,其中,关于第一描述的重用的信息指示,如果第一描述被重用以创建视听内容的一个第二描述,是否第一描述能保持过渡能力。
8.权利要求1的方法,进一步包含:
重用(708)存储在一个或多个描述性数据的储存库(104)中的多个描述,以提供该多个描述的按范畴的实际的标准化。
9.一种重用视听内容的描述的方法,该方法包含:
寻找(604)应当被包括在视听内容的一个新描述中的已有描述性数据;
分析(606)与描述性数据相关联的重用信息;和
用已有描述性数据和相关联的重用信息创建新描述(608)。
10.权利要求9的方法,其中,新描述是语义描述。
11.权利要求9的方法,其中,新描述是描述规则。
12.权利要求9的方法,其中,描述性数据是视听内容的一个或多个已有描述的至少一部分。
13.权利要求9的方法,进一步包含:
从一个或多个描述性数据的储存库(104)中检索描述性数据。
14.权利要求9的方法,其中,创建新描述进一步包含:
将已有描述性数据转换成一个部分描述;和
将该部分描述映射到新描述。
15.权利要求9的方法,其中,创建新描述进一步包含:
访问一个描述性数据储存库(104)中的已有描述性数据的一部分;和
将该已有描述性数据的部分映射到新描述。
16.权利要求9的方法,其中,创建新描述进一步包含:
进行已有描述性数据中的对象向新描述中的对应对象的词典映射。
17.权利要求9的方法,其中,创建新描述进一步包含:
把一个对已有描述性数据的引用包括到新描述中。
18.权利要求9的方法,其中,新描述是用一种执行图运算的机制创建的。
19.权利要求9的方法,其中,新描述是用一种面向对象的继承机制创建的。
20.权利要求9的方法,其中,创建新描述进一步包含:
从一个集成多个相关描述的语义镶嵌组合体中抽取已有描述性数据。
21一种动态地重用视听内容的描述的方法,该方法包含:
创建视听内容的一个第一描述(704);
定义与第一描述相关联的重用信息(706);和
根据重用信息重用第一描述,以创建被修改视听内容的一个第二描述(708),该重用是与被修改视听内容的创建同时地进行的。
22.一种用于处理视听内容的描述的系统,该系统包含:
用于创建视听内容的一个第一描述的装置(108);
用于定义关于第一描述的重用的信息的装置(110);和
用于一将第一描述和关于第一描述的重用的信息存储(508)在一个描述性数据储存库(104)中、以便随后能重用第一描述一的装置。
23.一种设备,包含:
描述处理器(108),用于创建视听内容的一个第一描述;
重用信息创建器(110),用定义关于第一描述的重用的信息;和
描述性数据储存库(104),用于存储第一描述和关于第一描述的重用的信息,以便随后能重用第一描述。
24.权利要求23的设备,其中,第一描述是语义描述。
25.权利要求23的设备,其中,第一描述是描述规则。
26.权利要求23的设备,其中,关于第一描述的重用的信息指示是否第一描述能被嵌置到视听内容的一个第二描述中而不改变第一描述原来的意思。
27.权利要求23的设备,其中,关于第一描述的重用的信息指示是否第一描述能被划分成多个部分描述,该多个部分描述的每个都适合随后的重用。
28.权利要求23的设备,其中,关于第一描述的重用的信息指示是否第一描述能在被重用以创建视听内容的一个第二描述时被转换。
29.权利要求23的设备,其中,关于第一描述的重用的信息指示,如果第一描述被重用以创建视听内容的一个第二描述,是否第一描述能保持过渡能力。
30.一种用于重用视听内容的描述的系统,该系统包含:
用于寻找应当被包括在视听内容的一个新描述中的已有描述性数据的装置(106);
用于分析与描述性数据相关联的重用信息的装置(106);和
用于用已有描述性数据和相关联的重用信息创建新描述的装置(108)。
31.一种设备,包含:
重用模块(106),用于寻找应当被包括在视听内容的一个新描述中的已有描述性数据并用于分析与描述性数据相关联的重用信息;和
描述处理器(108),用于用已有描述性数据和相关联的重用信息创建新描述。
32.权利要求31的设备,其中,新描述是语义描述。
33.权利要求31的设备,其中,新描述是描述规则。
34.权利要求31的设备,其中,描述性数据是视听内容的一个或多个已有描述的至少一部分。
35.权利要求31的设备,其中,新描述是用一种执行图运算的机制创建的。
36.权利要求31的设备,其中,新描述是用一种面向对象的继承机制创建的。
37.一种用于动态地重用视听内容的描述的系统,该系统包含:
用于创建视听内容的一个第一描述的装置(108);
用于定义与第一描述相关联的重用信息的装置(110);和
用于根据重用信息重用第一描述,以创建被修改视听内容的一个第二描述装置(108),该重用是与被修改视听内容的创建同时地进行的。
38.一种设备,包含:
描述处理器(108),用于创建视听内容的一个第一描述;和
重用信息创建器(110),用于定义与第一描述相关联的重用信息,描述处理器(108),用于根据重用信息重用第一描述,以创建被修改视听内容的一个第二描述,该重用是与被修改视听内容的创建同时地进行的。
39.一种提供指令的计算机可读介质,当指令在处理器上被执行时,使所述处理器执行包含下列步骤的操作:
创建视听内容的一个第一描述(504);
定义关于第一描述的重用的信息(506);和
将第一描述和关于第一描述的重用的信息存储(508)在一个描述性数据储存库(104)中,以便随后能重用第一描述。
40.一种提供指令的计算机可读介质,当指令在处理器上被执行时,使所述处理器执行包含下列步骤的操作:
寻找(604)应当被包括在视听内容的一个新描述中的已有描述性数据;
分析(606)与描述性数据相关联的重用信息;和
用已有描述性数据和相关联的重用信息创建新描述(608)。
41.一种提供指令的计算机可读介质,当指令在处理器上被执行时,使所述处理器执行包含下列步骤的操作:
创建视听内容的一个第一描述(704);
定义与第一描述相关联的重用信息(706);和
根据重用信息重用第一描述,以创建被修改视听内容的一个第二描述(708),该重用是与被修改视听内容的创建同时地进行的。
CNB028275977A 2001-12-03 2002-12-03 用于处理视听内容的描述的方法和系统 Expired - Fee Related CN100403788C (zh)

Applications Claiming Priority (2)

Application Number Priority Date Filing Date Title
US10/005,252 US7925139B2 (en) 2001-12-03 2001-12-03 Distributed semantic descriptions of audiovisual content
US10/005,252 2001-12-03

Publications (2)

Publication Number Publication Date
CN1618232A true CN1618232A (zh) 2005-05-18
CN100403788C CN100403788C (zh) 2008-07-16

Family

ID=21714958

Family Applications (1)

Application Number Title Priority Date Filing Date
CNB028275977A Expired - Fee Related CN100403788C (zh) 2001-12-03 2002-12-03 用于处理视听内容的描述的方法和系统

Country Status (8)

Country Link
US (1) US7925139B2 (zh)
EP (1) EP1461945A4 (zh)
JP (1) JP4328623B2 (zh)
CN (1) CN100403788C (zh)
AU (1) AU2002359556A1 (zh)
DE (1) DE10297509T5 (zh)
GB (1) GB2400517B (zh)
WO (1) WO2003049432A1 (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
ATE513415T1 (de) * 2001-12-28 2011-07-15 Koninkl Philips Electronics Nv Verfahren zur verarbeitung von multimediainhalt
JP5220181B2 (ja) 2008-03-28 2013-06-26 テレフオンアクチーボラゲット エル エム エリクソン(パブル) エンドツーエンドインタードメインルーティング
US9898529B2 (en) * 2014-06-30 2018-02-20 International Business Machines Corporation Augmenting semantic models based on morphological rules
JP6830514B2 (ja) 2019-07-26 2021-02-17 zro株式会社 視覚的な意味属性および非視覚的な意味属性がビジュアルに関連付けられる方法ならびにコンピューティングデバイス

Family Cites Families (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JPH03125356A (ja) 1989-10-09 1991-05-28 Matsushita Electric Ind Co Ltd 記録再生装置の番組予約装置
US5012334B1 (en) * 1990-01-29 1997-05-13 Grass Valley Group Video image bank for storing and retrieving video image sequences
JP3125356B2 (ja) 1991-09-30 2001-01-15 松下電器産業株式会社 電子部品
JPH07326089A (ja) 1994-06-01 1995-12-12 Mitsubishi Electric Corp 記録再生装置
US5604855A (en) * 1994-09-28 1997-02-18 Crawford; Christopher C. Computer story generation system and method using network of re-usable substories
US6070167A (en) 1997-09-29 2000-05-30 Sharp Laboratories Of America, Inc. Hierarchical method and system for object-based audiovisual descriptive tagging of images for information retrieval, editing, and manipulation
US6411724B1 (en) 1999-07-02 2002-06-25 Koninklijke Philips Electronics N.V. Using meta-descriptors to represent multimedia information
US7197709B2 (en) * 1999-09-16 2007-03-27 Sharp Laboratories Of America, Inc. Audiovisual information management system with multiple user identifications
JP3738631B2 (ja) * 1999-09-27 2006-01-25 三菱電機株式会社 画像検索システムおよび画像検索方法
AU2001255806A1 (en) * 2000-03-14 2001-09-24 Sony Electronics Inc. A method and device for forming a semantic description

Also Published As

Publication number Publication date
GB2400517B (en) 2005-10-26
CN100403788C (zh) 2008-07-16
GB0413227D0 (en) 2004-07-14
AU2002359556A1 (en) 2003-06-17
US20040202450A1 (en) 2004-10-14
US7925139B2 (en) 2011-04-12
EP1461945A4 (en) 2008-05-14
JP4328623B2 (ja) 2009-09-09
DE10297509T5 (de) 2004-11-11
GB2400517A (en) 2004-10-13
EP1461945A1 (en) 2004-09-29
WO2003049432A1 (en) 2003-06-12
JP2005512213A (ja) 2005-04-28

Similar Documents

Publication Publication Date Title
CN100350381C (zh) 用于以一种语言独立语法记录宏的方法和系统
CN1278231C (zh) 将抽象句法表示法1数据模型化成对象模型的方法及系统
CN1713179A (zh) 在对象模型中的影响分析
JP2001514422A (ja) 分散型コンピュータシステム
JP2006244478A (ja) 構成可能なクエリを形成するapiおよびクエリ言語
Voisard et al. Abstraction and decomposition in interoperable GIS
Flotyński et al. Semantic representation of multi-platform 3D content
Spala et al. Extending MPEG-7 for efficient annotation of complex web 3D scenes
CN100403788C (zh) 用于处理视听内容的描述的方法和系统
Fabrikant Building task-ontologies for geovisualization
Houston et al. A formal description of the OMG's Core Object Model and the meaning of compatible extension
Zarri et al. CONCERTO, an environment for the “intelligent’indexing, querying and retrieval of digital documents
Furmanski et al. MOVIE model for open‐systems‐based high‐performance distributed computing
CN1494013A (zh) 专利分析与展示系统及方法
CN1291339C (zh) 专利自动分类与展示系统及方法
CN117332069B (zh) 基于大语言模型的建筑信息模型智能提取方法及系统
Hu et al. Shape modification of NURBS surfaces via constrained optimization
Costin et al. Building product models, terminologies, and object type libraries
GUO DESIGN AND IMPLEMENTATION OF A MULTIMEDIA DATABASE APPLICATION SYSTEM.
JP2005512213A5 (zh)
Sheldon et al. Multi-Agent System Case Studies in Command and Control, Information Fusion and Datat Managment.
Reinke FunWorlds–Functional Programming and Virtual Worlds
CN1501288A (zh) 专利引证信息实时更新与展示系统及方法
Yang et al. Design and Implement of Large-scale Social Network Analysis Platform Based on Hadoop.
US7236981B1 (en) Technique for generating code to implement value objects for use with database systems

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
CF01 Termination of patent right due to non-payment of annual fee

Granted publication date: 20080716

Termination date: 20151203

EXPY Termination of patent right or utility model