- 相关推荐
MPEG-7与媒体资产检索
MPEG-7与媒体资产检索
1、 引言随着电视技术与IT技术的不断融合,以及IT技术日新月异的发展,实现视音频信息的数字化管理即所谓的媒体资产管理已成为可能。但要实现对庞大的视音频数据进行组织、管理及检索,仅仅有数字化的视音频信息是远远不够的,这时便提出了所谓的"元数据(Metadata)"技术。"元数据"就是描述数据的数据,即有关视音频信息的描述信息。但现在多数媒体资产管理系统都是按照传统的管理信息系统的方式组织和管理元数据的,即将视音频信息进行编目,再将编目信息(元数据)存入数据库以备日后的检索和管理。这种方式对于版权、作者、主题等等文本信息是很有效的,但是要实现真正的面向内容的管理就力不从心了。针对这一问题,MPEG (Moving Picture Experts Group)推出了基于内容的多媒体描述标准MPEG-7。MPEG-7标准重点在于AV(Audiovisual)信息的描述和定义,以明确的结构和语法来定义AV信息的内容。它的正式名称是"多媒体内容描述接口(multimedia content description interface)"。通过MPEG-7格式定义的信息,使用者可以有效地搜寻、过滤和定义想要的视音频资料。2、 MPEG-7MPEG-7于2001年推出,它本身并不试图定义一种新的数字压缩方法,而主要是针对基于内容的多媒体描述问题。2.1 MPEG-7标准的范围MPEG-7是MPEG继MPEG-1、MPEG-2、MPEG-4之后制定的新标准,但它与前三个标准不同,它超越基于波形或基于样本、基于压缩(如MPEG-1和MPEG-2)甚至是基于对象(如MPEG-4)的表示,也超越具体的存储方式(如可以应用于存储在磁带、影片等上模拟信号也可以应用于存储在磁盘、光盘上的数字信号,甚至可应用于存在于纸上的图形、图片),其目的是建立一种基于多媒体内容的描述方式,以便更有效地支持多媒体资料在产生、存储、交换、传输等过程中的各种应用,这些应用包括搜索引擎、编辑工具和个性化的检索机制等。但MPEG-7并不涉及这些就在具体的应用本身,而是仅仅定义了多媒体内容的描述方法,图1是关于MPEG-7标准内容的抽象描述。MPEG-7对多媒体信息的描述目前主要包括以下几个方面(当然,随着应用的不断深入,MPEG-7也在不断的扩充和完善):● 有关媒体制作方面的信息(如媒体的制作商、标题等);● 有关媒体使用方面的信息(如媒体的版权、使用记录等);
● 有关媒体存储方面的信息(如媒体的编码方式、存储格式等);
● 有关媒体时间域、空间域方面的信息(如媒体中的场景切换、区域分割等);
● 有关媒体特征方面的信息(如媒体的灰度、纹理、音频特征等);
● 有关媒体内容表述方面的信息(如媒体中包括的对象、事件及其之间的相互关系等)。
2.2 MPEG-7描述
MPEG-7定义了一组的描述方法和工具,主要包含:
● 描述子D (Descriptors):用来描述多媒体内容的各种特征。
● 描述方案DS (Description Schemes):用来描述D之间的结构及关系。
● 描述定义语言DDL(Description Definition Language):用来定义D和DS的语言。一个MPEG-7描述(descriptions)由一组DS实例组成,并与AV素材的内容链接,以使用户能够快速、有效地访问需要的AV素材。描述可以与AV素材存储在同一存储系统中,也可以异地、远程存储。2.2.1描述子MPEG-7定义了一组标准的描述子,下表列出的是一些MPEG-7的视觉描述子: 类型特征描述子视觉结构网格分布二维/三维多视图时间序列三维空间坐标系时间插值颜色颜色空间颜色量化颜色直方图主颜色可扩展颜色颜色结构颜色分布GOF/GOP颜色纹理边缘直方图同类纹理纹理浏览形状对象范围基于区域的形状基于轮廓的形状三维形状运动镜头运动对象运动轨迹参数运动运动速度位置区域定位子时空定位子其它人脸描述子每个描述子都定义了标准和非标准两个部分,标准部分定义了描述子的语法、语义及其二进制的表示法。而操作部分是非标准的部分,许多低层的特征(如颜色直方图等)都是可以自动抽取的,推荐使用的特征抽取及匹配算法都包含在非标准的部分。2.2.2描述方案描述方案(DS)定义了各组成部分之间的结构和语义关系,它由描述子(D)和描述方案(DS)组成,下面是在AV内容描述方案中常用到的几个概念:● 语法结构:AV内容的物理和逻辑结构,如时间片断、空间区域的基础结构。
● 语义结构:语义含义的细分,如时间事件、空间对象结构。
● 语法语义链接:语法元素与语义元素间的结合。
一个顶层的AV描述方案往往是由多个描述方案组成:
● 一组语法结构描述方案(Syntactic structure DS):即片断、区域、颜色、文本、运动等物理特征的描述。
● 一组语义结构描述方案(Semantic structure DS):即对象、人物或事件等语义特征,如"进球"、"射门"、"广告"等。
● 语法语义链接描述方案(Syntactic-semantic links DS):即语法元素和语义元素之间的关系。
● 摘要描述方案(Summary DS):用于不同粒度间的浏览。
● 媒体信息描述方案(MetaIn
【MPEG-7与媒体资产检索】相关文章:
多级存储技术在媒体资产管理系统中的应用03-19
基于内容的图像检索研究11-20
几种信息检索模型比较03-05
信息检索中的查询扩展技术03-07
北虫草专利检索策略研究03-14
学术论文写作与文献的阅读检索11-17
自然语言检索中的概念控制03-21
医学参考文献快速检索的诀窍03-15
谈论文写作中文献资料的检索03-21