首页 新闻 论坛 群组 Blog 文档 下载 读书 Tag 网摘 搜索 开源 FAQ 第二书店 博文视点 程序员
频道: 研发 数据库 中间件 信息化 视频 .NET Java 游戏 移动 服务: 人才 外包 培训
    图书品种:235680
       
热门搜索: ASP.NET Ajax Spring Hibernate Java

3.2  语义Web中的元数据和本体

  语义Web提供一个允许越过应用、企业和社会界限进行数据共享和重复使用的通用框架。它是W3C[5]牵头组织由大量研究人员和企业参与协作完成的成果。语义网格的关键之处是把作为一个分布式数据存储的Web的当前结构(仅能够由人翻译),转换成可以被基于计算机实体理解的信息存储结构。为了把数据转换为信息,元数据必须加入到上下文环境中。元数据包含语义、它所涉及数据的解释。元数据和本体对语义Web的发展是关键的。

现在给出一个简单的例子来说明怎样使用元数据和本体来匹配一个具有语义含义的服务。如图3-2所示,一个服务消费者正在购买一台计算机。服务请求信息可以用元数据(或许是XML编码)注释,来描述该服务请求,例如希望的计算机配置和价格。由销售台式电脑和便携电脑的卖主提供的报价服务也可以用描述服务的元数据注释。当服务匹配引擎接收到有关服务请求和服务报价的两个元数据集时,引擎将访问定义台式机和便携机为计算机的本体。然后,引擎将产生一个报价服务是否满足服务请求的结论。

图3-2  语义服务匹配中的元数据和本体

元数据和本体在语义Web的发展中扮演一个关键的角色。本体是一个概念性的规范。在这个上下文中,规范指的是通过语义含义提供一个清晰的表述。与模式语言形成对比,例如XML模式,本体试图用原始的知识表述捕获研究领域的语义,使得计算机能完全或部分理解一个领域中的概念之间的关系。本体为域提供一个通用词汇,并定义术语的含义和它们之间的关系。本体指的是对一些感兴趣领域的一个共享理解,经常被构思为一个类(概念)、关系、功能、原理和实例的集合。在本体中的概念通常用分类法组织[6]。

在下面的部分,我们引入作为语义Web基础的资源描述框架(RDF,Resource Description Framework)[7]。如图3-3所示,我们也给出基于RDF的Web本体语言,例如RDF Schema(RDFS)[8]、DAML+OIL[9,10]和Web本体语言(OWL,Web Ontology Language )[11]。

图3-3  语义Web的分层结构

3.2.1  RDF

语义Web的目标是增加Web的无结构概念到有结构的机器理解概念中,以改善它的信息访问和发现的效率。在Web应用中元数据的有效使用仍然需要有关语法、结构和语义的约定。个别资源描述团体定义了满足他们特定需要的元数据的语义或含义。语法,是用于机器处理的数据元素的系统排列,有利于在多种应用中的元数据的交换与使用。结构可以被作为语义的一致性表述在语法上的形式约束。

RDF在W3C的支持下发展,是促进编码、交换和结构化的元数据重用的基础结构。通过提供语义、语法和结构的通用约定的机制设计,RDF基础结构可使元数据实现互操作。对每一个资源描述团体,RDF不规定语义,而是宁可为那些团体提供定义所需元数据元素的能力。RDF使用XML作为元数据的交换和处理的通用语法。XML语法提供销售者独立性、用户可扩展性、有效性、人员可读性和表述复杂结构的能力。

1. RDF发展成就

RDF是一些元数据团体所提出的,这些团体结合它们的需要为Web提供健壮的、灵活的支持元数据的体系结构。当RDF作为一般元数据框架的发展时,同样地,由PICS规范给出的用于Web的简单知识表述机制是很鼓舞人心的[12],RDF不是某个人或某个组织发明的,RDF是一个协作完成的设计成就。RDF在XML之上汲取知识,像有关由微软的XML数据[13]和Netscape Meta Content Framework[14]提交的XML数据的建议一样。其他元数据的成就,例如Dublin Core[15]和Warwick Framework[16]也已经影响了RDF的设计。

2. RDF数据模型

  如图3-4所示,RDF数据模型包括资源、属性和属性值。在RDF中,资源用统一资源标识符(URI,Uniform Resource Identifier)唯一标识。与资源相联系的属性由具有相应值的属性类型标识。在RDF中,值可以是自然界中的基本单元(文本串、数字等)或其他依次可以有它们自己属性的资源。RDF被表述为一个有向图,在图中资源标识为节点,属性类型由带标签的有向弧来定义,并且引用字符串值。

图3-4  RDF数据模型

现在,让我们看一下如何应用RDF模型给出RDF描述。

RDF描述1:这篇论文(someURI/thispaper)的作者是John Smith。

图3-5给出了RDF描述1的图形表示。在这个例子中,RDF资源是someURI/thispaper,它们的属性是author。属性的值是John Smith。

图3-5  RDF描述1的图形表示

图3-6  RDF描述2的图形表示

RDF描述2:这篇论文(someURI/thispaper)的作者是另一个URI,他的名字是John Smith。

图3-6给出了RDF描述2的图形表示。在这个例子中,RDF资源是someURI/thispaper,它的属性是作者(author)。属性的值是另一个URI(资源),其属性是名字(name),并且属性的值是John Smith。RDF描述2可以用XML描述,如图3-7所示。

图3-7  RDF描述2的XML描述

3.2.2  本体语言

  在这一部分,我们略述一些有代表性的基于RDF的本体语言。这些本体语言可以用于在Web上建立本体。

1. RDFS

RDF本身是建立RDF数据模型的可合成和可扩展的标准。然而,由RDF提供的模型原语在为数据模型提供特定词汇的定义方面是非常有限的。RDF不提供详细说明资源和属性类型的方法,例如它不能表述所涉及到的资源的类,以及它所联系的属性。建立在RDF上的RDFS规范,进一步定义了模型原语,例如类(rdfs:lass)、子类关系(subClassOf,subPropertyOf)、域和属性、子属性(rdfs:ConstraintProperty和rdfs:ContainerMembership Property)的范围限制。资源(rdfs:Resource)是定义在RDFS中模型原语的基类。在给出的RDF描述中,RDFS定义有效属性,以及它们自己的属性类型值的特征或限制。

2. DAML+OIL

RDFS仍是一个非常有限的本体语言,例如RDFS不提供类的属性、等价性和不相交性的定义。DAML+OIL是想要扩展RDFS的表现能力,以能够进行有效的自动推理。

DAML+OIL是为Web设计的本体语言,其建立在XML和RDF之上,增加了常见的面向对象的本体原语和基于框架的系统[17],以及表现描述逻辑(DL,Description Logic)[18,19]的形式上的严格。DAML+OIL的逻辑基础意指推理服务既可以提供支持本体设计,也可使Web数据较容易访问,以满足自动处理要求。

DAML+OIL通过以下合并进化而来:DARPA代理标记语言(DAML,Agent Marking Language)的最初本体语言(DAML-ONT)[20](一个早期的DAML本体语言)、本体接口层 (OIL,Ontology Interface Layer)[21]、结合模型原语的一种本体语言,通常用于基于帧的本体,具有简单、定义明确的表述DL的语义。DAML+OIL通过面向对象方案来模拟,域的结构用类和属性的术语来描述。DAML+OIL类可以是名字(URI)或描述,并且提供建立类描述的各种各样的构造器。由DAML+OIL提供的公理使得它断言有关类或属性的包容性和等价性、类的不相交特征、个体和属性的不同性质的等价性和非等价性是可能的。类可以采用联合、分离、否定来合成。允许在属性内部使用全称和存在量化,也允许更多的精确基数约束。在属性的定义中,允许限制范围和域,并且可以层次结构安排它们。

总的来说,DAML+OIL具有下列特征:

●       DAML+OIL具有定义明确的语义和清晰的属性,通过潜在的映射来表述DL。DL赋予了DAML+OIL合成类和位置的能力和灵活性,以形成新的表述。借助DL的支持,在DAML+OIL中表述的本体借助DL推理系统(如FaCT系统)可以自动推理[22、23]。

●       DAML+OIL支持XML模式的所有数据类型。它和RDFS紧密集成,例如RDFS可用于表述DAML+OIL的机器阅读规范,并且为DAML+OIL提供了一个序列生产过程。

●       层次结构使语言的处理操作比较容易。

●       DAML+OIL公理明显比RDF或RDFS两者的公理具有更大的外延。

虽然对RDF的依赖在重用现有的RDFS基础结构和DAML+OIL本体的可移动性方面有一些优点,但使用RDFS去全面详细说明DAML+OIL的结构被证明是相当困难的,因为不像XML,RDFS没有设计用于语法结构的精确规范[24]。

3. OWL

通过增加附加的词汇以及形式语义,OWL使Web内容的机器解释比由XML、RDF和RDFS给出解释更加便利。OWL源于DAML+OIL,DAML+OIL为定义OWL的W3C Web本体工作组[25]提供了起始位置,OWL语言的目的是标准化和广泛接受的语义Web本体语言。OWL使用案例和请求文档 [26]提供较详细的本体,它用6个使用案例为Web本体语言提供促成因素,阐明OWL设计目标、需求和目的。

OWL有3个日益增加的描述子语言:OWL Lite、OWL DL(表述逻辑)和OWL Full。

●       OWL Lite 提供分类层次和简单约束,例如当它提供基数约束时,它仅允许0或1的基数值。OWL Lite是容易使用和实现的。

●       OWL DL当保持完全计算时(保证所有结论是可计算的)和可判定时(所有的计算将在有限时间内完成)提供最大化的表示。OWL DL包括所有OWL语言结构,但是它们仅能够在一定的限制下使用,例如,当一个类是很多类的一个子类时,这个类不能是另一个类的实例。

●       OWL Full使用所有的OWL语言原语,并且允许这些原语以任意方式与RDF和RDFS结合。它支持最大化表述和具有非计算保证的RDF的语义自主,例如在OWL Full中的一个类可以同时当作个体的集合和具有它自己特征的个体。OWL Full允许本体增加预先定义(RDF或OWL)词汇的含义。某一推理软件能够支持对OWL Full的每一个特征的完整推理是不可能的。

OWL Full的优点包括:与RDF在语法和语义两方面是完全兼容的;任何合法的RDF文档都是一个合法的OWL Full文档,任何有效的RDF/RDFS结论也是OWL Full有效的结论。

Antonioun 和Harmelen[27]提供了一个很好的OWL评述。他们建议当使用OWL时,开发者应当考虑哪一个子语言能最好地适合他们的需要。OWL Lite的选择取决于使用者要求由OWL DL和OWL Full提供的较多表现结构的范围。在OWL DL和OWL Full之间的选择主要取决于使用者需要RDFS元模拟工具的范围,例如定义一个类的类或匹配类的属性。当使用OWL Full替代OWL DL时,推理支持是较少可预言的,因为完全的OWL Full实现将是不可能的。在这3个子语言之间存在向上兼容性的严格注释:

●       每一个合法的OWL Lite本体是一个合法的OWL DL本体;

●       每一个合法的OWL DL本体是一个合法的OWL Full本体;

●       每一个有效的OWL Lite结论是一个有效的OWL DL结论;

●       每一个有效的OWL DL结论是一个有效的OWL Full结论。

3.2.3  本体编辑器

本书简要介绍3个有代表性的支持RDFS、DAML+OIL或OWL的本体编辑器。这些编辑器是能够用于建立本体的软件工具。有关本体编辑器较详细的讨论可以在文献Denny[28]中得到。

1. OntoEdit

OntoEdit[29,30]提供了一个为开发和维护本体的图形环境。它支持F-Logic[31]、RDFS和DAML+OIL。在OntoEdit中的本体可以输出为与对象有关的数据库模式和文档类型定义(DTD,Document Type Definitions)。

2. OilEd

OilEd[32]是一个允许用户使用DAML+OIL建立本体的编辑器。OilEd的基本功能包括在本体中的类、位置、个体和公理的定义和描述。OilEd为编辑本体提供了一个图形用户界面。

3. Protégé

Protégé[33,34]是一个可扩展的、与平台无关的和图形化环境的编辑器,用于创建和编辑本体和知识库。Protégé支持DAML+OIL,并且它为用OWL编辑语义Web本体提供beta级支持。

3.2.4  Web本体语言小结

到目前为止,我们已经回顾了RDF、RDFS、DAML+OIL和OWL,可以利用这些本体语言为语义Web建立本体。语义Web的目的是增加无结构的Web内容为结构信息,改善Web信息发现和机器可读性的效率。RDF放置转换的基础到结构化信息中,而这些结构信息可以由基于RDF的元数据表述。本体语言,例如RDFS、DAML+OIL和OWL,可以用于构造元数据本体,以更好地表述和组织Web上的结构信息。DAML+OIL和OWL两者正试图克服RDFS的限制。无论如何,它们是基于RDFS的并且尝试与它兼容。源自DMAL+OIL的OWL日益成为语义Web标准的本体语言。

查看所有评论(0)条】

最近评论



正在载入评论列表...
热点评论
     
    同类图书推荐