转语义web

语义网,是计算机业和互联网业对网络下一阶段发展所作出的术语化定义,其基本含义即基于网络建立任何微小数据的连接,这种连接不仅仅局限于网页。这样一来,任何微小的数据都可以与其他信息进行“沟通”。
语义网,它的核心是:通过给万维网上的文档 (如:标准通用标记语言下的一个应用HTML)添加能够被计算机所理解的语义“元数据”(外语:Meta data),从而使整个互联网成为一个通用的信息交换媒介。

含义

现有的互联网网络是网页的集合,而谷歌及其他搜索引擎正是通过网页互相之间的链接来帮助用户上网进行搜索。与此不同的是,“语义Web”将在更加微小的信息之间建立直接的连接,例如一条街道的地址与一份地图等等。
 

用途

万维网之父蒂姆·贝纳斯-李(Tim Berners-Lee)称,使用“语义网”的用户将可应用远远强于现有网络中任何东西的功能。他表示,在“语义网”中,用户可将两个毫不相干的东西连接在一起,比如说银行报帐单和日历。用户可以将银行报帐单拖到日历上,也可以将日历拖到银行报帐单上,这样就可以知道何时应当进行支付。他指出,“语义网”将呈现给人们的是一个所有数据“无缝”式连接的网络。在“语义网”技术破土而出之后,目前人们对Facebook和MySpace等社交网站的“痴迷”终将被“无所不连”的网络所取代。
 

技术挑战

专家表示,“语义Web”现在所面临的最大挑战是找到一种方法来表示所有的数据。这样一来,在连接到网络的时候,某一数据即可识别并建立与其他相关信息的链接,这与所谓的“标注”(tagging)略有相似之处。
语义Web体系结构:
语义Web的实现依赖于三大关键技术:可扩展标记语言(外语缩写:XML)、资源描述框架(外语缩写:RDF)和本体(外语:Ontology)。
 

体系结构

下图描述了语义Web的七层体系结构:
自描述
文档
数据
数据
规则
信任
证明
逻辑
本体
RDF+RDF Schema
XML+NS+XML Schema 名称空间
Unicode
URI
第一层:Unicode和URI。
Unicode是一个字符集,这个字符集中所有字符都用两个字节表示,可以表示65536个字符,基本上包括了世界上所有语言的字符。数据格式采用Unicode的好处就是它支持世界上所有主要语言的混合,并且可以同时进行检索。URI(Uniform ResourceIdentifier),即统一资源定位符,用于唯一标识网络上的一个概念或资源。在语义Web体系结构中,该层是整个语义Web的基础,其中Unicode负责处理资源的编码,URI负责资源的标识。
第二层:XML+NS+xmlschema。
XML是一个精简的标准通用标记语言,它综合了标准通用标记语言的丰富功能与HTML的易用性,它允许用户在文档中加入任意的结构,而无需说明这些结构的含意。NS(NameSpace)即命名空间,由URI索引确定,目的是为了避免不同的应用使用同样的字符描述不同的事物。XML Schema是文档类型定义(外语缩写:DTD)的替代品,它本身采用XML语法,但比DTD更加灵活,提供更多的数据类型,能更好地为有效的XML文档服务并提供数据校验机制。正是由于XML灵活的结构性、由URI索引的NS而带来的数据可确定性以及XMLSchema所提供的多种数据类型及检验机制,使其成为语义Web体系结构的重要组成部分。该层负责从语法上表示数据的内容和结构,通过使用标准的语言将网络信息的表现形式、数据结构和内容分离。
第三层:RDF+rdfschema。
资源描述框架(外语缩写:RDF)是一种描述WWW上的信息资源的一种语言,其目标是建立一种供多种元数据标准共存的框架。该框架能充分利用各种元数据的优势,进行基于Web的数据交换和再利用。RDF解决的是如何采用XML标准语法无二义性地描述资源对象的问题,使得所描述的资源的元数据信息成为机器可理解的信息。如果把XML看作为一种标准化的元数据语法规范的话,那么RDF就可以看作为一种标准化的元数据语义描述规范。Rdfschema使用一种机器可以理解的体系来定义描述资源的词汇,其目的是提供词汇嵌入的机制或框架,在该框架下多种词汇可以集成在一起实现对Web资源的描述。
第四层:“本体词汇”(Ontology vocabulary)。
该层是在RDF(S)基础上定义的概念及其关系的抽象描述,用于描述应用领域的知识,描述各类资源及资源之间的关系,实现对词汇表的扩展。在这一层,用户不仅可以定义概念而且可以定义概念之间丰富的关系。
第五至七层:Logic、Proof、Trust。
Logic负责提供公理和推理规则,而Logic一旦建立,便可以通过逻辑推理对资源、资源之间的关系以及推理结果进行验证,证明其有效性。通过Proof交换以及数字签名,建立一定的信任关系,从而证明语义Web输出的可靠性以及其是否符合用户的要求。
 

应用

语义Web提供各种依靠语义的自动化服务,如天气预报服务、航班信息服务、在线航班预定服务、数据库查询服务、目录查询服务、数字图书馆查询服务、搜索和分类服务、B2C交易服务、B2B交易服务等。
互联网信息发布与搜索:通过对内容的标注与分析从而克服了关键词查询的歧义性,提高了查询的精度。Stanford大学语义web研究组研制的查询语言DBQ是一个比较有影响的系统,它是基于DAML的。另一个基于DAML的语义web信息检索系统是美国Maryland设计的HOWLIR系统,它采用DAML-JESSDB-一个基于DAML的推理系统-作为推理引擎。此外,基于语义web的文档检索与知识管理也是当前研究的一个热点。
Web问题解答:在用ontology对信息源进行标注的基础上,进一步运用知识库来解答用户的提问。Stanford大学研制的Triple系统是一个基于逻辑程序设计的RDF查询系统,逻辑子句的问题求解能力使它能够解答较为复杂的问题。德国Karlsruhe大学等单位研制的SEAL是一个语义Web门户网站,它具有回答用F-逻辑表示的查询的能力[]。F-逻辑使得ontology中的概念与问题求解规则融合于一体。
 

所用技术

目前的各种万维网技术都有可能被应用于语义网(在语义环球网的意义上),例如:
DOM 文档对象模型, 一组访问XML和HTML 文档组成部分的标准接口.
XPath、XLink、XPointer
XInclude XML fragment XML查询语言 XHTML
XML Schema,资源描述框架(外语缩写:RDF)
XSL,XSLT Extensible Stylesheet Language
可缩放矢量图形(外语缩写:SVG)
同步多媒体集成语言(外语缩写:SMIL)
SOAP
文档类型定义(外语缩写:DTD)
微格式
元数据概念.

posted on 2016-10-06 22:10  荣锋亮  阅读(802)  评论(0编辑  收藏  举报

导航