语义网技术及其应用(三)-欧石燕

 

 

 

主语:现实世界中的某一个对象,都可以投影到Web空间里成为一个Web资源。一个人,一个课程,一本书。一篇文档。都可以作为网络上的资源以URI地址来命名。

小鸣的年龄是22岁。小明是一个资源。年龄是小明的一个属性。22岁是属性值。

 

 有的属性是一种关系。比如Tom是join的一个朋友。此处的焦恩虽然是一个宾语,但是它是一个资源。这就是RDF以三元组的形式描述事物。

下面是一个跟具体的例子。

 

 这样一个自然语言的陈述,我们怎样用rdf来表示出来呢?

 

http://www.nju.edu.cn/book/7040101262代表这本书,箭头代表它的属性。属性也是有名字的,属性也是有URI的。 http://www.nju.edu.cn/book/7040101262是主语,Title是谓语,title的值是《信息检索教程》,Title的值是宾语。

主题是信息检索。主题的主语也是这本书。主题的主语和书名的主语是同一个主语。所以就叠加在一起了。

这本书的出版商,是另外一个资源。是另外一个URI。

这本书的类型是什么呢?他是一本书。Type表明了这本书的类型。这本书的类型是一本书。也是一个主谓宾结构。

 

 

 

 

href:代表超链接。

当前的Web超链接无法反映资源之间的关系。

从当前的Web过度的semantic Web:

 

 

 

这里的资源都是以URI地址命名的。这些资源之间是以有含义的链接连接在一起。

 

 这就是语义网。

 

 unicode:万国码,里面有英文、中文、日文等的代码。

Rdf是可以使用XML来表示的。

Rdf是语义网的表示方式。

 

 

 

 本体是一种结构化的表示,是计算机可以理解的表示。

 

每个领域都有领域内的概念以及这些概念之间的相互关系。

比如在教育领域有教师。学校。学院系。学生。课程。等概念。教师和学生的关系是什么?教师和课程之间的关系是?教师是教授一门课程。学生来选修一门课程。教师可能属于某一个学院,学生可能属于某一个学院。这个学院肯定是属于某一个大学的。所以这些概念之间都是有相互关系的。

比如在汽车领域,有轮胎。,安全气囊,发动机等概念。

比如在旅游领域里面有景点,旅馆,饭店。等概念。

定义本体的作用是什么呢?

我描述一本书和另外一个同学来描述这本书,可能是用不同的结构或者方式或者术语。来描述的。比如我说一本书的作者我可能用author这个词语。而另外一个人可能会用Creator这个词。如果不同的人来描述同一个事情,用不同的术语。那么信息之间是不能共享。不可交换的。

本体的作用就是定义一个共同的模型。用一套共同的vocabulary来来描述一个领域内的知识。一个领域内的描述概念和关系。大家用这个共同的词汇表来描述信息。这样信息才可以共享和交换。这就是本体的作用。

本体有本体的语言。

 

最简单的本体语言RDFS。

所谓本体就是定义了一组概念。以及概念之间的关系。

 

 Agent的子类可能是个人,团体或者组织。

Document的子类可能是文章、书本。图片。

Document的作者可能是人,团体或者组织。Document的作者是agent。

Document的出版商可能是一个机构,不可能是一个个人或者团体。

Document还有另外一些属性。这些是属性的属性值可能是字符串。

这就是一个很简单的本体。他定了一些概念以及这些概念之间的关系。

这个本体我不能画成这样一张图。我要让计算机把这个领域的知对document的描述。让计算机去理解,去读取。

怎么样把这个本体传递给计算机呢?一种什么样的方式呢?

 

这就是利用owl标记语言来描述的本体。这个文档的头是rdf尾巴也是rdf。这是规定好的格式。这里定义了一个类,这个类的名字叫agent。Person也是一个类。Person是agent的一个子类。

这个owl不是让人读的,是让计算机读的。计算机会自动抽取相关信息。计算机利用抽取的知识进行理解和推理。

 

 

 

这个图代表把现实世界中的人以及人和人之间的关系投影的网络空间里面了。

 

OU代表一个人代表我自己。是一个资源。

对这个资源的描述,有我的类型,我的名字,我的信箱。

这是以rdf三元组的形式描述的。三元组即主谓宾。

图形是给人看的。计算机看不了。下面以xml语言把这个图形以XML格式存到文档里面。让计算机理解。给计算机读。这就是rdf的XML表示。以XML格式来表示rdf。即:rdf/xml

 

posted on 2021-03-09 13:16  一杯明月  阅读(273)  评论(0编辑  收藏  举报