[NLP] 语义网络与知识图谱入门(一)
语义网络与知识图谱入门(一)
RDF/XML
本体:一种形式化的对于共享概念体系明确而又详细的说明。就是指一种抽象的模型,可以用来描述对象类型、属性以及关系类型所构成的世界。
RDF/XML主要讲的就是如何用XML的方式来表示RDF的图。
椭圆表示节点,矩形表示文本,弧表示谓语。
节点描述
<rdf:Description rdf:about="A"></rdf:Description>
一个节点本身需要被rdf:Description来定义,通过rdf:about来说明资源uri。
前面rdf是空间名字,固有空间默认为rdf空间。
属性描述
如何描述A的属性d的值为D呢?
属性描述
<rdf:Description rdf:about="A">
<d>D</d>
</rdf:Description>
简写
<rdf:Description rdf:about="A" d="D"></rdf:Description>
路径描述
如何描述A到B的路径呢?
可以通过定义rdf:nodeId的方式指定唯一的nodeId,也可以通过rdf:parseType为Resouce来指定空节点。
属性描述,注意这里的B也是个节点,所以也需要Description
<rdf:Description rdf:about="A">
<a rdf:nodeId="abc"></a>
</rdf:Description>
<rdf:Description rdf:nodeId="abc">
<b>
<rdf:Description rdf:about="B" ></rdf:Description>
</b>
</rdf:Description>
不单独写空节点,即用resource
<rdf:Description rdf:about="A">
<a rdf:parseType="Resource">
<b>
<rdf:Description rdf:about="B" ></rdf:Description>
</b>
</a>
</rdf:Description>
文本表示
<?xml version="1.0"?>
<rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:ex="http://purl.org/dc/elements/1.1/">
<rdf:Description rdf:about="http://example.com">
<ex:prop rdf:parseType="Literal" xmlns:a="http://example.org/a#">
123
</ex:prop>
</rdf:Description>
</rdf:RDF>
xmlns即xml namespace,定义一个命令空间。
使用语法: xmlns:namespace-prefix="namespaceURI"。
这里定义一个名字为a的命令空间
可以看到解析后的结果为:
Number | Subject | Predicate | Object |
---|---|---|---|
1 | http://example.com](http://example.com/) | http://purl.org/dc/elements/1.1/prop) | "123"^^http://www.w3.org/1999/02/22-rdf-syntax-ns#XMLLiteral |
解析网址:https://www.w3.org/RDF/Validator/rdfval
通过解析可以看出来将prop指向的内容解析成了文本类型,即通过指定rdf:parseType="Literal"来实现。谓词rdf:parseType="Literal",指明节点的内容是普通文本,解释器不需要对其进行解释。
数据类型
可以使用rdf:datatype指定文本的数据类型
<rdf:RDF>
<rdf:Description rdf:about="http://example.com">
<a rdf:datatype="http://www.w3.org/2001/XMLSchema#int">
123
</a>
</rdf:Description>
</rdf:RDF>
同样的,也有string,date,decimal等数据类型可以在上面的datatype中指定。
RDF Schema (RDFS)
RDFS的全称为RDF Schema,RDF Schema 中的类与面向对象编程语言中的类非常相似。这就使得资源能够作为类的实例和类的子类来被定义。
<rdf:RDF
xmlns:rdf= "http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:rdfs="http://www.w3.org/2000/01/rdf-schema#"
xml:base= "http://www.animals.fake/animals#">
<rdf:Description rdf:ID="animal">
<rdf:type
rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
</rdf:Description>
<rdf:Description rdf:ID="horse">
<rdf:type
rdf:resource="http://www.w3.org/2000/01/rdf-schema#Class"/>
<rdfs:subClassOf rdf:resource="#animal"/>
</rdf:Description>
</rdf:RDF>
rdf:type
用来表示主语是谓语的一个实例,主语是一个资源,谓语是一个类 ,上面例子中说明animal是class的实例,horse也是class的实例。
rdfs:subClassOf
用来表示主语是谓语的子类,主语和谓语都是一个类 。上面例子中表明horse是animal的子类。
rdfs:subPropertyOf
用来表示主语是谓语的子属性,主语和谓语都是属性
rdfs:domain
用来表示属性的定义域
rdfs:range
用来表示值域
另外,一切所有皆资源(resource):所有类(class)都是资源,所有属性(property)都是资源,所有literal都是资源。
容器
Open Lists
open lists为课题添加新元素的容器。
rdf:Seq表示一个规定为有序的值的列表(比如一个字母顺序的排序),可以包含重复值。
rdf:Bag表示一个规定为无序的值的列表,可以包含重复值。
rdf:Alt表示一个可替换的值的列表(用户仅可选择这些值的其中之一)。
<rdf:RDF>
<rdf:Description rdf:about="http://a.com">
<a>
<rdf:Alt>
<rdf:li>CD</rdf:li>
<rdf:li>Record</rdf:li>
<rdf:li>Tape</rdf:li>
</rdf:Alt>
</a>
</rdf:Description>
</rdf:RDF>
rdf:li,解释器在解释时,将自动生成编号。
Closed Lists
closed lists为不可以添加元素的容器,其成为collections。通过rdf:parseType="collections"可以将宾语视为closed lists。
<rdf:RDF
xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"
xmlns:cd="http://recshop.fake/cd#">
<rdf:Description
rdf:about="http://recshop.fake/cd/Beatles">
<cd:artist rdf:parseType="Collection">
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/George"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/John"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Paul"/>
<rdf:Description rdf:about="http://recshop.fake/cd/Beatles/Ringo"/>
</cd:artist>
</rdf:Description>
</rdf:RDF>
Turtle语法
turtle用三元组表示,每个句子后面一个.表示句子结束。
前缀
@prefix book: <http://aa.com> .
@prefix ex: <http://axx.com> .
通过@prefix来指定前缀,这样就可以在后面用这个前缀了。
book:uri ex:a "aaa".