1.  jena 简单使用

 

RDF可以用简单的图示:包括节点以及连接节点的带有箭头的线段来理解。

 

 

这个例子中,资源 http://.../JohnSmith 表示一个人。这个人的全名是 John Smith,即 vcard:FN(fullname) 属性的属性值是 John Smith。在 Jena 中,资源用 Resource 类来表示,其属性用 Property 类来表示。而整体模型用Model 类来表示,即上图就是一个Model。一个 Model 对象可以包含多个资源。

1.    import com.hp.hpl.jena.rdf.model.Model;  
2.    import com.hp.hpl.jena.rdf.model.ModelFactory;  
3.    import com.hp.hpl.jena.rdf.model.Resource;  
4.    import com.hp.hpl.jena.vocabulary.VCARD;  
5.      
6.    public class Introduction {  
7.        static String personURI    = "http://somewhere/JohnSmith";  
8.        static String fullName     = "John Smith";  
9.      
10.        public static void main(String[] args){  
11.            // create an empty Model  
12.            Model model = ModelFactory.createDefaultModel();  
13.      
14.            // create the resource  
15.            Resource johnSmith = model.createResource(personURI);  
16.      
17.            // add the property  
18.            johnSmith.addProperty(VCARD.FN, fullName);  //(属性,属性值)
19.        }  
20.    } 

 

其中, ModelFactory 类是一个Model 工厂,用于创建model 对象。我们可以使用 Model 的createResource 方法在model 中创建一个资源,并可以使用资源的 addProperty 方法添加属性。

2. jena 的 Statement

Model 的每个箭头都是一个陈述(Statement)。Statement 由三部分组成,分别是主语、谓语和客体。

  • 主语:图示中箭头出发的位置。代表资源。
  • 谓语:图示中的箭头。代表资源的属性。
  • 客体:图示中箭头指向的位置。代表属性的值。它可以是文本(比如:John Smith),也可以是一个资源(比如:VCARD:N指向的空节点)。

下图表示一个Model:

它的每一个箭头都代表一个Statement。如资源http://.../JohnSmith 有一个vCard:FN 属性,其值是文本"John Smith ”。这个资源还有一个 vCard:N 属性,这个属性的值是另一个无名资源。该无名资源有两个属性,分别是 vCard:Given 和 vCard:Family。其值分别是文本的"John" 和 "Smith"。

vcard:N属性对应的值是一个资源。另外:椭圆这个节点没有对应的URI,这种节点被称为blank Node。

 

我们可以用Jena API 来解析这个RDF 的Statement:

Model 类的listStatements 将返回一个 Statement 的Iterator。Statement 的主语、谓语、客体分别用 getSubject、getPredicate、getObject 来返回。其类型分别是 Resource、Property和RDFNode。对应着资源、属性、属性值,其中客体 object 类型可以是资源或者文本

 

1.    public class StatementDemo {  
2.        public static void main(String[] args){  
3.              
4.            //Introduction  
5.            String personURI = "http://somewhere/JohnSmith";  
6.            String givenName = "John";  
7.            String familyName = "Smith";  
8.            String fullName = givenName + " " + familyName;  
9.            Model model = ModelFactory.createDefaultModel();  
10.              
11.            Resource johnSmith = model.createResource(personURI);  
12.            johnSmith.addProperty(VCARD.FN, fullName);  
13.            johnSmith.addProperty(VCARD.N,   
14.                        model.createResource()  
15.                            .addProperty(VCARD.Given, givenName)  
16.                            .addProperty(VCARD.Family, familyName));  
17.              
18.            //Statement  
19.            StmtIterator iter = model.listStatements();  
20.              //遍历statement
21.            while(iter.hasNext()){  
22.                Statement stmt = iter.nextStatement();  
23.                Resource subject = stmt.getSubject();  //资源
24.                Property predicate = stmt.getPredicate();  //属性
25.                RDFNode object = stmt.getObject();  //属性值
26.                  
27.                System.out.print(subject.toString());  
28.                System.out.print(" "+predicate.toString());  
29.                if(object instanceof Resource){  
30.                    System.out.print(object.toString());  
31.                }else{  
32.                    System.out.print("\"" + object.toString() + "\"");  
33.                }  
34.                  
35.                System.out.println(" .");  
36.            }  
37.        }  

该程序的输出如下:

 

1.    http://somewhere/JohnSmith http://www.w3.org/2001/vcard-rdf/3.0#N-1e19b4fe:13bd0803952:-7fff .  //指向空节点resource,可以看到属性值是一串字符
2.    http://somewhere/JohnSmith http://www.w3.org/2001/vcard-rdf/3.0#FN"John Smith" .  
3.    -1e19b4fe:13bd0803952:-7fff http://www.w3.org/2001/vcard-rdf/3.0#Family"Smith" .  //空节点所指向的属性和属性值,可以看到resource是一串字符
4.    -1e19b4fe:13bd0803952:-7fff http://www.w3.org/2001/vcard-rdf/3.0#Given"John" .  

这四条分别代表了四个Statement,也即上面图中的四个箭头。

 

3. 输出RDF

1、model.write(OutputStream) : 也可以用model.write(OutputStream, null) 代替。默认的输出格式。

2、model.write(OutputStream, "RDF/XML-ABBREV"): 使用XML 缩略语法输出RDF。

3、model.write(OutputStream, "N-TRIPLE"): 输出n 元组的格式。

 

1.    import com.hp.hpl.jena.rdf.model.Model;  
2.    import com.hp.hpl.jena.rdf.model.ModelFactory;  
3.    import com.hp.hpl.jena.rdf.model.Resource;  
4.    import com.hp.hpl.jena.vocabulary.VCARD;  
5.      
6.      
7.    public class RDFWriting {  
8.        public static void main(String[] args){  
9.              
10.            //Introduction  
11.            String personURI = "http://somewhere/JohnSmith";  
12.            String givenName = "John";  
13.            String familyName = "Smith";  
14.            String fullName = givenName + " " + familyName;  
15.            Model model = ModelFactory.createDefaultModel();  
16.              
17.            Resource johnSmith = model.createResource(personURI);  
18.            johnSmith.addProperty(VCARD.FN, fullName);  
19.            johnSmith.addProperty(VCARD.N,   
20.                        model.createResource()  
21.                            .addProperty(VCARD.Given, givenName)  
22.                            .addProperty(VCARD.Family, familyName));  
23.              
24.            //Model write  
25.            model.write(System.out);  
26.            System.out.println();  
27.            model.write(System.out, "RDF/XML-ABBREV");  
28.            System.out.println();  
29.            model.write(System.out, "N-TRIPLE");  
30.        }  
31.    }  

 

 

通过 Model 的write 方法将其model 中内容写入一个输出流,输出如下:

 

1.    <rdf:RDF  
2.        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
3.        xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#" >   
4.      <rdf:Description rdf:about="http://somewhere/JohnSmith">  
5.        <vcard:N rdf:nodeID="A0"/>  
6.        <vcard:FN>John Smith</vcard:FN>  
7.      </rdf:Description>  
8.      <rdf:Description rdf:nodeID="A0">  
9.        <vcard:Family>Smith</vcard:Family>  
10.        <vcard:Given>John</vcard:Given>  
11.      </rdf:Description>  
12.    </rdf:RDF>  
13.      
14.    <rdf:RDF  
15.        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
16.        xmlns:vcard="http://www.w3.org/2001/vcard-rdf/3.0#">  
17.      <rdf:Description rdf:about="http://somewhere/JohnSmith">  
18.        <vcard:N rdf:parseType="Resource">  
19.          <vcard:Family>Smith</vcard:Family>  
20.          <vcard:Given>John</vcard:Given>  
21.        </vcard:N>  
22.        <vcard:FN>John Smith</vcard:FN>  
23.      </rdf:Description>  
24.    </rdf:RDF>  
25.      
26.    <http://somewhere/JohnSmith> <http://www.w3.org/2001/vcard-rdf/3.0#N> _:AX2dX498ae941X3aX13bd08e9fe5X3aXX2dX7fff .  
27.    <http://somewhere/JohnSmith> <http://www.w3.org/2001/vcard-rdf/3.0#FN> "John Smith" .  
28.    _:AX2dX498ae941X3aX13bd08e9fe5X3aXX2dX7fff <http://www.w3.org/2001/vcard-rdf/3.0#Family> "Smith" .  
29.    _:AX2dX498ae941X3aX13bd08e9fe5X3aXX2dX7fff <http://www.w3.org/2001/vcard-rdf/3.0#Given> "John" .  

 

4. 输入RDF

读取一个rdf 文件resources.rdf。文件内容如下:

1.    <rdf:RDF  
2.      xmlns:rdf='http://www.w3.org/1999/02/22-rdf-syntax-ns#'  
3.      xmlns:vcard='http://www.w3.org/2001/vcard-rdf/3.0#'  
4.     >  
5.      <rdf:Description rdf:nodeID="A0">  
6.        <vcard:Family>Smith</vcard:Family>  
7.        <vcard:Given>John</vcard:Given>  
8.      </rdf:Description>  
9.      <rdf:Description rdf:about='http://somewhere/JohnSmith/'>  
10.        <vcard:FN>John Smith</vcard:FN>  
11.        <vcard:N rdf:nodeID="A0"/>  
12.      </rdf:Description>  
13.      <rdf:Description rdf:about='http://somewhere/SarahJones/'>  
14.        <vcard:FN>Sarah Jones</vcard:FN>  
15.        <vcard:N rdf:nodeID="A1"/>  
16.      </rdf:Description>  
17.      <rdf:Description rdf:about='http://somewhere/MattJones/'>  
18.        <vcard:FN>Matt Jones</vcard:FN>  
19.        <vcard:N rdf:nodeID="A2"/>  
20.      </rdf:Description>  
21.      <rdf:Description rdf:nodeID="A3">  
22.        <vcard:Family>Smith</vcard:Family>  
23.        <vcard:Given>Rebecca</vcard:Given>  
24.      </rdf:Description>  
25.      <rdf:Description rdf:nodeID="A1">  
26.        <vcard:Family>Jones</vcard:Family>  
27.        <vcard:Given>Sarah</vcard:Given>  
28.      </rdf:Description>  
29.      <rdf:Description rdf:nodeID="A2">  
30.        <vcard:Family>Jones</vcard:Family>  
31.        <vcard:Given>Matthew</vcard:Given>  
32.      </rdf:Description>  
33.      <rdf:Description rdf:about='http://somewhere/RebeccaSmith/'>  
34.        <vcard:FN>Becky Smith</vcard:FN>  
35.        <vcard:N rdf:nodeID="A3"/>  
36.      </rdf:Description>  
37.    </rdf:RDF>  

 

它包含有四个People 资源。下面的程序将读取该rdf 文件并再将内容输出:

1.    import java.io.InputStream;  
2.      
3.    import com.hp.hpl.jena.rdf.model.Model;  
4.    import com.hp.hpl.jena.rdf.model.ModelFactory;  
5.    import com.hp.hpl.jena.util.FileManager;  
6.      
7.    public class RDFReading {  
8.        public static String inputFileName = "resources.rdf";  
9.          
10.        public static void main(String[] args){  
11.            Model model = ModelFactory.createDefaultModel();  
12.      
13.            // 使用 FileManager 查找文件  
14.            InputStream in = FileManager.get().open( inputFileName );  
15.            if (in == null) {  
16.                throw new IllegalArgumentException(  
17.                                         "File: " + inputFileName + " not found");  
18.            }  
19.      
20.            // 读取RDF/XML 文件  
21.            model.read(in, null);  
22.      
23.            model.write(System.out);  
24.        }  
25.    }  

 

Model 的read 方法可以读取RDF 输入到model 中。第二个参数可以指定格式。

 

5. 设置Namespace 前缀

1.    import com.hp.hpl.jena.rdf.model.Model;  
2.    import com.hp.hpl.jena.rdf.model.ModelFactory;  
3.    import com.hp.hpl.jena.rdf.model.Property;  
4.    import com.hp.hpl.jena.rdf.model.Resource;  
5.      
6.      
7.    public class NSPrefix {  
8.        public static void main(String[] args){  
9.            Model m = ModelFactory.createDefaultModel();  
10.            String nsA = "http://somewhere/else#";  
11.            String nsB = "http://nowhere/else#";  
12.              
13.            //创建Resource 和 Property  
14.            Resource root = m.createResource( nsA + "root" );  
15.            Property P = m.createProperty( nsA + "P" );  
16.            Property Q = m.createProperty( nsB + "Q" );  
17.            Resource x = m.createResource( nsA + "x" );  
18.            Resource y = m.createResource( nsA + "y" );  
19.            Resource z = m.createResource( nsA + "z" );  
20.              
21.            //层叠增加三个Statement  
22.            m.add( root, P, x ).add( root, P, y ).add( y, Q, z );  
23.            System.out.println( "# -- no special prefixes defined" );  
24.            m.write( System.out );  
25.            System.out.println( "# -- nsA defined" );  
26.              
27.            //设置Namespace nsA 的前缀为“nsA”  
28.            m.setNsPrefix( "nsA", nsA );  
29.            m.write( System.out );  
30.            System.out.println( "# -- nsA and cat defined" );  
31.              
32.            //设置Namespace nsB 的前缀为“cat”  
33.            m.setNsPrefix( "cat", nsB );  
34.            m.write( System.out );  
35.        }  
36.    }  

 

 

该程序首先调用 Model 的createProperty 和createResource 生成属性和资源。然后调用Model.add 想model 中增加3个Statement。add 的三个参数分别是三元组的主语、谓语和客体。向Model 中增加内容实际上就是增加三元组。

Model 的 setNsPrefix 函数用于设置名字空间前缀。该程序的输出如下:

1.    # -- no special prefixes defined  (原版)
2.    <rdf:RDF  
3.        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
4.        xmlns:j.0="http://nowhere/else#"  
5.        xmlns:j.1="http://somewhere/else#" >   
6.      <rdf:Description rdf:about="http://somewhere/else#y">  
7.        <j.0:Q rdf:resource="http://somewhere/else#z"/>  
8.      </rdf:Description>  
9.      <rdf:Description rdf:about="http://somewhere/else#root">  
10.        <j.1:P rdf:resource="http://somewhere/else#y"/>  
11.        <j.1:P rdf:resource="http://somewhere/else#x"/>  
12.      </rdf:Description>  
13.    </rdf:RDF>  
14.    # -- nsA defined  (原版前缀j.1变成nsA)
15.    <rdf:RDF  
16.        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
17.        xmlns:j.0="http://nowhere/else#"  
18.        xmlns:nsA="http://somewhere/else#" >   
19.      <rdf:Description rdf:about="http://somewhere/else#y">  
20.        <j.0:Q rdf:resource="http://somewhere/else#z"/>  
21.      </rdf:Description>  
22.      <rdf:Description rdf:about="http://somewhere/else#root">  
23.        <nsA:P rdf:resource="http://somewhere/else#y"/>  
24.        <nsA:P rdf:resource="http://somewhere/else#x"/>  
25.      </rdf:Description>  
26.    </rdf:RDF>  
27.    # -- nsA and cat defined  (原版前缀j.0变成cat)
28.    <rdf:RDF  
29.        xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#"  
30.        xmlns:cat="http://nowhere/else#"  
31.        xmlns:nsA="http://somewhere/else#" >   
32.      <rdf:Description rdf:about="http://somewhere/else#y">  
33.        <cat:Q rdf:resource="http://somewhere/else#z"/>  
34.      </rdf:Description>  
35.      <rdf:Description rdf:about="http://somewhere/else#root">  
36.        <nsA:P rdf:resource="http://somewhere/else#y"/>  
37.        <nsA:P rdf:resource="http://somewhere/else#x"/>  
38.      </rdf:Description>  
39.    </rdf:RDF>  

 

 

6. jena 的 Model 访问

上面介绍了jena 用来创建、读、写 RDF Model,本部分将主要用来访问RDF Model 的信息,对Model 的内容进行操作。

1.    import com.hp.hpl.jena.rdf.model.Model;  
2.    import com.hp.hpl.jena.rdf.model.ModelFactory;  
3.    import com.hp.hpl.jena.rdf.model.Resource;  
4.    import com.hp.hpl.jena.rdf.model.StmtIterator;  
5.    import com.hp.hpl.jena.vocabulary.VCARD;  
6.      
7.    public class ModelAccess {  
8.        public static void main(String[] args){  
9.            String personURI = "http://somewhere/JohnSmith";  
10.            String givenName = "John";  
11.            String familyName = "Smith";  
12.            String fullName = givenName + " " + familyName;  
13.            Model model = ModelFactory.createDefaultModel();  
14.              
15.            Resource johnSmith = model.createResource(personURI);  
16.            johnSmith.addProperty(VCARD.FN, fullName);  
17.            johnSmith.addProperty(VCARD.N,   
18.                        model.createResource()  
19.                            .addProperty(VCARD.Given, givenName)  
20.                            .addProperty(VCARD.Family, familyName));  
21.              
22.            // 从 Model 获取资源  
23.            Resource vcard = model.getResource(personURI);  
24.              
25.            /* 
26.            // 获取N 属性的值(用属性的 getObject()方法) 
27.            Resource name = (Resource) vcard.getProperty(VCARD.N) 
28.                                            .getObject(); 
29.            */  
30.              
31.            // 如果知道属性的值是资源,可以使用属性的getResource 方法  
32.            Resource name = vcard.getProperty(VCARD.N)  
33.                                 .getResource();  
34.              
35.            // 属性的值若是 literal(文本),则使用 getString 方法  
36.            fullName = vcard.getProperty(VCARD.FN)  
37.                                    .getString();  
38.              
39.            // 增加两个 NICKNAME 属性  
40.            vcard.addProperty(VCARD.NICKNAME, "Smithy")  
41.                 .addProperty(VCARD.NICKNAME, "Adman");  
42.              
43.            System.out.println("The nicknames of \""  
44.                                  + fullName + "\" are:");  
45.              
46.            // 列出两个NICKNAME 属性,使用资源的 listProperties 方法  
47.            StmtIterator iter = vcard.listProperties(VCARD.NICKNAME);  
48.            while (iter.hasNext()) {  
49.                System.out.println("    " + iter.nextStatement()  
50.                                                .getObject()  
51.                                                .toString());  
52.            }  
53.        }  
54.    }  

 

 

本例子中主要使用了以下内容

  • Model 的 getResource 方法:该方法根据参数返回一个资源对象。
  • Resource 的 getProperty 方法:根据参数返回一个属性对象。
  • Property 的 getObject 方法:返回属性值。使用时根据实际类型是 Resource 还是 literal 进行强制转换。
  • Property 的 getResource 方法:返回属性值的资源。如果属性值不是Resource,则报错。
  • Property 的 getString 方法:返回属性值的文本内容。如果属性值不是文本,则报错。
  • Resource 的 listProperties 方法:列出所找到符合条件的属性。

 

7. 对 Model 的查询

Jena 和核心 API 仅支持有限的查询操作。我们这里进行简单介绍。

  • Model.listStatements(): 列出Model 所有的Statements。
  • Model.listSubjects(): 列出所有具有属性的资源。
  • Model.listSubjectsWithProperty(Property p, RDFNode o): 列出所有具有属性p 且其值为 o 的资源。

上面所述的几种查询都是对 Model.listStatements(Selector s) 进行了一些包装得到的。如

  • Selector selector = new SimpleSelector(subject, predicate, object). 这个选择器选择所有主语符合 subject、谓语符合 predicate、客体符合 object 的Statement。

下面分别使用两种方式查询具有 fullName (VCARD.FN)属性的资源。

 

1. 使用 Model.listSubjectsWithProperty 查询:

1.    public class RDFQuery {  
2.        public static String inputFileName = "resources.rdf";  
3.          
4.        public static void main(String[] args){  
5.            Model model = ModelFactory.createDefaultModel();  
6.      
7.            InputStream in = FileManager.get().open( inputFileName );  
8.            if (in == null) {  
9.                throw new IllegalArgumentException(  
10.                                         "File: " + inputFileName + " not found");  
11.            }  
12.      
13.            model.read(in, null);  
14.      
15.            //使用 listResourcesWithProperty  
16.            ResIterator iter = model.listResourcesWithProperty(VCARD.FN);  
17.            if(iter.hasNext()){  
18.                System.out.println("The database contains vcard for:");  
19.                while(iter.hasNext()){  
20.                    System.out.println(" "+iter.nextResource().getProperty(VCARD.FN).getString());  
21.                }  
22.            }else{  
23.                System.out.println("No vcards were found in the database");  
24.            }  
25.        }  
26.    }  

 

 

本例中使用上面用到的resources.rdf 资源。输出为:

1.    The database contains vcard for:  
2.     Becky Smith  
3.     Matt Jones  
4.     Sarah Jones  
5.     John Smith  

 

<!-- 这些fullname在上面第6页的例子中 -->

 

8. 对Model 的增删操作

我们知道,对数据库的操作主要包括增、删、改、查等。对RDF 我们同样可以实现这几种操作。查询操作我们已经介绍过,本节将介绍RDF Model 的增删操作。我们可以对一个RDF 增加或者删除 Statement。由于 RDF Model完全是由 Statements 构成的,因此我们可以据此实现资源和属性等的增删。改动操作可以通过删除后再添加来实现。

1.    public class AddDelete {  
2.        public static void main(String[] args){  
3.            String personURI = "http://somewhere/JohnSmith";  
4.            String givenName = "John";  
5.            String familyName = "Smith";  
6.            String fullName = givenName + " " + familyName;  
7.            Model model = ModelFactory.createDefaultModel();  
8.              
9.            Resource johnSmith = model.createResource(personURI);  
10.            johnSmith.addProperty(VCARD.FN, fullName);  
11.            johnSmith.addProperty(VCARD.N,   
12.                        model.createResource()  
13.                            .addProperty(VCARD.Given, givenName)  
14.                            .addProperty(VCARD.Family, familyName));  
15.      
16.            System.out.println("原始内容:");  
17.            model.write(System.out);  
18.            // 删除 Statement           
19.            model.remove(model.listStatements(null, VCARD.N, (RDFNode)null));  
20.            model.removeAll(null, VCARD.Given, (RDFNode)null);  
21.            model.removeAll(null, VCARD.Family, (RDFNode)null);  
22.              
23.            System.out.println("\n删除后的内容:");  
24.            model.write(System.out);  
25.              
26.            //增加 Statement  
27.            model.add(johnSmith, VCARD.N, model.createResource()  
28.                    .addProperty(VCARD.Given, givenName)  
29.                    .addProperty(VCARD.Family, familyName));  
30.            System.out.println("\n重新增加后的内容:");  
31.            model.write(System.out);  
32.        }  
33.    }  

 

 

在此例中,我们首先生成一个Model ,然后使用 Model.remove 方法删除几个statement 条目,然后使用Model.add 又增加了回来。

Model.remove 方法可以实现statement 的删除操作,Model.add 可以实现statement 的增加。

除了直接使用 Model 的方法外,对Model 中的Resource(资源)或Property(属性,实际上也继承自Resource)进行增删操作也可以达到更改 Model 的目的。

9 .Model 的合并操作

Model 的合并主要分为 交、并、补三种操作。

         

 

 

这两个图分别代表一个Model。它们的名字相同,且具有相同的属性 vcard:FN ,值为John Smith。因此,我们对这两个Model 进行“并”(union)操作。所得到的Model 的图形表示如下:

 

 

 

 

其中重复的 vcard:FN 值只出现一个。

这三种操作的方法分别为:

1、Model.intersection(Model model): 交操作。创建一个新Model ,新Model 中包含之前两个Model 中都有的部分。

2、Model.union(Model model): 并操作。创建一个新Model,新 Model 中包含之前两个Model 中某一个具有的部分。

3、Model.difference(Model model): 补操作。创建一个新Model,新Model 中包含本Model 中有单在参数所示 Model 中没有的部分。

 

附录:

 

 

 

 

 

 posted on 2016-08-10 19:14  布鲁布鲁sky  阅读(683)  评论(0编辑  收藏  举报