本体论研究综述
1 引 言
起源于哲学的本体论(ontology)近年来受到信息科学领域的广泛关注[1,2],其重要性也已在许多方面表现出来并得到广泛认同[1,3,4]·尤其最近本体论在Web上的应用导致了语义Web[3,4]的诞生,在W3C的主导下有望解决Web信息共享时的语义问题,从而实现世界范围内的知识共享和智能信息集成·
本文将从本体论的起源、发展(第2节)出发,分别对本体论的定义(第3节),本体论描述语言(第4节)以及构建方法论(第5节),本体论与语义Web(第6节),以及本体论的应用等(第7节)研究现状进行综述·最后在第8节给出进一步展望。
2 本体论的起源和发展
2·1 本体论的哲学意义及其起源
从西方哲学史来看,本体论作为一门学问起源于对万物本原的追问·本体论这个词早在17世纪就已诞生,其派生于希腊语的“onto”(“存在”)和“logia”(“箴言录”),是一个哲学术语·从哲学意义上看,本体论关注的是“存在”,即世界在本质上有什么样的东西存在,或者世界存在哪些类别的实体·所以哲学上的本体论是对世界任何领域内的真实存在所做出的客观描述,而且这种描述不一定完全建立在已有的知识基础上,还包括“求真”的过程·实际上,人类对“存在”问题的探讨由来已久,也和哲学的起源分不开·哲学家亚里士多德早在公元前4世纪所确立的重要哲学分支“metaphysics”就是“关于存在的科学”,在很长时间里,本体论也一直被看做是metaphysics的同义词·后来,伴随近代科技革命的出现,metaphysics逐渐包纳更多的研究领域(如意识、事实、价值等),而本体论继续承担哲学中对世界“存在”的研究,成为现代哲学体系的根基·
正如本体论的诞生与哲学早期的发展密切相关一样,在过去的数十年中,本体论在计算机科学领域的发展也与人工智能和信息技术的起步和发展密不可分·
在人工智能领域,经历了20世纪60年代通用问题求解方法研究的困境,学者们开始研究通过专门领域的知识表达来支持自动推理·以DENDRAL[5]为代表的知识库系统的成功确立了知识在解决人工智能问题方面的重要地位,作为研究知识库和知识系统构建技术的学科“知识工程”(knowledge engineering)[6]发展起来·为了减少构建知识库的代价,避免每次都从头开始,越来越有必要考虑知识的复用问题·通过复用,系统开发者可以在已有知识基础上更加专注于特定领域的知识构建,并且新系统可以利用所复用的知识与现存的其他系统进行交互·这样,描述性的知识、问题解决方法以及推理服务都可在系统间实现共享,从而可以方便地构建出更大、更好的知识库·因此,必须考虑在一个领域中哪些知识是可以复用的或共享的,以及怎样获取和描述一个领域中的一般性知识等问题·
同时,数据库管理系统(DBMS)研究领域也逐步发现,虽然数据库技术已经成熟,但概念模型的一些隐蔽的、更为重要的问题依然存在·早期数据库的概念模型以专门化和不一致为明显特征,导致了后来数据库集成方面的许多实际问题[7]·
另外,伴随着面向对象技术的兴起,软件工程研究领域也开始认识领域建模(domain modeling)的重要性,因为在软件变得日益庞大和复杂的时候,必须面对程序维护和重用性的问题[8]·也就是要对应用程序中的过程或者功能进行陈述性表达,以便让其他应用程序重用·但是,这个问题也因缺乏具体、统一的领域建模形式化基础而没有得到很好的解决[9]·
以上3个方面的发展都面对了同一个类似问题,即需要对某个领域进行通用概念上的描述·因此,必须回答这样的问题:对于某个领域,本质上有些什么样的对象、过程、属性和关系?什么是一项事务、一个人以及一个组织?它们之间的相互依赖关系如何?这正是本体论所研究的内容·
2·2 本体论的发展
在一段时间里,本体论在上述领域的发展是相互独立的·在信息系统领域,几乎从头发展了本体论的思想·首先是McCarthy受学者Quine的启发,认识到哲学本体论与人工智能的逻辑理论构建活动之间的重叠,并于1980年提出:以逻辑概念为基础的智能系统必须“列出所有存在的事物,并构建一个本体描述我们的世界”[10]·当时大多数AI逻辑学者都认为对某个世界所获取的信息和人们的“常识”是一致的[11]·因此,Sowa也提出要构建“一个可能世界的本体”:尽可能地包含世界的所有事物、它们之间的联系以及相互影响的方式[12]·
然而,当时的绝大多数人工智能学者并没有考虑到与之相重合的哲学概念中的本体论,而直接引入“本体论”这个术语来表示他们在知识工程中对领域世界的“存在”研究·这造成了人工智能和信息系统领域中对“本体论”术语含义的误解,使其更倾向于逻辑理论,而与世界的“存在”离得更远·这些学者认为,将“本体论”看做是用来定义信息系统中的对象、属性、关系、事件和过程的一种“逻辑理论”,似乎更适合人工智能学科·然而,应该看到,信息系统正是因为缺乏对系统外真实世界的理解和描述才造成了许多问题:如果本体论不涉及信息系统外面的常识世界,而只是系统内采用的一种逻辑理论,怎能使那些具有不同的概念模型但在实际语义上却相同
的信息系统协同工作?
因此在信息科学领域,迫切需要对本体论的定义做进一步的辨析和规范,既要借鉴哲学本体论思想的内涵,又要考虑本体论在人工智能和信息系统领域应用的具体特点·这项重要工作主要以Tom Gruber和Nicola Guarino分别在1993年和1998年的研究为代表,他们都以传统人工智能教材Logical Foundations of Artificial Intelligence[13]中所提的conceptualization这一重要定义为基础·
3 本体论定义
概念化(conceptualization)作为知识形式化表达的基础,是所关心领域中的对象、概念和其他实体,以及它们之间的关系[13]·
定义1·概念化0:结构C=〈D,R〉,其中D是一个领域(domain), R是建立在D上的集合或相应关系[13]·
1993年,美国斯坦福大学知识系统实验室(KSL)的Gruber在定义1基础上,给出了第1个在信息科学领域广泛接受的Ontology正式定义[14,15]:
“Anontology isanexplicitspecificationof aconceptualization”·Gruber认为:概念化是从特定目的出发对所表达的世界所进行的一种抽象的、简化的观察·每
一个知识库、基于知识库的信息系统以及基于知识共享的智能agent都内含一个概念化的世界,或是显式的或是隐式的·本体论是对某一概念化所做的一种显式的解释说明·本体中的对象以及它们之间的关系是通过知识表达语言的词汇来描述的·因此,可以通过定义一套知识表达的专门术语来定义一个本体,以人可以理解的术语描述领域世界的实体、对象、关系以及过程等,并通过形式化的公理来限制和规范这些术语的解释和使用·因此严格地说,本体是一个逻辑理论的陈述性描述·
1998年,Guarino[1]试图明确说明本体论和概念化两者之间的差别,并以此为基础对Gruber的定义做提炼和修订·在Guarino的论述中,概念化的内涵成为讨论的重点,是进一步理解信息系统中ontology概念的关键·
Guarino认为定义1对概念化的定义存在局限,仅涉及了领域D中普通的数学关系,或者说是外延关系,即关系R只描述了世界的“一个”特定状态,并不是全部状态·要让定义真正有意义,需要一种标准方法表示这种关系的内在含义,这就是将其定义为从所有可能世界到集合上的函数·为此,Guarino引入“域空间”(domain space)的概念,如定义2·又以此为基础定义了“概念关系”(conceptual relation),如定义3·
定义2·域空间:结构〈D, W〉,D指某一领域,W指这一领域中所有可能状态的集合,也可以称为可能世界·
定义3·(n元)概念关系:全函数ρn: W→2Dn,从W映射到D上的所有n元关系的集合·
然后对概念化做了重新定义:
定义4·概念化1:有序的三元组C=〈D,W,R〉,其中R是域空间〈D,W〉上的概念关系的集合·
可见,前面Gruber采用的概念化(定义1),即结构〈D,R〉,只是定义4中某一特定状态下的世界·于是,Guarino将结构〈D, R〉另称为“世界结构”(world structure)·
在此基础上,为严格说明ontology的内涵,又做了以下定义·
定义5·预定世界结构(intended world structure):令概念化C=〈D, W,R〉,则对任一可能世界w∈W,其关于C的“预定世界结构”为SwC=〈D,RwC〉,其中RwC={ρ(w)|ρ∈R}是R中元素的(相对于w的)外延的集合·而SC={SwC|w∈W}则表示了所有关于C的预定世界结构·
定义6·令L为一逻辑语言, V为其词汇集·L的一个模型(model)定义为结构〈S,I〉,其中S=〈D,R〉为世界结构,I: V→D∪R为一个解释函数,将D的元素指配到V的常量符号(constantsymbols),将R的元素指配到V的谓词符号(predicate symbols)·
以上定义中,I其实表达了使用词汇集V对领域D和关系R所进行的描述或解释: V中的常量符号(如名词等)描述解释D,而V中的谓词符号(如动词等)则描述解释R·这样,定义6中L的模型,即结构〈S,I〉,其实是对语言L的一种特定的外延解释(extensional interpretation)·
类似地,根据定义4,扩展定义6的内涵,给出以下定义:
定义7·令L为一逻辑语言, V为其词汇集,则定义L的本体承约(ontological commitment)为K=〈C,J〉·其中C=〈D,W,R〉为域D上的概念化,J: V→D∪R为一个函数,将D的元素指配到V的常量符号(constant symbols),将R的元素指配到V的谓词符号(predicate symbols)·
定义8·令L为一逻辑语言, V为其词汇集,K=〈C,J〉为L的本体承约·称模型〈S,I〉兼容于K,如果:①S∈SC;②对于每一个实例c,I(c)=J(c);③存在一个世界w,对于每一个谓词符号p,I将其映射成为J(p)的一个“可承约扩展”(admittable extension),即存在一个概念关系ρ,使得J(p)=ρ∧ρ(w)=I(p)·则与K兼容的L的所有模型
的集合IK(L)称为L关于K的“预定模型”(intended models)集合·
通过上述定义可以看出,本体是为说明某语言词汇表的内在意义而设计的一套逻辑公理·给定一个语言L和本体承约K,语言L的本体就是基于以下目的而设计的逻辑公理集合:其自身模型尽可能地接近依照K的由语言L描述的所有预定模型·但事实上这样的逻辑公理集合不容易找到,本体只能以一种间接的方式详细说明一个概念化·
因此在澄清本体、预定模型和概念化的基础上得到下面的本体的定义:
定义9·本体论是一个逻辑理论,用来说明一个正规(formal)词汇表的预定含义·
因此本体是语言相关的,而概念化则是语言无关的·认清这一点对本体集成、融合和转换都非常重要·另外在上述定义中,概念化是比本体论(仅限于信息科学中)更为广泛的概念,前者更接近领域的事实和哲学上的本体论·对于这一点,后来的文献[16]又从本体论由哲学到信息科学转换的角度给出了较好的解释说明,应该说这对透彻理解信息科学中的本体论是有较大帮助的·
此外,Willem[17],Studer,Benjamins和Fense[18]以及不同的研究团体根据自身需求对本体给出了不同的解释和定义,但从总体理论上说,基本没有超出前面两位学者给出的定义·
4 本体描述语言
4·1 本体描述语言的发展
本体描述语言起源于历史上人工智能领域对知识表示的研究,主要有以下语言或环境为代表:KIF[19]与Ontolingua[20], OKBC (open knowledgebase connectivity)[21], OCML(operational conceptualmodeling language)[22],Frame Logic[23],LOOM[24]等·
近年来,Web技术为全球信息共享提供了便捷手段,以共享为特征的本体论与Web技术结合是必然趋势·在此背景下,基于Web标准的本体描述语言(以下简称为“Web本体语言”)正成为本体论研究和应用的热点,如SHOE(simple HTML ontology extension)[25],OML(ontology markup language)[26],
XOL(XML-based ontology-exchange language)[27]等·
在标准方面,由W3C主持制定的RDF(resource description framework)[28]和RDF Schema[29]是建立在XML语法上,以语义网(semantic networks)为理论基础,对信息资源进行语义描述的语言规范·RDF采用“资源”(resources)、“属性”(properties)以及“声明”(statements)等三元组来描述事物·RDF Schema则做进一步扩展,采用了类似框架的方式,通过添加rdfs: Class, rdfs: subClassOf, rdfs:subPropertyOf, rdfs: domain, rdfs: range等原语,对类、父子类、父子属性以及属性的定义域和值域等进行定义和表达·这样,RDF(S)成为一个能对本体进行初步描述的标准语言·
然而本体描述语言要走向通用,还需解决一些重要问题,如对推理的有效支持(包括计算复杂性和可判定性等),正规和充足的语义表示机制,以及标准化问题·这将依靠下述基于描述逻辑的本体语言的发展·
4·2描述逻辑与本体描述语言
描述逻辑(description logics, DL)[30]是近20多年来人工智能领域研究和开发的一个相当重要的知识表示语言,目前正被积极应用于本体描述,或者作为其他本体描述语言的基础·这里,“描述”是指对一个领域知识采用描述的方式表达,即利用概念和规则构造符将原子概念(一元谓词)和原子规则(二元谓词)构建出描述表达式;“逻辑”是指DL采用了正规的基于逻辑的语义,这与语义网络及框架等知识表示机制是不同的·例如,用描述逻辑描述“1个男人与1位医生结婚,他们至少有5个孩子,并且这些孩子都是教授”这一语义如下:Human∩「Female ∩ married.Doctor∩(≥5 hasChild)∩ hasChild.Professor·
描述逻辑具有以下主要特点:
(1)定义良好的语义和表示能力;
(2)基于逻辑的推理能力;
(3)保证计算复杂性和可判定性;
(4)明确的推理算法,如知名的基于Tableaux的算法[31];
(5)现有工具的有力支持,如高度优化的推理器FaCT[32],RACER[33]等·
这些特性很大程度上满足和代表了新一代本体描述语言发展的要求,最近几个主要的Web本体语言CKML[22],OIL[34],DAML+OIL[35]以及已成为W3C国际标准的OWL(ontology Web language)[36]就是建立在描述逻辑的基础上·这里就以OWL为例作简要分析·
2002年7月,W3C在提交的DAM+OIL基础上发展了OWL语言,以使其成为国际通用的标准本体描述语言·OWL建立在XML/RDF等已有标准基础上,通过添加大量的基于描述逻辑的语义原语来描述和构建各种本体·OWL根据表示和推理能力分为3类:OWL Full与RDF保持最大程度的兼容,具有最大的表示能力,但不能保证计算性能;OWL DL是以描述逻辑为基础,在不失掉计算完全性和可判定性条件下,支持最大的表示能力;OWLLite则局限于对概念(类)的层次分类和简单的约束等进行描述·
表1和表2总结了OWL的主要原语(构造符)及其所对应的描述逻辑表达和应用实例·另外,图1总结了Web本体描述语言的相互关系,这些语言的特性比较见表3·
表1 OWL类构造符与描述逻辑语法的对应
表2 OWL公理构造符与描述逻辑语法的对应
图1 基于Web的本体描述语言的相互关系
表3 基于Web的本体描述语言特性比较
5 本体构建方法论
目前,关于本体构建的方法还不成熟,没有一套完整的统一的方法论·下面列举一些已经开发出的典型本体以及方法论:
Cyc本体及方法[37];
④企业本体及Uschold & King方法[2];
③TOVE本体及Grüninger & Fox方法[2];
KACTUS及Bernaras方法[38];
CHEMICALS本体与METHONTOLOGY方法[39];
SENSUS本体及方法[40]·
文献[41]综述了1998年之前一些本体开发的方法论,认为:
许多本体构建都以一个具体任务为起点,这样易于知识的获取和本体功能的描述;
④本体构建大致可划分为阶段法(如Grüninger & Fox以及Uschold & King等)和原型演化法(如METHONTOLOGY等);
在构建过程中可分为“非形式化描述本体”和用正规描述语言“形式化描述本体”前后两个阶段;
希望通过累积的方法来构建本体,即先构建一个基础本体,然后做进一步开发;
本体构建还没有一套作为“科学”或“工程过程”的完整方法论,成功很大程度上依赖于具体项目·
文献[42]指出目前的本体构建方法还未能像软件工程那样成为一种成熟的工程方法论,作者根据IEEE软件生命周期过程开发标准[43]对上述大部分本体构建方法做了分析比较,得出的基本结论是:
与IEEE标准相比,没有一种方法论是完全成熟的·METHONTOLOGY采用了生命周期的方法,是相对最成熟的一个·
④没有提出统一的方法论,只有适合自身项目的方法·
存在几乎完全与众不同的方法论如SENSUS·这说明可能会同时存在多个被广泛接受的方法论,标准不一定惟一·
对于由同一个基础本体(如SENSUS)构建出的领域本体,由于高层概念的共享,本体系统之间具有互操作能力·
分析总结现有的各种方法论可作为发展标准方法论的起点;传统软件开发标准可作为指导方针来参考使用·
6 本体论与语义Web
6·1 语义Web
本体论在Web上的应用导致了语义Web[3]的诞生,其目的是解决Web上信息共享时的语义问题·语义Web被看做是当前本体论从学术研究走向实际应用的最重要的构想和研究计划·
1998年,Web的创始人Tim Berners-Lee首次提出了“语义Web”(semantic Web)的概念及其技术路线[4]·2001年2月,W3C正式成立“SemanticWeb Activity”来指导和推动语义Web的研究和发展,语义Web的地位得以正式确立·
语义Web是建立在RDF(S)等标准语言的基础上,对Web上的数据所进行的一种抽象表示·语义Web所指的“语义”是“机器可处理的”语义,而不是自然语言语义和人的推理等目前计算机所不能处理的信息·
从技术上讲,语义Web要提供足够而又合适的语义描述机制·然而,从整个应用构想来看,语义Web要实现的是信息在知识级的共享和语义上的互操作性,这需要不同系统间有一个语义上的“共同理解”才行·于是,本体论自然地成为指导语义Web发展的理论基础·
在Tim Berners-Lee提出的语义Web体系结构中(图2),构建在Unicode与URI,XML,RDF(S)等语言标准之上的本体层(ontology vocabulary)起着关键的作用,其提供的丰富原语不仅用来描述领域的概念模型,而且还是对知识进行推理和验证的基础·2001年11月,在W3C在语义Web Activity下专门成立了一个“Web-Ontology(WebOnt)”的工作组,其主要目标就是在现有Web标准之上创建一种对本体进行定义和描述的语言·前面介绍的OWL就是目前所取得的重要成果·
因此,语义Web应该看做是在本体论理论基础之上对现有Web所进行的扩展,目标是使Web上的信息具有计算机可以理解的语义,在本体的支持下实现信息系统间语义上的互操作性,以及对Web资源所进行的智能访问和检索·
可以预见,随着OWL等语言标准的成熟,各种支持工具和应用系统不断地发展起来,基于本体论的语义Web技术的研究和应用必将渗透到信息技术的各个具体领域中去。
图2 语义Web体系结构
6·2 语义Web服务
语义Web服务是以语义Web和本体论为基础的一个重要的应用基础研究领域·主要目标是克服传统Web服务(Web services)[44]语义操作能力的局限,使服务的发现、执行以及动态组合能够智能地完成·目前主要的研究框架有以下两个,都是基于本体论的思想·
(1) OWL-S(DAML-S)
OWL-S(DAML-S[45])是美国DARPA资助项目,参与者主要包括美国CMU,Stanford,MIT等大学以及Nokia公司·OWL-S使用OWL(最初采用DAML+OIL)构建了一个上层本体,描述了与Web服务相关的属性(properties)、能力(capabilities)以及执行结构(execution structures)等,目的是使计算机
对服务可“理解”,以便利服务的发现、调用、互操作、组合、验证以及执行监控等·
OWL-S的本体由3部分组成:①Service Profile,提供对服务属性的抽象描述,用来完成服务的自动发现·比如服务所提供的功能特性、服务的输入输出、先决条件与后置条件以及对真实世界的作用结果等·目前已经有了用UDDI对Service Profile的集成·②Service Model,描述服务的过程模型,即与服务执行相关的控制结构和数据流·③Service Grounding,对某个服务的访问方式做详细描述,进而指明此服务所使用的具体通信协议以及所使用消息的描述信息·
(2) WSMF
WSMF(Web service modeling framework)[46]是欧盟委员会资助的知识技术领域的研究项目之一,主要参与者包括欧洲一些大学以及Oracle公司·WSMF提供了一个较为丰富的概念模型,用于对Web服务及其组合进行开发和描述·
WSMF基于以下两个互补的原则:
用来实现某个应用的各种组件要有强的去耦合性(decoupling),以隐藏内部业务智能和公开信息交换协议之间接口描述的差别·
④Web服务要具有强的中介性(mediation),以使任何一个对象都能在可扩展的方式下和其他所有对象进行信息交换·这种中介服务既包括对不同术语的中介,也包括对不同交互风格的中介·
以这两个原则为基础,WSMF包含了4类不同的元素:
本体(ontologies)提供了Web服务所需的术语,这些术语用于定义其余3种元素;
④目标知识库(goal repositories),包含了对一个Web服务所关联的目标的详细描述,其又具体分为先决条件与后置条件;
Web Services,用来描述一个服务的完整特征,其提供了用于描述Web服务的技术信息;
中介者(mediators),用来解决服务之间以及服务和使用者之间进行交互时所产生的协同工作问题·
WSMF制定时并没考虑语法或描述语言问题,计划将OWL-S扩展以涵盖WSMF的特征,并使用UPML[47]来说明mediators·
7 本体论的应用
虽然本体论在人工智能领域的各个方向上都有许多应用,但是从本体论的起源和概念出发,可以简单地归结为以下3类:
①人与组织之间的信息交流·本体的核心概念是知识共享,通过减少概念和术语上的歧义,本体描述为某一组织或是工作小组提供了一个统一框架或是规范模型,使得来自不同背景,持不同观点和目的的人员之间的理解和交流成为可能,并保持语义上的一致性·
②系统之间的互操作·应用程序使用本体论实现异构系统之间的互操作,即不同系统或是工具之间的数据传输·前面讲的语义Web服务就属于此类·
③软件工程·在需求分析中,本体论通过对问题和任务的理解描述,提高明确性,减小分析代价[48]·同时,本体可进一步作为软件设计的基础,以(半)自动方式检查需求和设计的一致性,提高软件可靠性·本体还可以通过对系统内部各个功能模块和它们之间的联系的详细描述提高软件的重用性·
其中,本体在互操作,即信息系统的集成上的应用最为典型,也最为普遍,可以进一步细分为以下3种:
①基于本体的信息检索·本体在信息检索引擎中的应用的基本思路是利用本体对信息的描述来检索知识库,从而提高检索的效率和精确度·典型的例子为SHOE·
②基于本体共享的信息访问·不同的应用程序开发人员在共享本体上达成一致,即定义了一个可以双向转换的数据传输的格式·典型的例子主要有EcoCyc[49]等·
③基于本体映射的信息访问·与前一种应用不同的是,不同的应用程序之间拥有自己独立的本体,而不存在一个共享的本体,因此它们之间的信息共享或者数据交换只能通过不同的独立本体之间的映射(mapping)·典型的应用主要有ONIONS[50]等·
(1) ITTALKS
ITTALKS[51]是美国马里兰大学在DARPA资助下开发的一个基于本体的Web门户系统,主要用于对IT领域内的各种会议信息进行智能集成和智能在线检索·ITTALKS的使用者既可以是人也可以是软件agent·本体在ITTALKS系统中处于核心的地位·这些本体由DAML+OIL语言写成,主要包括以下7个(http://daml·umbc·edu/ontologies/):
①calendar本体,描述时间和日程;
②classification本体,描述主题和分类(根据ACM的分类标准);
③person本体,描述人及其属性;
④place本体,描述会议的地点;
⑤profile本体,描述使用者的特征属性;
⑥talk本体,描述会议本身的信息(如题目、摘要、媒体形式等)·
⑦topics本体,描述具体话题和兴趣等·
另外,这些本体并不是相互独立的,而是根据语义彼此关联,进而能够描述复杂的信息·通过相互关联的几个本体,ITTALKS具有了提供知识级服务的能力·例如,可以查找出“在斯坦福大学15英里以内、某段时间、某类话题”的所有会议信息·还可以根据用户的活动时间表和感兴趣方向,自动安排出合适的会议·
(2) Agentcities
Agentcities(http://www·agentcities·org/)近年发起的一个国际性的研究计划,其主要目的是用agent技术实现网络上各种系统间的语义互操作性,特别是实现动态的、智能的、自主的服务组合(composition of services)来满足不同的需要·本体在A-gentcities项目中起着重要作用,专门成立了“本体工作组”研究本体在语义互操作性等方面的实际应用所面临的问题·下面简述的是与此相关的两个具体应用,其实现都是建立在JADE(Java agent development framework, http://sharon·cselt·it/projects/jade/)的基础上:
Bed & Breakfast[52]是基于本体的进行食宿预定服务的一个多agent系统,能简化和加快供求双方的交易过程,减少交互次数,并能提供关于服务的更多信息·在此系统中,起核心作用的本体被看做是术语以及术语间关系属性的显式的规范说明·此系统的本体分为两种:一种对该领域模型中的相关元素进行描述;另一种则是对agent间进行通信所需元素进行描述·这样,所有遵从这两个本体的agent都可以进行无歧义的语义级通信·
ITTalks事务通知服务[53](ITTalks event notification service)是以语义Web服务技术建立起来的IT会议智能通知服务系统,其最重要的特点就是使用DAML-S对本领域的服务本体进行了构建·这些本体包括:服务描述本体、组成(composition)本体以及启用(invocation)本体·通过这些本体,系统提供了更加健壮的服务检索机制,使得对Web服务的检索和查询更加语义化和智能化·
(3) TAMBIS
TAMBIS(transparent access to multiple bioinformatics information sources)[54]是英国曼彻斯特大学计算机科学系和生物科学学院的一个联合研究项目·其目的是为生命科学研究者提供一个单独的Web访问结点,通过它对全世界的生物信息资源做“透明”的访问·TAMBIS通过使用一个本体来帮助使用者从众多的外部数据库中发现合适的信息资源,并能用一致的方式返回含有详细信息的结果·
在TAMBIS中,本体TaO对生物信息学的各种任务和资源进行了广泛的描述,在系统中处于中心地位·本体TaO并不包含任何实例信息,其表达的是与生物信息学和分子生物学知识相关的概念及它们的关系·实例信息则存储于外部数据库中,但这些实例信息的含义则是由本体TaO统一定义和解释的·本体TaO最初的描述语言是基于描述逻辑的GRAIL[55],现在已开始使用OIL以及DAML+OIL,也将过渡到OWL·
(4) RCal
RCal(RETSINA calendar agent)[56]是美国卡耐基梅隆大学(CMU)计算机学院机器人研究所最近开发的一个分布式约会安排agent,其使用了多个分布式本体,并采用DAML-S作为服务语义描述机制·
RCal使用了以下本体:以多种日历(calendar)规范为基础上的混合RDF日历本体(iCal)、Friend-of-a-Friend本体,以及Dublin Core本体等·这样,资源就能够在不同的本体中进行定义,从而使不与某个计划表直接关联的信息依然可能被处理·
RCal能够将遇到的未知概念自动地转换成已知概念来适应新情况·因为RCal建立了一些对概念进行翻译或转换的服务,并采用OWL-S(DAML-S)本体语言对这些服务进行了描述·这样,当RCal遇到一个自身本体中没有的概念时,就会通过OWL-S(DAML-S)描述自动地发现并选取恰当的翻译服务来执行,进而完成从未知概念到已有概念的转换·对于这种转换服务机制的实现,可以采用标记语言表达转换关系,也可以从其他共享的本体中推理得出转换关系·
(5)国内的研究和应用
国内对本体论的研究已有若干年,主要有信息检索[57]、产品信息建模、虚拟企业建模[58~63]、常识知识[64]库等方面·如中国科学院计算技术研究所大规模知识系统的研究[65,66]、中国科学院数学研究所常识知识库的研究[48]、浙江大学人工智能研究所基于本体论的产品信息集成研究等[67]·
常识知识库研究的主要内容之一是研究常识知识本体论及其与人的智能的关系,提出agent和本体是常识库的两大支柱的观点·其主要目的是建立一个大规模的常识知识库,并利用这个常识知识库来解决一些实际的问题(如NLP)·此项研究的主要特点是:①提出本体的描述应该分为静态本体和动态本体两个部分,通过静态本体和动态本体区分领域问题的相对稳定和变化的层次的复杂关系·认为本体库不仅仅是一个概念的简单分类,而是一个交错纵横,层层嵌套的本体网络·②根据常识推理需求,进一步将本体分为过程型、概念型、全序型、描述型、因果型、实例型和类比型,各类型拥有统一的描述形式,但蕴涵特定的推理机制,从而多种推理机制能够自然应用和切换·
8 展 望
本体的研究和应用总体来说还处于起步阶段,仍然存在一些问题,需要进一步研究,并尝试各种可能的途径来解决·典型的问题有:
(1)本体构建
本体的建构从本质上说是一种组织或团体意义上的决策行为·专家的知识是语境相关且独立构建的,功能强大但难免比较片面,因此很难构建一个可以满足所有成员使用需求的本体[68]·对某些领域内专家行为的研究也说明了这一点,甚至在一些良好构架的领域中,也很难达成一致的意见·然而,那些在应用中较为成功的本体却大都来自于那些绝大多数的专家可以在术语和概念上达成共识的领域·
正如前所述,本体的构建目前还没有一套成熟的方法论,但是随着语义Web的发展和标准本体描述语言(OWL)的出现,迫切需要以此为基础在各种领域中构建大量本体,从而推动本体的实际应用·因此,本体构建方法论的研究以及各领域中本体的构建应该是下一步继续研究和应用的方向之一·
(2)本体评价
目前普遍缺乏对本体的严格的评价技术·PhysSys[69], EngMath[70]等可以通过参考各自应用领域的文献而得到有效验证,但许多应用中的高层本体因无法获取所有领域的知识而不可能进行验证·构建一个本体的代价不在于创造面向特定领域的形式语言,而在于系统开发出来以后对本体的维护,因为绝对完美的本体是无法保证或是不存在的[71]·因此需要进一步研究对本体的评价技术·
另外,值得关注的是,随着语义Web的发展,需要进一步研究对以描述逻辑为基础构建的本体的评价方法和技术·
(3)本体演化和维护
领域的变化、适应不同的应用背景以及概念化世界的改变都可能引起本体的演化,这会影响对于本体的重用甚至构建[68]·已经有研究试图通过本体的版本控制机制来处理本体的演化·但是这方面的研究工作还做得不够,比如对本体演化引起后果的控制等·
最新的OWL语言提供了一定的对本体演化和维护的支持,但是需要进一步研究和发展·另外文献[30]给出了利用描述逻辑来帮助软件维护的思想,我们认为也可结合维护本体来做进一步探讨·
(4)本体转换和集成
本体应用还存在其他方面的问题,Uschold等认为,将本体应用到不同的系统或是其他的应用背景时,还缺乏良好的不同表达形式之间的本体转换工具·在不同的表达形式之间的本体转换是迫切需要解决的问题,而缺乏自动转换工具,必然会带来很多问题[72]·另外,本体一般都是由不同组织独立开发,相同或相关行业的本体也不同程度上存在重叠,这影响了本体在信息交互中的作用·
语义Web的发展和一系列标准语言的出现,渴望在一定程度上解决这些问题·但也应该看到,用一种本体语言来适合各种应用领域也是不现实的·因此,如何以一种标准本体语言为基础发展多种具体应用或标准(如OWL-S等),同时又能有效地实现本体转换和集成,也将是进一步研究的方向之一·
参考文献
1 N Guarino·Formal ontology and information systems·In: Proc ofthe 1st Int’l Conf on Formal Ontology in Information Systems·Trento, Italy: IOS Press, 1998·3~15
2 M Uschold, M Gruninger·Ontologies: Principles, methods, and applications·Knowledge Engineering Review, 1996, 11(2): 93~155
3 T Berners-Lee, J Hendler, O Lassila·The semantic Web·Scientific American, 2001, 284(5): 34~43
4 T Berners-Lee·Semantic Web road map·http://www·w3·org/DesignIssues/Semantic·html, 1998
5 F Hayes-Roth, D A Waterman, D B Lenat·Building Expert Systems·Reading, MA: Addison-Wesley, 1983
6 S Mark, L Conway·Towards the principled engineering of knowledge·AI Magazine, 1982, 3(3): 4~16
7 D A Jardine·The ANSI/SPARC DBMS model·The Second SHARE Working Conf Data Base Management Systems, Montreal, Canada, 1976
8 G Arango, G Williams, N Iscoe·Domain modeling for software engineering·In: Proc of the Int’l Conf on Software Engineering·Austin, Texas: ACM Press, 1991
9 A U Frank·Spatial ontology: A geographical point of view·In: O Stock ed·Spatial and Temporal Reasoning·Dordrecht, Netherlands: Kluwer Academic Publishers, 1997·135~153
10 J McCarthy·Circumscription—A form of non-monotonic reasoning·Artificial Intelligence, 1980, 5(13): 27~39
11 W V Quine·Ontological Relativity and Other Essays·New York: Columbia University Press, 1969
12 J F Sowa·Conceptual Structures: Information Processing in Mind and Machine·Reading, MA: Addison Wesley, 1984
13 M R Genesereth, N J Nilsson·Logical Foundations of Artificial Intelligence·San Mateo: Morgan Kaufmann Publishers, 1987
14 T R Gruber·A translation approach to portable ontology specifications·Stanford University, Tech Rep: Logic-92-1, 1993
15 T R Gruber·Towards principles for the design of ontologies used for knowledge sharing·Stanford University, Tech Rep: KSL-93-04, 1993
16 Gloria L Zú iga·Ontology: Its transformation from philosophy to information systems·In: Proc of the 2nd Int’l Conf on Formal Ontology in Information Systems·Ogunquit, Maine: ACM Press, 2000·187~197
17 N B Willem·Construction of engineering ontologies for knowledge sharing and reuse: [Ph D dissertation]·Netherlands: University of Twente, 1997
18 B Chandrasekaran, J Josepheson, V R Benjamins·Ontologies: What are they? Why do we need them? IEEE Intelligent Systems,1999, 14(1): 20~26
19 M R Genesereth, R E Fikes·Knowledge interchange format version 3·0 reference manual·Stanford University, Tech Rep: Logic-92-1, 1992
20 T R Gruber·ONTOLINGUA: A mechanism to support portable ontologies·Stanford University, Tech Rep: KSL-91-66, 1992
21 V K Chaudhri, A Farquhar, R Fikes,et al·OKBC: A programmatic foundation for knowledge base interoperability·In: Proc of the 15th National Conf on Artificial Intelligence (AAAI-98)·Madison, Wisconsin: AAAI Press/MIT Press, 1998
22 E Motta·An overview of the OCML modelling language·The 8th Workshop on Knowledge Engineering: Methods & Languages (KEML98), Karlsruhe, Germany, 1998
23 L Farinas, A Herzig·Interference logic= conditional logic +frame axiom·International Journal of Intelligent Systems, 1994, 9(1): 119~130
24 R MacGregor, R Bates·The loom knowledge representation language·USC Information Sciences Institute, Tech Rep: ISI/RS87-188, 1987
25 J Heflin, J Hendler·Searching the web with SHOE·In: Artificial Intelligence for Web Search·Menlo Park, CA: AAAI Press,2000·35~40
26 E K Robert·Conceptual knowledge markup language: The central core·The 12th Workshop on Knowledge Acquisition, Modeling and Management (KAW99), Banff, Canada, 1999
27 P D Karp, V K Chaudhri, J Thomere·XOL: An XML-based ontology exchange language·AI Center, SRI International, Tech Rep: 559, 1999
28 Dave Beckett, Brian McBride·RDF/XML Syntax Specification (Revised)·World Wide Web Consortium·http://www.w3.org/tr/rdf-syntax-grammar/, 2004-02-10
29 D Brickley, R V Guha·RDF Vocabulary Description Language 1·0: RDF Schema·World Wide Web Consortium·http://www.w3.org/tr/rdf-schema/, 2004-02-10
30 F Baader, D Calvanese, D McGuinness,et al·The Description Logic Handbook: Theory, Implementation and Applications·Cambridge: Cambridge University Press, 2003
31 C Schwind·A tableaux-based theorem prover for a decidable subset of default logic·In: Proc of the 10th Int’l Conf on Automated Deduction, LNAI 449·Kaiserslautern, FRG: Spring-Verlag,1990·528~542
32 I Horrocks·Using an expressive description logic: FaCT or fiction? The 6th Int’l Conf on the Principles of Knowledge Representation and Reasoning (KR-98), Trento, Italy, 1998
33 V Haarslev, R Moller·RACER system description·In: Proc of the Int’l Joint Conf on Automated Reasoning(IJCAR’2001)· Siena, Italy: Springer-Verlag, 2001
34 D Fensel,et al·OIL in a nutshell·The 12th Int’l Conf on Knowledge Engineering and Knowledge Management, Juan-les-Pins, France, 2000
35 I Horrocks, P F Patel-Schneider, F Harmelen·Reviewing the design of DAML+ OIL: An ontology language for the semantic Web·In: Proc of the 18th National Conf on Artificial Intelligence, AAAI-2002·Edmonton, Alberta, Canada: AAAI Press,2002
36 F Harmelen, J Hendler, I Horrocks,et al·OWL Web Ontology Language Reference·World Wide Web Consortium·http://www.w3.org/tr/owl-ref, 2004-02-10
37 D B Lenat, R V Guha·Building Large Knowledge-Based Systems·Reading, MA: Addison-Wesley, 1990
38 A Bernaras, I Laresgoiti, J Corera·Building and reusing ontologies for electrical network applications·In: Proc of the European Conf on Artificial Intelligence·Budapest, Hungary: John Wiley and Sons, 1996·298~302
39 M Fernández-López, A Gómez-Pérez, A Pazos-Sierra,et al· Building a chemical ontology using METHONTOLOGY and the ontology design environment·IEEE Intelligent Systems and Their Applications, 1999, 14(1): 37~46
40 K Knight,et al·Filling knowledge gaps in a broad-coverage MT system·The 14th Int’l Joint Conf on Artificial Intelligence, Montreal, Canada, 1995
41 D Jones, T Bench-Capon, P Visser·Methodologies for ontology development·In: Proc of ITi and KNOWS Conf of the 15th IFIP World Computer Congress·London, UK: Chapman and Hall Ltd, 1998·62~75
42 M Fernández López·Overview of methodologies for building ontologies·The IJCAI-99 Workshop on Ontologies and Problem-Solving Methods, Stockholm, Sweden, 1999
43 Software Engineering Standards Committee of the IEEE Computer Society·IEEE Std 1074-1997, IEEE Standard for Developing Software Life Cycle Processes·New York: IEEE Computer Society, 1997
44 World Wide Web Consortium·Web Services Activity·http://www·w3·org/2002/ws, 2004-04-29
45 AAnkolekar, M Burstein, J RHobbs,et al·DAML-S: Web service description for the semantic Web·In: Proc of the 1st Int’l Semantic Web Conf (ISWC)·Sardinia, Italy: Springer, 2002·348~363
46 D Fensel, C Bussler·The Web service modeling framework WSMF·http://www.wsmo.org/papers/publications/wsmf.paper.pdf, 2004-05-18
47 D Fensel, V R Benjamins, E Motta,et al·UPML: A framework for knowledge system reuse·The 16th Int’l Joint Conf on AI (IJ-CAI-99), Sweden, 1999
48陆汝钤,石纯一,张松懋,等·面向Agent的常识知识库·中国科学(E), 2000, 30(5): 453~463(Lu Ruqian, Shi Chunyi, Zhang Songmao,et al·Agent-oriented
commonsense knowledge base·Science in China (Series E) (inChinese), 2000, 30(5): 453~463)
49 P Karp, M Riley, S Paley,et al·EcoCyc: Electronic encyclopedia of E coli genes and metabolism·Nucleic Acids Research,1999, 27(1): 55~58
50 A Gangemi, G Steve, F Giacomelli·ONIONS: An ontological methodology for taxonomic knowledge integration·The ECAI-96 Workshop on Ontological Engineering, Budapest, 1996
51 R S Cost,et al·ITTALKS: A case study in DAML and the semantic Web·IEEE Intelligent Systems, 2002, 17(1): 40~47
52 S Tolia, D Khushraj, T Finin·ITTalks event notification service: An illustrative case for services in the agentcities network·The 1st Int’l Workshop on Agentcities: Challenges in Open Agent Systems, Bologna, Italy, 2002
53 J Padget, W Barbera-Medina·Abed and breakfast reservation service·The 1st Int’l Workshop on Agentcities: Challenges in Open Agent Systems, Bologna, Italy, 2002
54 R Stevens,et al·TAMBIS: Transparent access to multiple bioinformatics information sources·Bioinformatics, 2000, 16(2): 184~185
55 A Rector,et al·The GRAIL concept modelling language for medical terminology·Artificial Intelligence in Medicine, 1997, 9(2):139~171
56 T R Payne, R Singh, K Sycara·RCAL: A case study on semantic Web agents·The 1st Int’l Conf of AutonomousAgents and Multiagent Systems, Bologna, Italy, 2002
57邓志鸿,唐世渭,杨冬青·基于本体的多Agent分布式数字图书馆资源信息发现服务模型之研究·计算机工程, 2002, 28(6): 37~38 (Deng Zhihong, Tang Shiwei, Yang Dongqing·Research on the information searching service model for ontology based multiagent digital library resource·Computer Engineering (in Chinese)·2002, 28(6): 37~38)
58金芝·基于本体的自动需求获取·计算机学报, 2000, 23(5): 493~499 (Jin Zhi·Ontology based requirements acquisition·Chinese Journal of Computers (in Chinese)·2000, 23(5): 493~499)
59陈刚,金芝,陆汝钤·虚拟企业及其协作模型·电子学报,2002, 30(s1): 2075~2078 (Chen Gang, Jin Zhi, Lu Ruqian·Virtual enterprises and their collaborating model·Acta Electronica Sinica (in Chinese), 2002, 30(s1): 2075~2078)
60金芝,陆汝钤,陈刚·基于领域知识重用的虚拟领域本体构造· 软件学报, 2003, 14(3): 350~355 (Jin Zhi, Lu Ruqian, Chen Gang·Constructing virtual domain ontologies based on domain knowledge reuse·Journal of Software (in Chinese), 2003, 14(3): 350~355)
61陈晓明,俞时,谢莉莉,等·基于本体模型的异构企业信息系统协作·计算机工程与应用, 2003, 39(1): 223~225 (Chen Xiaoming, Yu Shi, Xie Lili,et al·Ontology-based collaboration of heterogeneous enterprise information systems·Computer Engineering and Application(in Chinese)·2003, 39(1): 223~225)
62李瑜,黄必清,刘文煌,等·虚拟企业伙伴选择问题领域的目标本体论·计算机集成制造系统-CIMS, 2002, 8(2): 85~90 (Li Yu, Huang Biqing, Liu Wenhuang,et al·Goal ontology for partner selection of virtual enterprise·Computer Integrated Manufacturing System (in Chinese), 2002, 8(2): 85~90)
63周永华,陈禹六,赵天奇·经营过程建模·计算机集成制造系统-CIMS, 2002, 8(1): 16~22 (Zhou Yonghua, Chen Yuliu, Zhao Tianqi·Business process
modeling·Computer Integrated Manufacturing System(in Chinese), 2002, 8(1): 16~22)
64陆汝钤·世纪之交的知识工程与知识科学·北京:清华大学出版社, 2001 (Lu Ruqian·Knowledge Engineering and Knowledge Science Crossing the Century(in Chinese)·Beijing: Tsinghua University Press·2001)
65曹存根·国家知识基础设施的意义·中国科学院院刊, 2001,16(4): 255~259 (Cao Cungen·National knowledge infrastructure·Bulletin of the Chinese Academy of Sciences (in Chinese), 2001, 16(4): 255~259)
66武成岗,焦文品,史忠植·基于本体论和多主体的信息检索服务器·计算机研究与发展, 2001, 38(6): 662~667 (Wu Chenggang, Jiao Wenpin, Shi Zhongzhi·Information searching server based on ontology and multiagent system·Journalof Computer Research and Development(in Chinese), 2001, 38(6): 662~667)
67 Ming Guo, Shanping Li, Jinxiang Dong,et al·Ontology-based product data integration·In: Proc of the 17th Int’l Conf on Advanced Information Networking and Applications ( AINA)·Xi’an, China: IEEE Computer Society, 2003·530~533)
68 E Daniel, O Leary·Impediments in the use of explicit ontologies for KBS development·International Journal of Human-Computer Studies, 1997, 46(2-3):327~337
69 P Borst,et al·An application of ontology construction·The Workshop on Ontological Engineering, Budapest, 1996
70 T Gruber, R Olsen·An ontology for engineering mathematics· Knowledge Systems Laboratory, Stanford University, Tech Rep:KSL-94-18, 1994
71 Kalfoglou, D Robertson·Managing ontological constraints·The I-JCAI-99 Workshop on Ontologies and Problem-Solving Methods (KRR5), Stockholm, Sweden, 1999
72 M Uschold, P Clark, M Healy,et al·An experiment in ontology reuse·The 11th Knowledge Acquisition Workshop, Banff, Canada, 1998
来源:李善平 尹奇 胡玉杰 郭 鸣 付相君 (浙江大学计算机科学与技术学院 杭州 310027)