搜索引擎与信息检索

          江 叹
 虽折九曲犹东去, 将坠西山暖还留
 三十荣辱寻常事, 百年执著苦中求
               ---祝奕2006.10
  

前言[1]

在自然科学、社会科学与工程技术的很多领域中,都不同程度地涉及到对不确定因素和不完备信息的处理。从实际系统中采集到的数据常常包含着噪声、不精确甚至不完整,采用纯数学上的假设来消除或回避这种不确定性,效果往往不理想,反之,如果正视它,对这种信息进行适当地处理,常常有助于实际系统问题的解决。多年来,研究人员们一直在努力寻找科学地处理不完整性和不确定性的有效途径,实践证明,1965年Zadeh创立的模糊集理论与1982年Z.Pawlak倡导的粗糙集理论是处理不确定性的两种很好的方法。事实上,除了上述两种方法外,基于概率统计方法的证据理论也是处理不确定性的一种有效方法。这些众多的方法都属于软计算(Soft Computing)的范畴。软计算(Soft Computing)的概念是由模糊集理论的创始人Zadeh提出的,软计算(Soft Computing)的主要工具包括粗糙集(Rough sets)、模糊逻辑(Fuzzy Logic)、神经网络(Nerve Network)、概率推理(Probability Reasoning)、信度网络(Belief Network)、遗传算法(Genetic Arithmetic)与其它进化优化算法、混沌理论(Chaos)等。传统的计算方法即所谓的硬计算(Hard Computing),使用精确、固定和不变的算法来表达和解决问题,而软计算(Soft Computing)的指导原则是利用所允许的不精确性、不确定性和部分真实性得到易于处理、鲁棒性强和成本较低的解决方案,以便更好地与现实系统相协调。与其它方法相比,粗糙集方法的最大优点是不需要附加信息或先验知识,这一点是其它方法无法做到的,如模糊集方法与概率统计或证据理论方法中,往往需要模糊隶属函数、基本概率指派函数(Basic Probability Assignment,BPA)和有关统计概率分布等,而这些信息有时并不容易得到。正是基于这一优点,粗糙集理论得以迅速兴起,并逐渐成为人工智能界以及其它处理不确定性领域的研究热点。
众所周知,粗糙集与模糊集是两种主要的、应用最为广泛的处理不确定性的方法,它们各有优、缺点,如何有效地将它们结合,使它们优势互补,同时克服它们各自的缺点,将是很有兴趣的研究课题。它们的结合涉及到许多问题,如它们的关系问题,它们是互相独立的还是互为从属,对这一问题的回答众说不一,有的作者认为粗糙集是泛化的模糊集,如Z.Pawlak,有的作者持否定态度甚至相反观点,如M.Wygralak。对此,本人在借鉴了他们的方法之后,提出了属于自己的观点。两种方法的结合产生了粗糙模糊集(Rough Fuzzy Sets)与模糊粗糙集(Fuzzy Rough sets),这是两种不同的结合观。前者是从粗糙集的角度研究模糊集,而后者侧重于从模糊集的角度去刻画粗糙集。
本文的安排如下,第一章与第二章分别简单介绍粗糙集与模糊集,第三、四章分别介绍粗糙模糊集(Rough Fuzzy Sets)与模糊粗糙集(Fuzzy Rough sets),第五章介绍粗糙集模糊化的一种新方法,试图理清粗糙集与模糊集的关系。

第一章  粗糙集理论简介
第一节  粗糙集理论的产生与应用背景
在20世纪70年代,波兰学者Z.Pawlak和一些波兰科学院、波兰华沙大学的逻辑学家们,一起从事关于信息系统逻辑特性的研究,粗糙集理论就是在这种研究的基础上产生的。1982年,Z.Pawlak发表了经典论文Rough Sets [2],宣告了粗糙集理论的诞生,此后,粗糙集理论引起了许多数学家、逻辑学家和计算机研究人员的兴趣,他们在粗糙集的理论和应用方面做了大量的研究工作。1991年Z.Pawlak的专著[3]和1992年的应用专著[4]的出版,对这一段时期理论和实践的成果做了较好的总结,同时促进了粗糙集在各个领域的应用。此后召开的与粗糙集有关的国际会议进一步推动了粗糙集的发展,越来越多的科技人员开始了解并准备从事该领域的研究。目前,粗糙集已成为人工智能领域中一个较新的学术热点,在机器学习、知识获取、决策分析、过程控制等许多领域中得到了广泛的应用。
一、粗糙集理论处理的问题
粗糙集以其独到的方法能有效地处理许多涉及不确定性的问题,这些问题包括:
(1)、不确定或不精确知识的表达,
(2)、经验学习并从经验中获取知识,
(3)、不一致信息的分析,
(4)、根据不确定、不完整的知识进行推理,
(5)、在保留信息的前提下进行约简,
(6)、近似决策分类,
(7)、识别并评估数据之间的依赖关系。
特别应该提到的是约简、决策分类以及识别并评估数据之间的依赖关系,粗糙集理论在不需要任何附加信息或先验知识的前提下可以非常有效地处理这些问题。
二、粗糙集理论与数学的关系
前面已经提到,粗糙集属于软计算的范畴,从这个角度来看,粗糙集是继模糊集之后经典集合论的又一发展分支。但由于粗糙集是在近似空间上进行推理与分析问题,这一特点使它失去了作为经典数学的许多有关确定性的特征。关于粗糙集理论的数学特征的研究已有许多,其中很多着眼于粗糙集的代数特征的研究,也有作者用公理化方法与结构化方法来刻画粗糙集理论。但本人认为,这众多的粗糙集理论的数学特性的研究尚未使人们真正认识清楚粗糙集的数学结构面目。关于这一方面的研究尚有许多课题,如怎样将约简过程数学化等等。

 


Google
 
Web www.brar.cn
posted on 2006-10-29 17:14  祝奕  阅读(4796)  评论(0编辑  收藏  举报