聊一聊粗糙集(二)
之前,我们简要地介绍了粗糙集,我将继续更新粗糙集相关的概念
等价类与等价关系
首先,我们先入为主地了解下等价类的定义吧,以下定义来自维基百科。
在数学上,假设在一个集合\(X\)上定义一个等价关系(用\(\sim\)来表示),则\(X\)中的某个元素\(a\)的等价类就是\(X\)中等价于\(a\)的所有元素所形成的子集:
还是举几个例子吧
如果说\(X\)是汽车的集合,\(\sim\)是汽车颜色相同的等价类,则一个特定等价类由所有的绿色汽车组成。\(X/ \sim\)自然被认为所有汽车颜色的集合
考虑到整数集合Z上的 “模2” 等价关系,\(x\sim y\)当且仅当\(x-y\)是偶数。这个关系精确地引发两个等价类:\([0]\)由所有的偶数组成,\([1]\)由所有的奇数组成。在这种关系下,\([7]\),\([9]\)和\([1]\)都表示\(Z/\sim\)的同一个元素。
在简要了解等价类这个概念后,下面我们将给出粗糙集中的等价类和等价关系:
\(S=(U,A=C\cup D,V,f)\)是决策信息系统,\(\forall B\subseteq C\),论域\(U\)的不可分辨关系被定义为:
很显然,不可分辨关系是一种等价关系。它将论域U划分为\(U/R_{B}\),\(U/R_{B}=\{E_{1},E_{2},...,E_{m}\}\)是由等价关系\(R_{B}\)形成的等价类集合。由等价关系\(R_{B}\)形成的等价类\([x]_{B}=\{y|(x,y)\in R_{B}\}\)是粗糙集理论中的基本知识粒。
我们还是以病人病历为例。
病人 | 头疼 | 肌肉疼 | 体温 | 流感 |
---|---|---|---|---|
\(e_{1}\) | 是 | 是 | 正常 | 否 |
\(e_{2}\) | 是 | 是 | 高 | 是 |
\(e_{3}\) | 是 | 是 | 很高 | 是 |
\(e_{4}\) | 否 | 是 | 正常 | 否 |
\(e_{5}\) | 否 | 否 | 高 | 否 |
\(e_{6}\) | 否 | 是 | 很高 | 是 |
设论域\(U=\{e_{1},e_{2},e_{3},e_{4},e_{5},e_{6}\}\),条件属性\(C=\{C_{1},C_{2},C_{3}\}\),决策属性\(D=\{d\}\)。 | ||||
\(C_{1}\)为头疼,\(C_{2}\)为肌肉疼,\(C_{3}\)为体温,有三个条件属性。 |
先来看头疼这个条件属性\(C_{1}\),它的值域只有两个:“是”和“否”。
\(C_{1}\)为论域\(U\)上一个知识
再看肌肉疼这个条件属性\(C_{2}\),它的值域只有两个:“是”和“否”。
\(C_{2}\)为论域\(U\)上一个知识
最后看看体温这个条件属性\(C_{3}\),它的值域有三个:“正常”,“高”和“很高”。
\(C_{3}\)为论域\(U\)上一个知识
决策属性当然便是流感\(d\),它的值域有两个:“是”和“否”。
至此,等价类和等价类关系暂时介绍到这里了。
## 精确集和粗糙集 还是结合病人病历为例:
以体温\(C_{3}\)这个条件属性为例
如果\(X=\{ e_{1},e_{2},e_{4},e_{5} \}\)。
那么\(X=X_{1}\cup X_{2}=\{e_{1},e_{4} \} \cup \{e_{2},e_{5} \}\)
\(X\)可以由已有的\(X_{1},X_{2},X_{3}\)中的若干个\(\{X_{1},X_{2}\}\)组成,因此\(X\)是\(C_{3}\)精确集
如果\(X=\{e_{1},e_{2},e_{4} \}\)
则\(X=\{e_{1},e_{4} \}\cup \{e_{2} \}\)
此时,\(X\)不能用\(X_{1}\),\(X_{2}\),\(X_{3}\)中的任何一个或者若干个组合构成,那么\(X\)是\(C_{3}\)粗糙集
------ 本文内容暂时到这里结束了,之后将会介绍上近似,下近似等等概念。
本文参考了:
- 景运革. 基于知识粒度的动态属性约简算法研究[D].西南交通大学,2017.