本节我们将继续介绍粗糙集有关的概念。
上节我们介绍了知识粒度的矩阵表示形式,本节将介绍基于知识粒度属性约简定义和算法。
基于粗糙特征选择算法亦称为属性约简,其旨在保持数据集分类能力不变的前提下,通过约简冗余属性,最后得到问题的决策或分类规则。
相关定义
设决策信息系统S=(U,A=C⋃D,V,f),B⊆C,如果B为S的最小属性约简,则:
GPU(D∣B)=GPU(D∣C)
∀a∈B,GPU(D∣B−{a})≠GPU(D∣B)
第一个式子保证了约简集B有着与全体条件属性集C相同的划分能力;而第二个条件保证了约简集B内没有冗余属性。
近似分类精度的定义如下:
设决策信息系统S=(U,A=C⋃D,V,f),∀X⊆U,R是一个等价关系,则集合X关于等价关系R的近似分类精度为:
αR(X)=|R––X||¯¯¯¯RX|
其粗糙度为:
ρR(X)=1−αR(X)
近似分类质量的定义如下:
设决策信息系统S=(U,A=C⋃D,V,f),∀X⊆U,R是一个等价关系,则集合X关于等价关系R的近似分类质量为:
γR(X)=|R––X||U|
或者说
决策信息系统S=(U,A=C⋃D,V,f),∀X⊆U,R={X1,X2,...,Xm}是论域U的一个划分,将R的上近似和下近似分别定义为:
¯¯¯¯RX={¯¯¯¯RX1,¯¯¯¯RX2,...,¯¯¯¯RXm}
R––X={R––X1,R––X2,...,R––Xm}
则R的近似分类精度:
αR(X)=∑mi=1|R––Xi|∑mi=1|¯¯¯¯RXi|
近似分类质量:
γR(X)=∑mi=1|R––Xi||U|
特别地,若等价关系R是被决策属性集D划分的,U/D={X1,X2,...,Xm},∀X⊆U,则D的近似分类精度为:
αR(D)=POSR(D)∑mi=1|¯¯¯¯RXi|
近似分类质量:
γR(D)=POSR(D)|U|
对于这种情况,我们先看一个例子,若
U/D={X1,X2}={{e1,e4,e5,e8},{e2,e3,e6,e7}}
考虑论域U对条件属性集C划分的等价关系R
U/C={{e1},{e2},{e3},{e4},{e5,e7},{e6,e8}}
下近似:
R––X1={e1,e4}
R––X2={e2,e3}
近似分类质量:
γR(D)=|R––X1|+|R––X2||U|=48=12
再来看之前的一个例子:
S=(U,A=C⋃D,V,f)是一个决策信息系统,考虑条件属性C对论域U划分的等价关系R,U/C={{e3,e6},{e2,e5},{e1,e4}},集合X={e1,e2,e4},显然X是一个粗糙集,则:
R––X={e1,e4}¯¯¯¯RX={e1,e2,e4,e5}
近似分类精度:
αR(X)=|R––X||¯¯¯¯RX|=24=12
粗糙度:
ρR(X)=1−αR(X)=1−12=12
近似分类质量:
γR(X)=|R––X||U|=26=13
基于知识粒度的属性约简算法
在介绍完经典粗糙集模型一些基本的相关概念后,我们将给出粗糙集里面的一个经典算法,基于知识粒度非动态属性约简算法。
算法:基于知识粒度的经典启发式属性约简算法
输入:决策信息系统S=(U,A=C⋃D,V,f)
输出:论域U上的约简集REDU
begin
REDU←∅
for1≤j≤|C|do
CalculateSiginnerU(aj,C,D);
ifSiginnerU(aj,C,D)>0then
REDU←(REDU⋃aj);
end
end
LetB←REDU;
whileGPU(D∣B)≠GPU(D∣C)do
foreachai∈(C−B)do
CalculateSigouterU(ai,B,D);
a0=max{SigouterU(ai,B,D),ai∈(C−B)};
B←(B⋃{a0});
end
end
foreachai∈Bdo
ifGPU(D∣(B−{ai}))=GPU(D∣C)then
B←(B−{ai});
end
end
REDU←B;
returnreductionREDU
end
这就是基于知识粒度非动态属性约简算法的流程了,算法的流程虽然较多,但关键点在于等价类的划分,这点解决后,它的实现就不难了。
那么粗糙集有关的内容就暂告一段落了,系列博客介绍的也只是冰山一角,这里面还有很多很多的学问呢,有兴趣的可以查阅更多资料和文献。
本文参考了:
- 景运革. 基于知识粒度的动态属性约简算法研究[D].西南交通大学,2017.
【推荐】国内首个AI IDE,深度理解中文开发场景,立即下载体验Trae
【推荐】编程新体验,更懂你的AI,立即体验豆包MarsCode编程助手
【推荐】抖音旗下AI助手豆包,你的智能百科全书,全免费不限次数
【推荐】轻量又高性能的 SSH 工具 IShell:AI 加持,快人一步
· 如何编写易于单元测试的代码
· 10年+ .NET Coder 心语,封装的思维:从隐藏、稳定开始理解其本质意义
· .NET Core 中如何实现缓存的预热?
· 从 HTTP 原因短语缺失研究 HTTP/2 和 HTTP/3 的设计差异
· AI与.NET技术实操系列:向量存储与相似性搜索在 .NET 中的实现
· 周边上新:园子的第一款马克杯温暖上架
· Open-Sora 2.0 重磅开源!
· .NET周刊【3月第1期 2025-03-02】
· 分享 3 个 .NET 开源的文件压缩处理库,助力快速实现文件压缩解压功能!
· Ollama——大语言模型本地部署的极速利器