【四期陶富强】CCF-B(Pattern Recognition12)Feature evaluation and selection with cooperative game theory
这篇论文针对在机器学习训练中从高维数据集中去除冗余特征,选择重要特征,以提高模型准确率的问题。现有的方案基于信息论的选择器会忽略一些作为一个群体具有很强区分能力的特征(即关联性强的特征),但作为个体来说是弱的特征。作者引入了一个基于合作博弈论的框架来评估每个特征的能力。根据特征之间相互的关联关系,利用班扎夫权力指数(基于特征之间的内在关联结构)作为每个特征重要性的度量,并提出了一种通用的过滤器特征选择方案来选择特征。Sun X, Liu Y, Li J, et al. Feature evaluation and selection with cooperative game theory[J]. Pattern recognition, 2012, 45(8): 2992-3002.
这篇论文的优点是定义了三种特征之间的关系(冗余、相关、独立),通过计算每个特征的加入特征子集后,特征集中三种特征对的数目(冗余、相关、独立)来衡量该特征的班扎夫权力指数,可以将特征重要性度量形式化,因此会将特征子集中关联关系强的特征筛选出来。
这篇论文的缺点是计算每个特征的扎夫权力指数算法复杂度高,其方法是衡量每个特征的加入对其他特征子集的贡献。若用在特征多的数据中,则此算法消耗的时间可能过大,算法可能不适用。
2022年11月21日