10 2023 档案
摘要:针对 gcForest 存在的一些缺点,本文提出了一种 WCDForest 模型来提高小样本分类数据集的准确率。为了提高 WCDForest 的特征提取能力,提出了一种等量多粒度扫描模块,可以平等地扫描边缘特征。提出了类向量加权模块和特征增强模块,它们重新评估了 RF 在多粒度扫描和级联森林阶段的分类性能,最大限度地利用 RF 的特征信息。本文在 18 个公开数据集上进行了实验,实验表面提出的模型的分类性能优于基准模型,消融实验表明提出的模块对特征表征学习和准确率有积极的影响,且训练时间较少。
阅读全文
摘要:为了克服现有集成方法的缺点,本文提出一种新的混合集成策略——样本和特征选择混合集成学习 SFSHEL。SFSHEL 考虑基于聚类的分层对大多数样本进行欠采样,并采用滑动窗口机制同时生成多样性的特征子集。然后将经过验证训练的权重分配给不同的基学习器,最后 SFSHEL 通过加权投票进行预测。SFSHEL 不仅可以保证可接受的性能,还可以节省计算时间。在实践中采用随机森林作为 SFSHEL 的基学习器,简称为 SFSHEL-RF。实验表明所提出的 SFSHEL-RF 在部分 KEEL 数据集上的平均性能达到 91.37%,与之前最好的 ECUBoost-RF 方法相当,并且高于其他方法。在真实数据集上,SFSHEL-RF 的表现可以稳定达到 3 项指标前三名的水平。
阅读全文
摘要:为了实现基于 GAN 的交互式的基于点的操作,本文提出了 DragGAN,它解决了监督手柄点向目标移动和跟踪手柄点两个子问题,以便在每个编辑步骤中知道它们的位置。本文模型是建立在 GAN 的特征空间具有足够的区分力以实现运动监督和精确点跟踪的特性之上的,运动监督通过优化潜在代码的移位特征损失来实现的。每个优化步骤导致操作点向目标移动,然后通过特征空间中的最近邻搜索来执行点跟踪。重复该优化过程,直到操作点达到目标。DragGAN 还允许用户选择性地绘制感兴趣的区域以执行特定于区域的编辑。由于 DragGAN 不依赖于任何附加网络,因此它实现了高效的操作,因此编辑速度很快。
阅读全文
摘要:针对 gcForestcs 受高置信度但精度较低的实例影响的问题,本文提出了一种深度分箱置信度筛选森林算法。该算法采用基于置信度对实例进行分箱,这种方式可以检测到分区错误的实例,将更精确的实例传递到后续层次。实验结果表明,对于相同的训练超参数,DBC-Forest 模型比 gcForest 和 gcforests 具有更好的精度,且训练速度更快。
阅读全文
摘要:针对弱标签学习问题的困难,以及 gcForest 不能直接处理弱标签数据集的问题,本文提出了 LCForest (Label Complement cascade Forest) 模型。本文没有将问题表述为一个正则化的框架,而是采用了级联森林结构逐层处理信息,并通过简洁高效的标签补充结构赋予其利用弱标签数据的能力。首先在级联森林的每一层中在考虑标签的相关性的基础上,将伪标签分布与原始标签向量进行连接。为了解决假阴性标签带来的问题,在每一层将相关标签安全地补充到初始标签矩阵中。针对前几种类失衡问题,引入补码标志机制来控制每个类的标签补码,在一定程度上缓解了这一问题。通过实验表明,LCForest 方法优于现有的多标签学习、深度神经网络和弱标签学习算法。
阅读全文