09 2023 档案

摘要:为了对深度森林设计出信息量更大、计算成本更低的特征表示,本文提出了一种新的深度森林模型——高阶交互深度森林(hiDF),利用输入特征的稳定高阶交互来生成信息丰富且多样化的特征表示。具体而言,本文设计了一个广义版本的随机交叉树(gRIT)来发现稳定的高阶相互作用,并应用激活线性组合(ALC)将这些相互作用转化为新的特征表示,这些特征表示可以跨多层与输入特征交互。在级联的堆叠下,hiDF 可以有效地挖掘输入特征之间的高阶交互,并利用它们来提高预测性能。通过实验表明,hiDF 在显著减少时间和内存成本的情况下获得了极具竞争力的预测性能。 阅读全文
posted @ 2023-09-14 14:59 乌漆WhiteMoon 阅读(145) 评论(0) 推荐(0) 编辑
摘要:针对欠采样方法会丢弃大量多数类样本导致信息缺失的问题,本文提出了基于哈希的欠采样集成 HUE 模型,它利用 Bagging 和多数类样本的分布特征来构建多样化的训练子集。首先 HUE 通过散列将大多数类样本划分为不同的特征子空间,然后使用所有少数样本和主要从同一哈希子空间中提取的部分多数样本来构建训练子集,最后使用每个训练子集来训练一个基分类器,通过投票法将这些基分类器集成在一起。该方法在 25 个 UCI 数据集和两个大型数据集上与多种方法进行了对比,实验结果表明该方法优于其他方法,在高度不平衡的数据集上取得了良好的效果。 阅读全文
posted @ 2023-09-10 20:14 乌漆WhiteMoon 阅读(168) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示