11 2023 档案

摘要:本文使用不可微模块实现深度学习进行的探索,提出了一种非 DNN 的深度森林算法 gcForest(多粒度级联森林)。gcForest 具有级联结构,可以通过森林进行表示学习。它的表征学习能力可以通过多粒度扫描进一步增强,从而可能使 gcForest 具有上下文或结构感知能力。级联的级别可以自动确定,超参数比 DNN 少得多,使其能以数据依赖的方式确定模型规模,用户能够根据计算资源控制训练成本。实验表明在大多数情况下,gcForest 能够通过使用默认设置在不同领域的数据集中获得出色的性能。 阅读全文
posted @ 2023-11-23 14:25 乌漆WhiteMoon 阅读(133) 评论(0) 推荐(0) 编辑
摘要:为了解决联合用药数据的不平衡、高维、样本数量有限的问题,本文首先构建了一个由药物的物理、化学和生物特性组成的特征集,包括了丰富的生物学信息。特征空间的每个维度都有特定的含义,便于进行可解释性分析,找出预测过程中的关键特征。针对这种不平衡的高维中型数据集,提出了一种改进的基于 Deep Forest 的模型 ForSyn 来预测协同药物组合。ForSyn 设计了两个新的森林单元嵌入到模型架构中,一种是基于亲和传播聚类和分层欠采样的 RF 算法,该单元旨在解决类不平衡问题;另一种是基于数据复杂度降维的极端树森林(ETF)算法,主要用于处理高维数据问题。实验方面比较了 12 种算法在 8 个数据集上的性能,结果表明在大多数情况下具有所有特征类型的 ForSyn 会获得最佳性能。然后对一组先前未测试的药物组合进行细胞实验进一步证实了 ForSyn 的预测能力,最后对 ForSyn 提取的关键特征进行了可解释性分析。 阅读全文
posted @ 2023-11-06 19:40 乌漆WhiteMoon 阅读(206) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示