乌漆WhiteMoon - 博客园

[置顶] Paper Reading 博客汇总

摘要：按照算法的类型对个人的 Paper Reading 博客进行汇总，涉及多个研究方向的论文将按照个人主观感觉的主要方向排列。目录不平衡学习并行与分布式多标签学习回归决策树集成学习进化计算计算机视觉计算学习理论与方法神经决策模型神经网络生物信息图学习特征工程不平衡学习 A Novel Model f 阅读全文

posted @ 2023-08-17 00:19 乌漆WhiteMoon 阅读(646) 评论(0) 推荐(1) 编辑

[置顶] 操作系统博客清单

摘要：目录操作系统进程管理同步与死锁存储器管理文件系统磁盘管理I/O 设备管理分布式系统参考资料这些博客都是根据《计算机操作系统(第四版)》、《操作系统导论》、《分布式系统概念与设计》等书籍整理的，因为这些书超级厚，不爱带来带去。如果在其他地方有看到相关的感兴趣的内容，也会整理到这里来。操作系统操作阅读全文

posted @ 2021-08-22 14:36 乌漆WhiteMoon 阅读(1529) 评论(0) 推荐(8) 编辑

[置顶] CTF-WEB 基础知识博客清单

摘要： #基础知识 CTF-WEB：PHP 弱类型 CTF-WEB：PHP 变量 CTF-WEB：PHP 伪协议 CTF-WEB：PHP 反序列化 CTF-WEB：字符串和正则匹配 CTF-WEB：后台扫描与备份泄露 CTF-WEB：BurpSuite 工具应用 CTF-WEB：文件上传和 webshell 阅读全文

posted @ 2021-07-30 12:20 乌漆WhiteMoon 阅读(2111) 评论(0) 推荐(5) 编辑

[置顶] 网络技术基础(CCNA)博客清单

摘要： #基础理论计算机网络这门课涵盖了 TCP/IP 协议栈的所有层，但是网络规划主要侧重于链路层(交换机)和网络层(路由器)。因此想要快速上手网络技术的学习，可以先从这些基本的理论入门。网络技术：网络互联设备网络技术：以太网网络技术：网络互联模型网络技术：IP 编址网络技术：子网划分 #基础阅读全文

posted @ 2021-07-23 00:21 乌漆WhiteMoon 阅读(1669) 评论(0) 推荐(2) 编辑

[置顶] 数据库与 SQL 博客清单

摘要： #数据库原理数据库原理：数据库系统概述数据库原理：数据模型和关系数据库数据库原理：求最小依赖集和候选键数据库原理：关系规范化数据库原理：数据库设计数据库原理：数据库恢复和并发控制 #SqlServer SQL Server 是由 Microsoft 开发和推广的关系数据库管理系统（DBM 阅读全文

posted @ 2021-06-04 21:47 乌漆WhiteMoon 阅读(1301) 评论(0) 推荐(2) 编辑

[置顶] WEB 安全靶场通关指南

摘要： #DVWA 靶场 DVWA 靶场的网页应用程序很脆弱，它的主要目标是帮助安全专业人员在实际环境中测试他们的技能和工具，帮助 web 开发人员更好地理解保护 web 应用程序的过程，并帮助教师/学生在教室环境中教授/学习 web 应用程序安全。 Brute Force (爆破) Command Inj 阅读全文

posted @ 2020-11-19 01:54 乌漆WhiteMoon 阅读(3313) 评论(0) 推荐(2) 编辑

[置顶] 数据结构博客清单

摘要： #预备知识数据结构个人学习推荐 C++面向过程编程 C++ STL 库快速上手 #线性表顺序表结构详解链表结构和例题详解 SkipList (跳跃表)解析及其实现静态链表及 PTA 重组链表 #栈和队列栈结构解析及其应用队列结构解析及其应用栈和队列应用：迷宫问题 PTA习题解析——银行阅读全文

posted @ 2020-08-05 00:07 乌漆WhiteMoon 阅读(1902) 评论(0) 推荐(7) 编辑

[置顶] 计算机网络(TCP/IP)博客清单

摘要： [TOC] #学习经验分享 [计算机网络个人学习经验](https://www.cnblogs.com/linfangnan/p/17017625.html) #概述 [计算机网络：互联网概述](https://www.cnblogs.com/linfangnan/p/15056612.html) 阅读全文

posted @ 2020-08-04 00:14 乌漆WhiteMoon 阅读(2287) 评论(2) 推荐(7) 编辑

2024年11月28日

Paper Reading: Relating instance hardness to classifcation performance in a dataset: a visual approach

摘要：相比于原先的 ISA 方法将每个实例当做一个完整的数据集，本文将 ISA 框架扩展到对单个分类数据集的分析，同时将实例定义为数据集中的观察值实现更细粒度的分析。通过将原始数据投影到二维硬度嵌入中，可以仔细检查数据质量，并更深入地理解单个数据集中的分类器行为。本文重新实例硬度的概念，使用实例硬度评估分类数据集中每个实例的困难程度或错误分类的概率。通过将描述实例硬度的元特征与多个分类器的预测性能相关联，ISA 提供了每个分类器优缺点信息，还可以对数据集中的数据质量问题进行分析。同时本文提供了一个开源 Python 工具包 PyHard，它封装实现了 ISA，并提供了一个交互式可视化界面将实例硬度与分类性能联系起来。阅读全文

posted @ 2024-11-28 20:00 乌漆WhiteMoon 阅读(62) 评论(0) 推荐(0) 编辑

2024年10月30日

Paper Reading: Mixed Bagging: A Novel Ensemble Learning Framework for Supervised Classification based on Instance Hardness

摘要：本文提出了一种名为 Mixed Bagging 的 Bagging 框架，其中 bootstrap 得到的数据子集具有不同程度的硬度。这样的混合 bootstrap 将诱导出一组更加多样化的基学习器，且这样的分类器的集合在总体分类任务中更够提高对难分样本的关注。Mixed Bagging 框架中考虑了两种不同的方法，第一种分组混合 Bagging 有三组 bootstrap 的混合部分，分别是 easy、regular、hard。在第二种增量混合 Bagging 的设置中，bootstrap 的硬度是迭代变化的。在 47 个公开的二分类问题上对这两种 Mixed Bagging 方法进行测试，结果验证了本文提出的方法在总体上比对比算法的预测性能好得多。阅读全文

posted @ 2024-10-30 15:24 乌漆WhiteMoon 阅读(24) 评论(0) 推荐(0) 编辑

2024年10月29日

Paper Reading: Random Balance ensembles for multiclass imbalance learning

摘要：本文将 RandBal 方法从二分类扩展到多分类，提出了两种集成策略。第一种方法称为多重随机平衡 MultiRandBal，该方法同时处理所有类，每个基分类器的训练数据都是随机抽样的。第二种方法是将多分类问题按照 OVO 或 OVA 的分解为两分类问题，并构建 RandBal 集成学习器，这两个版本分别称为 OVO-RandBal 和 OVA-RandBal。通过 52 个多分类数据集进行了实验，结果表明 MultiRandBal 和 OVO/OVA-RandBal 都是原始二分类 RandBal 的可行扩展，在多分类不平衡问题上的表现优于其他对比方法。阅读全文

posted @ 2024-10-29 18:24 乌漆WhiteMoon 阅读(32) 评论(0) 推荐(0) 编辑

Paper Reading: Combined Cleaning and Resampling algorithm for multi-class imbalanced data with label noise

摘要：针对现有工作在多分类不平衡问题的不足，本文提出了一种新的多分类联合清洗和重采样算法 MC-CCR。MC-CCR 主要使用了分解策略的思想，利用基于能量的方法对适合过采样的区域进行挖掘。与 SMOTE 相比，该方法受离群点和异常值的影响较小。接着将其与清理操作相结合，减少了重叠类分布对学习算法性能的影响。最后提出了一种迭代策略将二分类的场景扩展到多分类，MC-CCR 比经典的多分类分解策略受类间关系信息丢失的影响更小。通过多个多类不平衡基准数据集的实验研究结果表明，该方法对噪声具有较高的鲁棒性，并且与现有方法相比具有较高的性能。阅读全文

posted @ 2024-10-29 03:25 乌漆WhiteMoon 阅读(48) 评论(0) 推荐(0) 编辑

2024年10月25日

Paper Reading: Multi-class Imbalance Classification Based on Data Distribution and Adaptive Weights

摘要：针对当前多分类不平衡问题仅依靠不平衡比，以及数据集的不平衡信息无法在训练过程中动态调整的问题。本文首先提出了基于自适应分布的样本权值，将类间不平衡比、类内密度变量和自适应裕度综合起来处理多类不平衡。接着将提出的自适应样本权值与 AdaBoost 学习框架相结合，提出了 AdaBoost.AD 算法，并为其提供了理论支持。通过多个不平衡数据集的实验，结果表明所提出的 AdaBoost.AD 相比现有方法具有更强的预测性能，并验证了自适应权重各个组成部分的有效性。阅读全文

posted @ 2024-10-25 19:59 乌漆WhiteMoon 阅读(80) 评论(0) 推荐(0) 编辑

2024年10月23日

Paper Reading: Cooperative Graph Neural Networks

摘要：本文提出了一种新的 GNN 架构，称为协作图神经网络 Co-GNN。在 Co-GNN 网络中，图中的每个节点都被视为可以执行 STANDARD(S)、LISTEN(L)、BROADCAST(B)、ISOLATE(I) 动作之一的参与者。Co-GNN 结构由两个联合训练的“合作”消息传递神经网络组成，分别是用于解决给定任务的环境网络 η 和一个用于选择最佳行动的行动网络 π。本文对新的消息传递方案进行了理论分析，并通过对合成数据和现实世界数据的对 Co-GNN 的性能进行了验证。阅读全文

posted @ 2024-10-23 17:42 乌漆WhiteMoon 阅读(127) 评论(0) 推荐(0) 编辑

2024年9月30日

Paper Reading: Deep balanced cascade forest: An novel fault diagnosis method for data imbalance

摘要：本文基于级联森林提出了一种用于不平衡故障检测数据集的模型 DBCF，该模型设计了优化的级联随机森林，从数据层面和算法层面改进不平衡学习。首先提出了一种新的多通道级联旋转机械故障诊断框架，该框架将数据级方法和算法级方法相结合。然后提出了一种混合采样方法，通过生成新数据和丢弃类分布边缘的样本实现，为每个梯级森林通道提供平衡的数据集。最后提出了一种基于数据比例统计计算的新型平衡信息熵，并使用该指标设计了一种新型平衡森林。通过在平衡数据集上的对比实验，结果验证了 DBCF 在处理不平衡故障诊断问题上更加稳定和有效。阅读全文

posted @ 2024-09-30 18:39 乌漆WhiteMoon 阅读(45) 评论(0) 推荐(0) 编辑

2024年9月29日

Paper Reading: Dynamic ensemble selection for multi-class imbalanced datasets

摘要：本文针对多分类不平衡学习问题设计了一种基于动态集成选择的方法 DES-MI，主要思想是针对不同的样本选择不同的分类器进行集成。首先利用随机平衡框架构造一组平衡数据集训练多个基分类器作为候选池，该重采样框架混合使用了随机欠采样、随机过采样和 SMOTE。然后通过使用样本周围的实例进行加权来评估候选分类器的能力，分类器的预测性能越高，则它在局部区域内的少数类别分类能力越强。最后根据每个选定的分类器的预测结果进行多数类投票，得票最多的类被视为最终输出类。通过 KEEL 库中的 20 个多类不平衡数据集的实验，分析了动态选择在多分类不平衡数据集场景下的有效性，结果表明 DES-MI 能够提高多分类不平衡数据集的分类性能。阅读全文

posted @ 2024-09-29 17:53 乌漆WhiteMoon 阅读(76) 评论(0) 推荐(0) 编辑

2024年9月28日

Paper Reading: Imbalanced ensemble learning leveraging a novel data-level diversity metric

摘要：为了解决基于现有多样性度量的学习复杂性较高的问题，本文提出了一种新的数据级多样性度量 IED。它能够直接基于训练数据集度量多样性，而不需要训练分类器，同时本文也设计了两种基于最优实例配对和贪婪实例配对的 IED 计算方法。在此基础上，本文设计了一种不平衡集成学习模型 P-EUSBagging，它使用基于种群的增量学习(PBIL)来生成子数据集，再用这些数据集用于训练具有最大数据级多样性的基分类器。P-EUSBagging 采用 Bagging 来集成，并设计了一种新的权重自适应投票策略，奖励给出正确预测的基本分类器。实验使用 44 个不平衡数据集，实验结果表明 IED 可以显著减少训练集成学习模型所需的时间，PEUSBagging 在 G-Mean 和 AUC 上都显著提高了学习性能。阅读全文

posted @ 2024-09-28 02:41 乌漆WhiteMoon 阅读(76) 评论(0) 推荐(0) 编辑

2024年9月19日

OpenFE: Automated Feature Generation with Expert-level Performance 的理论分析部分

摘要：目录问题定义数据集定义数据模型特征生成Theorem A.1 及其证明Theorem A.2 及其证明在论文《OpenFE: Automated Feature Generation with Expert-level Performance》中作者对理论结论给出了详细的分析过程，这篇博客对该部分阅读全文

posted @ 2024-09-19 11:00 乌漆WhiteMoon 阅读(55) 评论(0) 推荐(0) 编辑

乌漆 WhiteMoon

公告

搜索

常用链接

最新随笔

积分与排名

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论