多标签学习算法参考文献汇集笔记
- 《多标签学习在智能推荐中的研究与应用》
1、《基于数据挖掘的通信客户营销系统研究与应用》
- 《标签推荐方法研究综述》
[1]徐鹏宇,刘华锋,刘冰等.标签推荐方法研究综述[J].软件学报,2022,33(04):1244-1266.DOI:10.13328/j.cnki.jos.006481.
摘要:
随着互联网信息的爆炸式增长,标签(由用户指定用来描述项目的关键词)在互联网信息检索领域中变得越来越重要.为在线内容赋予合适的标签,有利于更高效的内容组织和内容消费.而标签推荐通过辅助用户进行打标签的操作,极大地提升了标签的质量,标签推荐也因此受到了研究者们的广泛关注.总结出标签推荐任务的三大特性,即项目内容的多样性、标签之间的相关性以及用户偏好的差异性.根据这些特性,将标签推荐方法划分为3个类别,分别是基于内容的方法、基于标签相关性的方法以及基于用户偏好的方法.之后,针对这3个类别下的对应方法进行了梳理和剖析.最后,提出了当前标签推荐领域面临的主要挑战,例如标签的长尾问题、用户偏好的动态性以及多模态信息的融合问题等,并对未来研究方向进行了展望.
关键词: 机器学习; 信息检索; 推荐系统; 标签推荐; 用户偏好;
被引用:
1、《基于标签相关性的K近邻多标签学习》
[1]钱龙,赵静,韩京宇等.基于标签相关性的K近邻多标签学习[J].计算机工程,2022,48(06):73-78+88.DOI:10.19678/j.issn.1000-3428.0063270.
关键词: 机器学习; 多标签学习; 标签相关性; K近邻; 频繁项集;
2、《面向多标签分类的在线主动学习算法研究》
[1]龚楷伦. 面向多标签分类的在线主动学习算法研究[D].扬州大学,2022.DOI:10.27441/d.cnki.gyzdu.2022.002022.
关键词: 在线主动学习; 多标签分类; 基于辨别的主动查询策略; 不确定性主动查询策略; 标签相关性;
- 《监督和半监督学习下的多标签分类综述》
[1]武红鑫,韩萌,陈志强,张喜龙,李慕航.监督和半监督学习下的多标签分类综述[J].计算机科学,2022,49(08):12-25.
摘要:
传统的多标签分类算法大多数采用监督学习的方式,但现实生活中有许多数据没有被标记。通过人工的方式对需要的全部数据进行标记耗费的成本较高。半监督学习算法可以使用大量未标记数据和标记数据来进行工作,因此受到了人们的重视。文中首次从监督和半监督学习的角度对多标签分类算法进行阐述,同时全面地对多标签分类算法的应用领域进行了总结。从决策树、贝叶斯、支持向量机、神经网络和集成等多个方向对标签非相关性和标签相关性的监督学习算法进行概述,从批处理和在线的方向对半监督学习算法进行综述,从图像分类、文本分类和其他等角度对多标签的实际应用领域进行介绍。文中还简要分析了多标签的评估指标,最后给出了关于半监督学习下的复杂概念漂移处理、特征选择处理、标签复杂相关性处理和类不平衡处理的研究方向。
关键词: 监督学习; 半监督学习; 多标签分类; 图像分类; 文本分类;
- 《Multi-Class Learning from Label Proportions for Bank Customer Classification》
[1]Qian, Y., Tong, Q., & Wang, B. (2019). Multi-Class Learning from Label Proportions for Bank Customer Classification. Procedia Computer Science, 162, 421–428.
摘要:
本文研究了基于标签比例的多类学习,并将其应用于银行客户分类,为银行更好地管理客户关系提供建议 。我们尝试将多类极端学习机(ELM)应用于从标签比例(LLP)中进行的学习。ELM具有类似于神经网络的 结构,具有较高的计算速度和较好的泛化能力。因此,它适用于处理大规模和多类的问题。LLP是一个学习 问题,它将训练数据分类为袋子,每个袋子中每个类别的标签比例可用。此外,为了在袋子尺寸增加时保持 稳定的模型精度,我们设法在我们的模型中添加了少量的标记样本,在半监督学习框架中称为LLP-ELM。实验证明,我们的改进在大袋尺寸的情况下具有优势。在实际应用中,将该算法应用于银行客户分类等多类场 景的多类学习是值得考虑的。
关键词:多类分类,标签比例学习,银行客户分类
- 《基于标签相关性的多视角多标签学习方法研究》
[1]李伟彬. 基于标签相关性的多视角多标签学习方法研究[D].广东工业大学,2022.DOI:10.27029/d.cnki.ggdgu.2022.000359.
摘要:
多标签学习处理的是将给定的样本同时与多个标签相关联的问题。近年来,多标签学习已成为机器学习文献中的一个热门话题,并引起了大量的研究。然而,如何准确地描述标签之间的真实关系,以及如何进一步增强标签之间的相关性依然是多标签学习所面临的挑战。另外,以往大多数的多标签学习方法只考虑了单个视角的信息,很少有与多视角学习结合起来。为此,为了解决多标签分类问题,本文提出了一种基于标签相关性的多视角多标签学习方法(简称:ELSMML)。基于高阶策略,ELSMML首先构造了一个精细化的标签关联矩阵来描述标签之间的关系。接着,ELSMML利用多视角学习和降维技术挖掘高级潜在语义标签信息和潜在特征信息,进而在低维空间中构建分类器。此外,我们采用流形学习正则化使低维空间中的数据点与原始空间中的数据点保持相同的内在结构。然后,我们采用了加速近端梯度法(the accelerated proximal gradient method)对ELSMML方法进行优化,得到了预测分类器。此外,我们还对ELSMML方法进行了收敛性分析和复杂度分析。最后,为了验证性能,我们选取了几个典型的多标签学习算法和多视角多标签学习算法作为基准线在一些常用的数据集上进行了实验。实验结果表明:与基准线相比,ELSMML方法在评价指标上具有更好的性能。总体而言,本文总结了以下三点贡献:(1)本文提出了一种新的多视角多标签学习方法(ELSMML),该方法基于标签相关性和多视角学习来提高学习性能。在多视角多标签学习中,我们的模型首先依赖于一个精细化的标签相关性矩阵来清晰地描述标签之间的高阶关系,然后我们利用多视角学习和降维进一步挖掘高级潜在语义标签信息和潜在特征信息。因此,该方法可以很好地利用多个视角和多个标签之间的信息,提高多标签分类器的性能。(2)本文采用了加速近端梯度方法来优化所提出的目标模型,并获得了预测分类器。接着,我们给出了ELSMML算法的收敛性分析。收敛性分析从理论上证明了ELSMML算法的可行性。此外,我们还对ELSMML算法进行了复杂度分析。(3)本文设置并实施了实验。基于十一个常用的数据集,我们从六个评价指标对ELSMML和基线方法进行性能评估。接着,为了进一步验证ELSMML的有效性,我们还进行了统计检验和参数敏感性分析。结果表明:与基线方法相比,ELSMML方法能实现更好的性能。
关键词: 多标签学习; 多视角学习; 标签相关性;