论文学习总结

————爬虫学习————

01：2021.10.17

机器学习，sklearn库，无监督学习聚类，聚类算法

02：2021.10.22

实例：基于聚类的图像分割实例编写

03：2021.10.29

理论：无监督学习之降维，降维，主成分分析PCA，非负矩阵分解NMF

04：2021.11.07

理论：机器学习之监督学习，分类，回归

05：2021.11.14

理论：基本分类模型，K近邻分类器KNN，决策树，朴素贝叶斯

06：2021.11.20

实例：人体运动状态分析

07：2021.11.27

实例：线性回归，房价与尺寸线性拟合

08：2021.12.04

支持向量机SVM，K者交叉验证，实例：上证指数涨跌预测

09：2022.01.08

实例：手写数字识别，神经网络实现，KNN实现

————爬虫学习————

10：2022.01.15

jupyter，http和https，requests模块，实例

11：2022.01.22

实例：药监总局企业详情信息，网易云评论爬取，词云图制作

————论文学习————

12：2022.01.27

爬虫学习，彼岸图网图片爬取

2020年，中国科学：技术科学（英文版）

预训练综述：Pre-trained Models for Natural Language Processing

13：2022.02.12

作者: Ashish Vaswani等

单位: Google

发表会议及时间: NIPS 2017

Transformer: Attention Is All You Need

14：2022.02.20

作者: Ashish Vaswani等

单位: Google

发表会议及时间: NIPS 2017

Transformer: Attention Is All You Need

实例：jupyter notebook的实现

15：2022.02.26

2018 Google AI Language

BERT: Pre-training of Deep Bidirectional Transformers for Language Understandin

16：2022.03.05

实例：爬虫scrapy，化工产品爬虫

2014

Convolutional Neural Networks for Sentence Classification

实例：TextCNN文本分类

17：2022.03.13

2018 Google AI Language

BERT: Pre-training of Deep Bidirectional Transformers for Language Understandin

18：2022.03.19

2020 Google AI Language

A lite BERT for self-supervised learning of language representations

19：2022.03.26

BERT的pytorch实现

模型学习：LSTM

专利想法

20：2022.04.03

详细学习和步骤

模型学习：TextCNN，LSTM，GRU

专利想法，模型设计和实现

21：2022.04.09

专利书写，visio图的介绍

22：2022.04.14

AAAI 2021

SALNet: Semi-Supervised Few-Shot Text Classification with Attention-Based Lexicon Construction

小样本文本分类情境下，对class对应的关键词进行扩充的问题。

可以用于少量本的文本分类，采用半监督迭代的方式进行。

可以一定程度上解决新训练集与旧分类器之间的差距。

23：2022.04.23

AAAI 2021

Label Confusion Learning to Enhance Text Classification Models

标签学习的提升组件LCM

24：2022.05.01

专利书写，针对长短文本的想法

25：2022.05.07

AAAI 2021

Label Confusion Learning to Enhance Text Classification Models

代码实现

26：2022.05.28

2019

Distilling Task-Specific Knowledge from BERT into Simple Neural Networks

BERT的知识蒸馏，Distilled BiLSTM，代码实现

27：2022.06.04

AAAI 2021

ACT: an Attentive Convolutional Transformer for Efficient Text Classification

28：2022.06.12

AAAI2019

Google AI Language

Vanilla Transformer: Character-Level Language Modeling with Deeper Self-Attention

ACL2019

Transformer-XL: Attentive Language Models

beyond a Fixed-Length Context

针对Transformer的改进

29：2022.06.19

AAAI2021

ACT: an Attentive Convolutional Transformer for Efficient Text Classification

ACT模型把Transformer的Scaled Dot-Product Attention模块换成了attentive convolution mechanism，主要就是CNN加了一个Global feature representation。

30：2022.06.24 —— 数据增强

2021数据增强综述

A Survey on Data Augmentation for Text Classification

做了实验，xmind结构图

31：2022.07.02

ACL2020

Feature Projection for Improved Text Classification

特征投影网络FP-Net

32：2022.07.18

CCF NCCA 2021

CCF第36届中国计算机应用大会

结合BERT和特征投影网络的新闻主题文本分类方法

33：2022.07.25

AAAI2021

Merging Statistical Feature via Adaptive Gate for Improved Text Classification

自适应门网络

提出了一种自适应门网络(AGN)来选择性地利用统计特征巩固语义表示，可以和现有的文本分类模型结合提升模型的性能。

34：2022.07.31

模型修改

在写小论文？

画了visio图

35：2022.08.07

AAAI 2020

Multi-Scale Self-Attention for Text Classification

基于多头自注意力的归纳偏置

36：2022.08.13

ACM2020

Google AI Language

XLNet: Generalized Autoregressive Pretraining for Language Understanding

XLNet使用了Transformer-XL的优化方式，

提出了一些新的方法，改善了BERT存在的问题，但是参数比BERT更大

37：2022.08.20

AAAI2021

MASKER: Masked Keyword Regularization for Reliable Text Classification

针对当前预训练模型过分依赖关键词，而不是上下文，这种不稳定性，提出了Masked Keyword Regularization (MASKER)，通过MASK的方式，对关键词进行正则化，降低模型对关键词的依赖，更多利用上下文信息来预测。

在关键词的选择上提出了两种方法，基于频率，基于attention注意力机制。

对MASK的约束：掩码关键词的重构，掩码之后的熵正则。

38：2022.08.30

ACL2020

Contextualized Weak Supervision for Text Classification

基于上下文弱监督的文本分类，

开发一种无监督的方法，可以根据词向量和seed words，解决语料库中单词的一词多义问题。

设计一种排序机制，消除seed words中一些无效的单词；并将有效的单词扩充进seed words中。

39：2022.09.14

ACL2020

Every Document Owns Its Structure: Inductive Text Classification via Graph Neural Networks

提出了一种新的文本分类方法，通过图神经网络进行归纳词表示。

训练了一个GNN，仅使用训练集来描述“单词-单词”关系。

使用滑动窗口来构建单个图，单词节点的信息通过门控图神经网络传播到其邻居，加强上下文关系的学习。

40：2023.09.24

ACL2020

Hierarchy-Aware Global Model for Hierarchical Text Classification

提出一种层次感知的全局模型，使用了两种方法来进行标签的预测

思考：同父类的子节点应该继承了父类的某些共性特征，彼此之间还存在某种差异，可以加上一个随机干扰的波动FGM对抗扰动

41：2022.10.01

NLPCC2020

Sentence Constituent-Aware Aspect-Category Sentiment Analysis with Graph Attention

用于细粒度分类的句子成分感知神经网络，
提出的网络结构中，包括了2个图注意力网络模块，
最后用1个交互式的loss函数来计算损失。

42：2022.10.08

AAAI2021

Ideograph Leads Us to the Field of Cognition: A Radical-Guided Associative Model for Chinese Text Classification

基于汉字的蒸馏和汉字偏旁联想空间

43：2022.10.15

EMNLP 2020

MODE-LSTM: A Parameter-efficient Recurrent Network with Multi-Scale for Sentence Classification

句子分类的核心问题是提取多尺度的特征，以此来理解句子的语义。论文提出了一种依赖于LSTM的多尺度递归模型。

将LSTM的隐藏状态分解为几个独立更新的小隐藏状态，结合不同大小的滑动窗口来提取多尺度的特征。

44：2022.10.22

Google Research 2022

Block-Recurrent Transformers

把Transformer作为RNN的循环单元，解决长文本问题，利用传统的RNN递归来增加长文档中的Transformer，

模型在学习一个token的时候，也可以同样考虑到上一个状态的输入和输出。

45：2022.11.06

AAAI2021

MASKER：Masked Keyword Regularization for Reliable Text Classification

针对MASK机制的改动，

在关键词的选择上提出了两种方法，基于频率，基于attention注意力机制。对MASK的约束：掩码关键词的重构，掩码之后的熵正则。

46：2022.11.12

AAAI2021

Does Head Label Help for Long-Tailed Multi-Label Text Classification

利用Head-to-Tail Network解决了多标签文本分类中的文本标签分布不均衡的问题。

通过使用头尾标题标签所属的文档，转移学习头尾标签的知识，映射学习到的长尾标签的依赖权重。

47：2022.12.04

专利想法

基于词汇投影混合标签学习的文本分类方法

48：2022.12.16

AAAI2021

MARTA: Leveraging Human Rationales for Explainable Text Classification

提出了一种混合的Human-AI方法，在基于注意力的文本分类模型中，纳入了人类的理性判断，该框架在架在分类可解释性和准确性方面有着显著提高。

通过人工的为相关文本片段添加注释理由，来辅助模型进行分类。

49：2022.12.30 —— 知识蒸馏

EMNLP 2019

Distilling task-specific knowledge from bert into simple neural networks

Patient knowledge distillation for bert model compression

DistilBERT, a distilled version of BERT: smaller, faster, cheaper and lighter

50：2023.01.07 —— 知识蒸馏

EMNLP 2019

TinyBERT: Distilling BERT for Natural Language Understanding

ACL2020

MobileBERT: a Compact Task-Agnostic BERT for Resource-Limited Devices

NeurIPS2020

MINILM: Deep Self-Attention Distillation for Task-Agnostic Compression of Pre-Trained Transformers

总结

Distilled BiLSTM：BERT-large蒸馏到了单层的BiLSTM中
BERT-PKD ：耐心知识蒸馏，skip或last
DistillBERT：对PKD的改进，新增了一个cosine embedding loss
TinyBERT：提出了two-stage learning框架，分别在预训练和精调阶段蒸馏教师模型。
MobileBERT：致力于减少每层的维度，压缩维度的主要思想在于bottleneck机制。
MiniLM：Value-Relation Transfer的蒸馏让学生模型更深入地模仿教师模型。

51：2023.01.13

ACL2021

ChineseBERT: Chinese Pretraining Enhanced by Glyph and Pinyin Information

提出了一种大规模的面向中文的NLP预训练模型ChineseBERT。

利用汉字字形信息与拼音信息消除汉字的起义，从而更好的进行正则化，使模型更好建模潜在文本语义。

52：2023.02.01

ACL2021

Text Classification with Negative Supervision

负样本监督，提出了负监督的方法，利用不同标签文本的差异实现对编码器的负面监督，让分类器具有更高的区别性。

在正常的文本分类任务过程中，加入正样例与负样例之间相似度的损失函数，让模型能学到更具有差异性的信息，以提高识别效果。

53：2023.02.10

ACL2022

X-Class: Text Classification with Extremely Weak Supervision

提出了X-Class框架，用于自适应文档对每个标签类别扩充seed words，自适应文档在标签的递增下添加seed words进行表示。再联系上下文，加入了混合注意力机制，通过计算文档与上下文单词的加权平均以及聚类的置信度进行分类。

54：2023.02.19

论文想法多尺度注意力循环单元

posted @ 2023-03-08 15:54 奶酥阅读(96) 评论(0) 编辑收藏举报

刷新页面返回顶部

奶酥

论文学习总结

————爬虫学习————

01：2021.10.17

02：2021.10.22

03：2021.10.29

04：2021.11.07

05：2021.11.14

06：2021.11.20

07：2021.11.27

08：2021.12.04

09：2022.01.08

————爬虫学习————

10：2022.01.15

11：2022.01.22

————论文学习————

12：2022.01.27

13：2022.02.12

14：2022.02.20

15：2022.02.26

16：2022.03.05

17：2022.03.13

18：2022.03.19

19：2022.03.26

20：2022.04.03

21：2022.04.09

22：2022.04.14

23：2022.04.23

24：2022.05.01

25：2022.05.07

26：2022.05.28

27：2022.06.04

28：2022.06.12

29：2022.06.19

30：2022.06.24 —— 数据增强

31：2022.07.02

32：2022.07.18

33：2022.07.25

34：2022.07.31

35：2022.08.07

36：2022.08.13

37：2022.08.20

38：2022.08.30

39：2022.09.14

40：2023.09.24

41：2022.10.01

42：2022.10.08

43：2022.10.15

44：2022.10.22

45：2022.11.06

46：2022.11.12

47：2022.12.04

48：2022.12.16

49：2022.12.30 —— 知识蒸馏

50：2023.01.07 —— 知识蒸馏

51：2023.01.13

52：2023.02.01

53：2023.02.10

54：2023.02.19

公告