NLP材料的一些笔记

前几天断更了,现在根据阅读的材料进行一些补充。

 

模型驱动 + 数据驱动 = 自然语言表示学习

 

 

 

sentiment

classification

entity extraction

translation

topic modeling

 

深度学习 = 表示学习 + 浅层学习

分布式表示:压缩、低维、稠密向量

 

词、短语:组合语义模型

句子:序列模型、递归模型、卷积模型、自注意力模型

篇章:层次模型

 

Transformer:可能是目前为止最适合NLP的模型

 

 

 

 

ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations (Lan et al., arXiv:1909.11942)
 更小的词向量维度(128)
 跨层参数共享(类似循环神经网络)
 将下句预测(NSP)改为句子顺序预测(SOP)

 

posted @ 2022-03-04 17:18  blcblc  阅读(27)  评论(0编辑  收藏  举报