NLP材料的一些笔记

前几天断更了，现在根据阅读的材料进行一些补充。

模型驱动 + 数据驱动 = 自然语言表示学习

sentiment

classification

entity extraction

translation

topic modeling

深度学习 = 表示学习 + 浅层学习

分布式表示：压缩、低维、稠密向量

词、短语：组合语义模型

句子：序列模型、递归模型、卷积模型、自注意力模型

篇章：层次模型

Transformer：可能是目前为止最适合NLP的模型

ALBERT: A Lite BERT for Self-Supervised Learning of Language Representations (Lan et al., arXiv:1909.11942)
 更小的词向量维度(128)
 跨层参数共享(类似循环神经网络)
 将下句预测(NSP)改为句子顺序预测(SOP)

posted @ 2022-03-04 17:18 blcblc 阅读(47) 评论(0) 收藏举报

刷新页面返回顶部

笨鸟居士的博客

NLP材料的一些笔记

公告