Datawhale 之NLP学习-打卡(五)
Task5 基于深度学习的文本分类2
1.学习目标
- 学习Word2Vec的使用和基础原理
- 学习使用TextCNN、TextRNN进行文本表示
- 学习使用HAN网络结构完成文本分类
2.文本表示方法Part3
-
词向量
- 基本思想是对出现在上下文环境里的词进行预测
- 算法:Skip-grams(SG)预测上下文;Continuous Bag of Words(CBOW)预测目标单词
- 训练方法:Hierarchical softmax;Negative sampling
- Skip-grams原理和网络结构 给定input word来预测上下文
过程:;
-
TextCNN
-
TextRNN
-
TF-IDF
3.基于TextCNN、TextRNN的文本表示
- TextCNN
- TextRNN