Datawhale 之NLP学习-打卡(五)

Task5 基于深度学习的文本分类2

1.学习目标

  • 学习Word2Vec的使用和基础原理
  • 学习使用TextCNN、TextRNN进行文本表示
  • 学习使用HAN网络结构完成文本分类

2.文本表示方法Part3

  • 词向量

    • 基本思想是对出现在上下文环境里的词进行预测
    • 算法:Skip-grams(SG)预测上下文;Continuous Bag of Words(CBOW)预测目标单词
    • 训练方法:Hierarchical softmax;Negative sampling
    • Skip-grams原理和网络结构 给定input word来预测上下文
      过程:;
  • TextCNN

  • TextRNN

  • TF-IDF

3.基于TextCNN、TextRNN的文本表示

  • TextCNN
  • TextRNN

4.使用HAN用于文本分类

5.本章小结

6.本章作业

posted @ 2020-07-31 22:54  柔南青空  阅读(121)  评论(0编辑  收藏  举报