torch.full(size, fill_value, …) #返回大小为sizes,单位值为fill_value的矩阵t

1、预处理

流程:原始文本-》分词-》清洗-》标准化-》特征提取-》建模

词干提取&词型还原:leaves

leav leaf

停用词:

  nltk英文停用词表

  中文可以下载

 

2.网络结构

3.知识梳理

4.Gensim

一款开源的第三方python包,从原始的非结构化文本中,无监督学习文本隐层的主题向量表达,支持TFIDF,LSA,LDA,Word2vec主题模型算法

posted on 2020-12-01 12:33  黑暗尽头的超音速炬火  阅读(1424)  评论(0编辑  收藏  举报