FastText

fastText的结构：输入为一个句子的N个词(ngram)的向量和表示，训练之前单个词向量可利用随机数进行初始化，随后将这些词向量加权平均得到对应文本的向量表示；输出为文本对应的标签。此模型结构与CBOW很相似，只是将输出由单词替换成了文本对应的标签。

O(hlog₂k)

1. bag of n-grams

2. hashing tricks

引用：

[1] Joulin, Armand, et al. "Bag of tricks for efficient text classification." arXiv preprint arXiv:1607.01759 (2016).

posted on 2018-07-12 17:45 bytedance 阅读(540) 评论(0) 收藏举报

刷新页面返回顶部