摘要: 上一篇博客用词袋模型,包括词频矩阵、Tf-Idf矩阵、LSA和n-gram构造文本特征,做了Kaggle上的电影评论情感分类题。 这篇博客还是关于文本特征工程的,用词嵌入的方法来构造文本特征,也就是用word2vec、glove和fasttext词向量进行文本表示,训练随机森林分类器。 一、训练wo 阅读全文
posted @ 2019-05-19 17:56 Luv_GEM 阅读(9329) 评论(0) 推荐(2) 编辑
摘要: 现在自然语言处理用深度学习做的比较多,我还没试过用传统的监督学习方法做分类器,比如SVM、Xgboost、随机森林,来训练模型。因此,用Kaggle上经典的电影评论情感分析题,来学习如何用传统机器学习方法解决分类问题。 通过这个情感分析的题目,我会整理做特征工程、参数调优和模型融合的方法,这一系列会 阅读全文
posted @ 2019-05-19 10:39 Luv_GEM 阅读(11478) 评论(5) 推荐(0) 编辑