摘要: RNN模型由于具有短期记忆功能,因此天然就比较适合处理自然语言等序列问题,尤其是引入门控机制后,能够解决长期依赖问题,捕获输入样本之间的长距离联系。本文的模型是堆叠两层的LSTM和GRU模型,模型的结构为:LSTM(GRU)—dropout—LSTM(GRU)—dropout—全连接层—输出层,比较 阅读全文
posted @ 2019-05-09 12:58 Luv_GEM 阅读(7568) 评论(5) 推荐(0) 编辑
摘要: 博客园的markdown用起来太心塞了,现在重新用其他编辑器把这篇博客整理了一下。 目前用word2vec算法训练词向量的工具主要有两种:gensim 和 tensorflow。gensim中已经封装好了word2vec这个包,用起来很方便,只要把文本处理成规范的输入格式,寥寥几行代码就能训练词向量 阅读全文
posted @ 2019-05-09 12:56 Luv_GEM 阅读(3486) 评论(1) 推荐(0) 编辑
摘要: 文本分类是自然语言处理中一个非常经典的任务,可用的模型非常多,相关的开源代码也非常多了。这篇博客用一个CNN模型,对新闻文本进行分类。 全部代码有4个模块:1、数据处理模块(命名为:cnews_loader.py) ;2、模型搭建模块(命名为cnn_model.py);3、模型运行模块(命名为run 阅读全文
posted @ 2019-05-09 07:45 Luv_GEM 阅读(2809) 评论(0) 推荐(1) 编辑