随笔分类 - NLP

pytorch 中conv1d操作

摘要：参考：https://blog.csdn.net/liujh845633242/article/details/102668515 这里我重点说一下1D卷积，2D卷积很好理解，但是1D卷积就不是那么好理解了，以textcnn为例，在对句子长度进行卷积之后，再将词向量的维度SUM成1维，总而言之，大家阅读全文

posted @ 2019-12-03 11:07 哦摩西罗伊阅读(4892) 评论(0) 推荐(0) 编辑

NLP基本知识点和模型

摘要：word2vec：https://www.jianshu.com/p/471d9bfbd72f 基于Hierarchical Softmax: https://www.cnblogs.com/pinard/p/7243513.html 基于Negative Sampling：https://www. 阅读全文

posted @ 2019-12-03 10:37 哦摩西罗伊阅读(835) 评论(0) 推荐(0) 编辑

安装和使用nltk

摘要：安装参考：https://www.cnblogs.com/zrmw/p/10869325.html 分词：注意先分句再分词，这些对象均来自nltk.tokenize库 1. word_tokenize 导入nltk的tokenize库后，tokens = nltk.word_tokenize( 阅读全文

posted @ 2019-11-16 20:17 哦摩西罗伊阅读(883) 评论(0) 推荐(0) 编辑

阅读深度学习论文的一些技巧

摘要：本菜鸡的科研之路已经开始两三个月了，期间遇到了很多问题，现在想在这里总结一下。 1. 在阅读深度学习论文的时候，首先需要看看代码是否开源，如果没有开源应该向作者索要源码，然后在本地运行这些代码。这样做是很有必要的，因为深度学习就是一个玄学，论文里故事编的再漂亮也不能work，因此你需要用代码来进行验阅读全文

posted @ 2019-11-04 15:08 哦摩西罗伊阅读(1480) 评论(0) 推荐(3) 编辑

excel打开csv 出现乱码

摘要：现在做舆情分析的相关项目，在数据处理的时候，发现了一个问题。将数据写入到csv文件，用excel打开（默认）就会出现乱码，如果将数据写入到.xlsx文件就不会出现乱码，因为csv是通用格式，所以我猜想是excel的问题，在网上baidu了一下，发现果然是这样。 https://jingyan.bai 阅读全文

posted @ 2019-07-15 11:34 哦摩西罗伊阅读(5044) 评论(0) 推荐(0) 编辑

使用bert进行情感分类

摘要：2018年google推出了bert模型，这个模型的性能要远超于以前所使用的模型，总的来说就是很牛。但是训练bert模型是异常昂贵的，对于一般人来说并不需要自己单独训练bert，只需要加载预训练模型，就可以完成相应的任务。下面我将以情感分类为例，介绍使用bert的方法。这里与我们之前调用API写代码阅读全文

posted @ 2019-07-09 16:16 哦摩西罗伊阅读(8476) 评论(0) 推荐(0) 编辑

公告

昵称：哦摩西罗伊
园龄： 8年8个月
粉丝： 86
关注： 4

+加关注

2025年3月

日

一

二

三

四

五

六

哦摩西罗伊

不忘初心，方得始终

随笔分类 - NLP

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论