07 2021 档案
如何少走弯路安装NLTK?
摘要:NLP中分词是一件麻烦事,nltk可以一定程度上优雅的解决一些需求 如果你去搜索“nltk安装”,那么多半会得到以下的代码 import nltk nltk.download() 你多半不会进入如下界面(因为网络问题会提示远程连接失败) 然后你什么都没下载就试图去使用nltk,会报错如下: Look
【转载】nltk英文自定义分词
摘要:NLTK项目地址: https://github.com/nltk/nltk_data/tree/gh-pages/packages NLTK基础分词用例: https://www.cnblogs.com/ketmales/archive/2013/05/31/3111046.html 词性标注:
【NLP学习其3.5】词嵌入的特性,为什么词之间会有联系?
摘要:词嵌入的特性 现在你有了一堆嵌入向量,我们可以开始学习他们之间的特性了 前情提要:https://www.cnblogs.com/DAYceng/p/14962528.html 先把各向量重新命名便于区分 Man对应e_man① Woman对应e_woman② King对应e_king③ Queen
【NLP学习其三】在学习什么是嵌入之前,你应该了解什么是词语表征
摘要:在了解什么是**嵌入(embeddings)**之前,我们需要先搞清楚一个词语在NLP中是如何被表示的 注:本次不涉及任何具体算法,只是单纯对概念的理解 词汇表征 One-Hot 词汇的表示方法有很多,最有名的肯定是独热编码(One-Hot )了。因为不是重点,所以下面只简单介绍一下 废话不多说,上