词表示
在NLP领域,自然语言通常是指以文本的形式存在,但是计算无法对这些文本数据进行计算,通常需要将这些文本数据转换为一系列的数值进行计算。那么具体怎么做的呢?这里就用到词向量的概念。
一般情况下,当我们拿到文本数据的时候,会先对文本进行分词,然后将每个单词映射为相应的词向量,最后基于这些词向量进行计算,达到预设任务的效果,下边我们分如下几节展开介绍词向量相关的知识。
- One-Hot编码: 一种简单的单词表示方式
- Word Embedding: 一种分布式单词表示方式
- Word2Vec: 一种词向量的训练方法
- 1. Word2Vec概述
- 2. Skip-gram训练词向量原理
- 3. Skip-gram网络结构
- 4. 负采样解决大规模分类问题
- 关于词向量的一些有趣应用
- 1. 相似度计算
- 2. 词聚类
- 3. 词关系推理