词表示

在NLP领域,自然语言通常是指以文本的形式存在,但是计算无法对这些文本数据进行计算,通常需要将这些文本数据转换为一系列的数值进行计算。那么具体怎么做的呢?这里就用到词向量的概念。

一般情况下,当我们拿到文本数据的时候,会先对文本进行分词,然后将每个单词映射为相应的词向量,最后基于这些词向量进行计算,达到预设任务的效果,下边我们分如下几节展开介绍词向量相关的知识。

内容组织如下:

  • One-Hot编码: 一种简单的单词表示方式
  • Word Embedding: 一种分布式单词表示方式
  • Word2Vec: 一种词向量的训练方法
    • 1. Word2Vec概述
    • 2. Skip-gram训练词向量原理
    • 3. Skip-gram网络结构
    • 4. 负采样解决大规模分类问题
  • 关于词向量的一些有趣应用
    • 1. 相似度计算
    • 2. 词聚类
    • 3. 词关系推理
posted @ 2022-08-26 18:57  xiaomin_beyonce  阅读(26)  评论(0编辑  收藏  举报