2020 年 10月 3 日随笔档案 - 猫七的blog

2020年10月3日

摘要：传统方法的局限性：一：数据稀疏性: 语言是离散的符号系统，每个字符，单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量，通常要将离散符号按照其索引编码为One-hot向量。然而近义词之间并不能通过这种方式编码成相似的向量。将任意词语表示为固定长度为n的稠密向量，并且稠密阅读全文

posted @ 2020-10-03 23:59 猫七的blog 阅读(77) 评论(0) 推荐(0) 编辑

猫七的blog

https://www.cnblogs.com/liuguangshou123/

公告