摘要: 传统方法的局限性: 一:数据稀疏性: 语言是离散的符号系统,每个字符,单词都是离散型随机变量。而机器学习模型只接受向量。所以为了将文本转换成向量,通常要将离散符号按照其索引编码为One-hot向量。 然而近义词之间并不能通过这种方式编码成相似的向量。 将任意词语表示为固定长度为n的稠密向量,并且稠密 阅读全文
posted @ 2020-10-03 23:59 猫七的blog 阅读(77) 评论(0) 推荐(0) 编辑