02 2023 档案

摘要:Embedding Onehot 对类别数据 one-hot: 类别如果用整数编码存在大小关系,计算损失和距离会有问题。 对特征 one-hot: 常见于对词的处理,将词映射到一个欧式空间,便于计算距离等。 one-hot 向量的维度等同于词表的维度 存在的问题 one-hot 的向量无法体现词之间 阅读全文
posted @ 2023-02-07 15:33 巴啦啦胖魔仙 阅读(103) 评论(0) 推荐(0) 编辑
摘要:keras-tokenization keras中的文本标记实用类,用于分词: 将文本转换为整数序列(每个数是词在词表中的索引)。 将文本处理为向量。 例1 keras.preprocessing.text.Tokenizer(num_words=None, filters='!"#$%&()*+, 阅读全文
posted @ 2023-02-04 10:15 巴啦啦胖魔仙 阅读(84) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示