随笔分类 - sklearn
摘要:转载:https://www.cnblogs.com/MartinLwx/p/10005520.html#4209708 为什么需要词向量? 众所周知,不管是机器学习还是深度学习本质上都是对数字的数字,Word Embedding(词嵌入)做的事情就是将单词映射到向量空间里,并用向量来表示 upda
阅读全文
摘要:one-hot是比较常用的文本特征特征提取的方法。 one-hot编码,又称“独热编码”。其实就是用N位状态寄存器编码N个状态,每个状态都有独立的寄存器位,且这些寄存器位中只有一位有效,说白了就是只能有一个状态。 下面举例说明: 有四个样本,每个样本有三种特征: feature1 feature2
阅读全文