摘要: 昨天大致把思路理清楚了,用one-hot的方式把关键词按字拆开编码,今天尝试可行性。 目前主流的文本向量化方式主要包括one-hot、tf (term-frequency)和tf-idf (term frequency–inverse document frequency)这三种,越往后准确度应该越 阅读全文
posted @ 2020-04-12 12:49 何未生 阅读(533) 评论(0) 推荐(0) 编辑