摘要: 关于机器学习,自己也是半路出家,没啥基础, 不过知识也是一点一点积累起来的。tf-idf是在处理文本中很常用的一个公式, 下面记录一下自己对它的理解: tf :计算某个词在某个文档中的词频(即某个词在它所在的行中出现的次数,在spark ml的表示中,一行代表一个文档)。 idf: 逆向文档频率, 阅读全文
posted @ 2018-07-10 18:22 无西lc 阅读(100) 评论(0) 推荐(0) 编辑