摘要: 本文介绍文本处理时比较常用且有效的tfidf特征提取方法 1. 提取tf特征 TF即是词频(Term Frequency)是文本信息量统计方法之一,简单来说就是统计此文本中每个词的出现频率 def computeTF(wordDict, bow): tfDict = {} bowCount = le 阅读全文
posted @ 2020-08-24 02:16 Mr_Yun 阅读(2421) 评论(0) 推荐(0) 编辑