2018年12月4日
摘要: 一、文本关键词提取 1、过滤掉文本中出现的停用词 停用词:指与文章主题不相干的词,符号等。表现在:1、文本中大量出现;2、与主旨不相关;3、对于分析文本没用处 2、TF-IDF决定关键词 (1)首先进行词频(Term Frequency,TF),IDF,TF-IDF统计 TF-IDF统计方法用于评估 阅读全文
posted @ 2018-12-04 23:36 Bonjour_ing 阅读(304) 评论(0) 推荐(0) 编辑