摘要:
Term Lookup是和Term Extraction相反的一个组件。Term Extraction是为了找出term,Term Lookup是利用我们关心的term list来找出某个文本里面包含多少该关键字。 阅读全文
摘要:
中文意思是关键词抽取,用于计算在文本中哪些词汇或者词组出现的频率最高。其实算法有两张:1)Frequency 2)TFIDFTFIDF的全称是Term Frequency and Inverse Document Frequency,是一个用于计算单词或词组在在整个文本中出现的几率。下面是这个公式的... 阅读全文