摘要:
一、数据读取 二、准备建模 三、模型定义 四、模型训练 五、特征数据归一化 六、模型应用 六、可视化训练过程的损失 七、新版本-tensorbord可视化 阅读全文
摘要:
前言 关键词提取就是从文本里面把跟这篇文章意义最相关的一些词语抽取出来。这个可以追溯到文献检索初期,关键词是为了文献标引工作,从报告、论文中选取出来用以表示全文主题内容信息的单词或术语,在现在的报告和论文中,我们依然可以看到关键词这一项。因此,关键词在文献检索、自动文摘、文本聚类/分类等方面有着重要 阅读全文
摘要:
最近一直没有更新文章,实在惭愧。伴随着小老弟的职业方向由风控转向了NLP,后面的文章也会集中在NLP领域,希望大家能够继续支持~话不多说,今天来介绍一个简单又高效实用的算法-TextRank。 TextRank主要有关键词提取和文本摘要两个功能,在Jieba分词里也有集成,本文将围绕原理、应用及优缺 阅读全文
摘要:
一、什么是 TF-IDF? TF-IDF(Term Frequency-Inverse Document Frequency, 词频-逆文件频率)是一种用于资讯检索与资讯探勘的常用加权技术。TF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随 阅读全文