随笔分类 -  HanLP

摘要:原理: 依托HanLP的核心词典和自定义词典根据TF*IDF算法计算 每个命名实体和名词短语的得分score,按score倒排返回前面若干个关键词 解释: TF 称为词频,表示词在一篇文档中出现的频率=词在该文档中出现的次数 / 该文档中单词的总数 TF越大,表示该词对文档越重要 DF称为文档频率, 阅读全文
posted @ 2019-08-09 13:52 眸色 阅读(2203) 评论(0) 推荐(0) 编辑
摘要:前段时间,领导要求出一个关键字提取的微服务,要求轻量级。 对于没写过微服务的一个小白来讲。硬着头皮上也不能说不会啊。 首先了解下公司目前的架构体系,发现并不是分布式开发,只能算是分模块部署。然后我需要写个Boot的服务,对外提供一个接口就行。 在上网浏览了下分词概念后,然后我选择了Gradle & 阅读全文
posted @ 2019-07-05 11:32 眸色 阅读(5188) 评论(3) 推荐(1) 编辑

点击右上角即可分享
微信分享提示