20250120打卡——信息领域热词分析05

TF-IDF 关键词提取
做了什么:计算文本的 TF-IDF 值,提取最重要的热词。
学到什么:理解 TF-IDF 算法的基本原理,掌握 sklearn.feature_extraction.text.TfidfVectorizer。
遇到的问题:高频词干扰结果,TF-IDF 不能捕捉语义关系。

本文作者:丰川扬子

本文链接:https://www.cnblogs.com/newzeon/p/18691147

版权声明:本作品采用知识共享署名-非商业性使用-禁止演绎 2.5 中国大陆许可协议进行许可。

posted @   丰川扬子  阅读(2)  评论(0编辑  收藏  举报
历史上的今天:
2024-01-25 20240125打卡——《构建之法》读书笔记第1~4章
点击右上角即可分享
微信分享提示
💬
评论
📌
收藏
💗
关注
👍
推荐
🚀
回顶
收起
  1. 1 404 not found REOL
404 not found - REOL
00:00 / 00:00
An audio error has occurred.