随笔分类 -  机器(深度)学习 / NLP / 信息所

TF-IDF
摘要:定义: TF-IDF 是针对一个文档集合(语料库)设计的,这种统计方法用于评估一个词语对于一份文件的重要程度 就是TF-IDF的值越高,这个词在这篇文档中的重要性就越高 TF (Term Frequency): 这是一个单词在该篇文章中出现的频率。例如,如果一个单词在文档中出现了5次,而文档总共有1 阅读全文
posted @ 2024-01-24 15:04 黑逍逍 阅读(86) 评论(0) 推荐(0) 编辑
rosetta使用说明
摘要:1. 首页 2. 显示页面 3. 读取数据 选择ODBC 之后点击ok 4. 数据离散化 5. 约减 参考其他人写的: https://wenku.baidu.com/view/85efcf4dfe4733687e21aaf7?aggId=85efcf4dfe4733687e21aaf7&fr=ca 阅读全文
posted @ 2024-01-16 17:50 黑逍逍 阅读(32) 评论(0) 推荐(0) 编辑
rosetta
摘要:这个软件安装的费劲啊,rosetta重名的太多,各种软件。 还下载了rosetta commons 搞蛋白质的软件。 还有就是国内的搜索真的恶心,各种csdn,经管之家。。。。收费的。最后用google找到的资源下载。 我就想找一下正版的软件下载 一开始花钱下载了,打开之后,让我一度怀疑下载错了,不 阅读全文
posted @ 2024-01-16 17:31 黑逍逍 阅读(35) 评论(0) 推荐(0) 编辑




点击右上角即可分享
微信分享提示