会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
Bean_zheng
博客园
首页
新随笔
联系
订阅
管理
2018年8月12日
特征抽取 — TF-IDF
摘要: 特征处理相关的算法,大体分为以下三类: 特征抽取:从原始数据中抽取特征 特征转换:特征的维度、特征的转化、特征的修改 特征选取:从大规模特征集中选取一个子集 #导入相关的库 from pyspark.ml.feature import HashingTF,IDF,Tokenizer from pys
阅读全文
posted @ 2018-08-12 11:07 Bean_zheng
阅读(271)
评论(0)
推荐(0)
编辑
公告