摘要: 特征处理相关的算法,大体分为以下三类: 特征抽取:从原始数据中抽取特征 特征转换:特征的维度、特征的转化、特征的修改 特征选取:从大规模特征集中选取一个子集 #导入相关的库 from pyspark.ml.feature import HashingTF,IDF,Tokenizer from pys 阅读全文
posted @ 2018-08-12 11:07 Bean_zheng 阅读(271) 评论(0) 推荐(0) 编辑