机器学习之特征提取（二）——字典类型特征提取（特征离散化）

字典类型和CountVectorizer文本类型的特征基本相同，不同的是输出的结果类型，字典直接返回的键值对。

以下代码用jupyter分块运行

运行结果含义参考上一篇：https://www.cnblogs.com/future-panda/p/16809957.html

 1 from sklearn.feature_extraction import DictVectorizer
 2 
 3 dic_data = [
 4     {'星期一': '面条', '味道':100},
 5     {'星期二': '包子', '味道':99},
 6     {'星期三': '牛奶', '味道':101},
 7 ]
 8 
 9 dic_transfer = DictVectorizer(sparse=False)
10 new_dic_data = dic_transfer.fit_transform(dic_data)
11 
12 new_dic_data
13 dic_transfer.get_feature_names_out()

posted @ 2022-10-20 15:43 许个未来— 阅读(97) 评论(0) 收藏举报

刷新页面返回顶部

梦想不断实现，生活持续变好。

机器学习之特征提取（二）——字典类型特征提取（特征离散化）

公告