机器学习之特征提取(二)——字典类型特征提取(特征离散化)

字典类型和CountVectorizer文本类型的特征基本相同,不同的是输出的结果类型,字典直接返回的键值对。

以下代码用jupyter分块运行

运行结果含义参考上一篇:https://www.cnblogs.com/future-panda/p/16809957.html

 1 from sklearn.feature_extraction import DictVectorizer
 2 
 3 dic_data = [
 4     {'星期一': '面条', '味道':100},
 5     {'星期二': '包子', '味道':99},
 6     {'星期三': '牛奶', '味道':101},
 7 ]
 8 
 9 dic_transfer = DictVectorizer(sparse=False)
10 new_dic_data = dic_transfer.fit_transform(dic_data)
11 
12 new_dic_data
13 dic_transfer.get_feature_names_out()

 

posted @ 2022-10-20 15:43  许个未来—  阅读(49)  评论(0编辑  收藏  举报