使用Dataset构建数据到lgb中

  训练数据要放到Dataset中供lgb使用,构建数据如下:

 1 import lightgbm as lgb
 2 import numpy as np
 3 
 4 # 训练数据,500个样本,10个维度
 5 train_data = np.random.rand(500, 10)
 6 # 构建二分类数据
 7 label = np.random.randint(2, size=500)
 8 # 放入到dataset中
 9 train = lgb.Dataset(train_data, label=label)
10 print(train)

  很清晰的构建数据方式,记住这种用法

  指定 feature names(特征名称)和 categorical features(分类特征):

1 train_data = lgb.Dataset(data, label=label, feature_name=['c1', 'c2', 'c3'], categorical_feature=['c3'])

  分类特征可以人为制定,使用categorical_feature选取你制定的名称

posted @ 2018-09-10 12:29  今夜无风  阅读(7294)  评论(0编辑  收藏  举报