层化(stratification)的方法

有时候我们会遇到调整后的模型反而不如调整前表现好的情况,这可能和数据的随机分割有关系。在这个不平衡的数据情况下,最好用层化(stratification)的方法,比如:

from sklearn.cross_validation import StratifiedShuffleSplit

...
ssscv = StratifiedShuffleSplit( y_train, n_iter=10, test_size=0.1)
grid = GridSearchCV(clf, parameters, cv = ssscv , scoring=f1_scorer)
grid.fit( X_train, y_train )
...

posted on 2017-01-30 08:49  Betty__2017  阅读(525)  评论(0编辑  收藏  举报

导航