目的：
- 选出最为合适的模型超参数的取值，然后将超参数的值作用到模型的创建中
思想：
- 将样本的训练数据交叉的拆分出不同的训练集和验证集，使用交叉拆分出不同的训练集和验证集分别实验模型的精准度，然后就求出的精准度的均值就是此次交叉验证的结果，将交叉验证作用到不同的超参数中，选取出精准度最高的超参数作为模型创建的超参数即可
实现思路：
- 将数据集平均分隔成K个等分
- 使用一份数据作为测试数据，其余作为训练数据
- 计算测试准确率
- 使用不同的测试集，重复2，3步骤
- 对准确率做平均，作为对未知数据预测准确率的估计

API:from sklearn.model_selection import cross_val_score
cross_val_score(exstimator, X, y, cv):
- estimator:模型对象
- X， y：训练集数据
- cv：折数

from sklearn.model_selection import cross_val_score
import numpy as np
from sklearn.neighbors import KNeighborsClassifier
import sklearn.datasets as datasets
from sklearn.model_selection import train_test_split
import matplotlib.pyplot as plt


# 提取样本数据
iris = datasets.load_iris()
feature = iris['data']
target = iris['target']

# 拆分
x_train, x_test, y_train, y_test = train_test_split(feature, target, test_size=0.2, random_state=2020)

# 对训练集进行交叉验证
knn = KNeighborsClassifier(n_neighbors=5)
cross = cross_val_score(knn, x_train, y_train, cv=5).mean()
print(cross)
scores = []
ks = []
for i in range(3, 20):
    knn = KNeighborsClassifier(n_neighbors=i)
    score = cross_val_score(knn, x_train, y_train, cv=6).mean()
    scores.append(score)
    ks.append(i)

plt.plot(ks, scores)
plt.show()

0.9916666666666668

Process finished with exit code 0

posted on 2022-07-26 21:11 xxdd123321 阅读(126) 评论(0) 收藏举报

刷新页面返回顶部

导航

K折交叉验证