sklearn学习--超参的搜索

我们上面已经初步得出模型，并且效果看起来还不错，所以我们现在应该下想办法进一步优化这一个模型了。

我们在调参的时候需要将数据集分为三部分，分别是：训练集、验证集以及测试集。训练集用于模型的训练，然后我们根据验证集的结果去调整出泛化能力较强的模型，最后通过测试集得出模型的泛化能力。如果只把数据分为训练集和测试集，也许你能调出对于测试集最合适的参数，但模型的泛化能力也许并没有在测试集上表现的那么强。

由于鸢尾属植物的数据集并不大，如果将数据分为三部分的话，训练数据就太少了，可能提高不了模型的性能。在此只是简单的介绍sklearn中的调参方法。

model_seletion里面还提供自动调参的函数，以格搜索（GridSearchCV）为例。

from sklearn.model_selection import GridSearchCV
clf = LogisticRegression()
gs = GridSearchCV(clf, parameters)
gs.fit(data, label)
gs.best_params_

通过传入字典，对比使用不同的参数的估计器的效果，得出最优的参数。这里是对逻辑回归的精度进行调整。另外我们还可以使用不同的指标来选择参数，不同的指标在sklearn.metrics中

转自https://zhuanlan.zhihu.com/p/33420189

posted @ 2021-04-10 12:50 黄某人233 阅读(73) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

阅读排行：
· winform 绘制太阳，地球，月球运作规律
· AI与.NET技术实操系列（五）：向量存储与相似性搜索在 .NET 中的实现
· 超详细：普通电脑也行Windows部署deepseek R1训练数据并当服务器共享给他人
· 上周热点回顾（3.3-3.9）
· AI 智能体引爆开源社区「GitHub 热点速览」

公告

昵称：黄某人233
园龄： 4年8个月
粉丝： 4
关注： 7

+加关注

2025年3月

日

一

二

三

四

五

六

sklearn学习--超参的搜索

公告

搜索

常用链接

随笔档案

阅读排行榜

推荐排行榜