机器学习使用sklearn进行模型训练、预测和评价

cross_val_score(model_name, x_samples, y_labels, cv=k)

作用:验证某个模型在某个训练集上的稳定性,输出k个预测精度。

K折交叉验证(k-fold)

把初始训练样本分成k份,其中(k-1)份被用作训练集,剩下一份被用作评估集,这样一共可以对分类器做k次训练,并且得到k个训练结果。

1 from sklearn.model_selection import cross_val_score
2 clf = sklearn.linear_model.LogisticRegression()
3 # X:features  y:targets  cv:k
4 cross_val_score(clf, X, y, cv=5)

 

模型的训练、预测和评价

复制代码
 1 def svm_model():
 2     from sklearn.metrics import accuracy_score
 3     from sklearn.metrics import precision_score, recall_score, f1_score
 4     from sklearn.svm import SVC
 5     # 模型训练
 6     clf = SVC(kernel='linear')
 7     clf.fit(x_train_samples, y_train_labels)
 8     # 模型存储
 9     joblib.dump(clf, './model/svm_mode.pkl')
10     # 模型评估
11     predict_labels = clf.predict(x_test_samples)
12     Accuracy = accuracy_score(y_test_labels, predict_labels)
13     Precision = precision_score(y_test_labels, predict_labels, pos_label=0)
14     Recall = recall_score(y_test_labels, predict_labels, pos_label=0)
15     F1_scores = f1_score(y_test_labels, predict_labels, pos_label=0)
复制代码

 

整个过程结束。需要说明的是调用K折交叉验证,结果输出的是准确率,其它的指标不会输出。所以,建议还是前期,使用train_test_split()函数划分训练集和验证集,后期根据实际需求评估模型

posted @   今夜无风  阅读(7628)  评论(0编辑  收藏  举报
编辑推荐:
· 记一次.NET内存居高不下排查解决与启示
· 探究高空视频全景AR技术的实现原理
· 理解Rust引用及其生命周期标识(上)
· 浏览器原生「磁吸」效果!Anchor Positioning 锚点定位神器解析
· 没有源码,如何修改代码逻辑?
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 上周热点回顾(2.24-3.2)
点击右上角即可分享
微信分享提示