2024.11.11

# 导入所需的库
import pandas as pd
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score, KFold
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score, make_scorer

# 1. 利用 pandas 从本地读取 iris 数据集
try:
    local_iris_data = pd.read_csv('iris.csv')
    print("本地读取的 iris 数据集：")
    print(local_iris_data.head())
except FileNotFoundError:
    print("无法找到本地的 iris 数据集文件，请确保文件名和路径正确。")

# 2. 从 scikit-learn 直接加载 iris 数据集
iris = load_iris()
X, y = iris.data, iris.target
print("\n从 scikit-learn 直接加载的 iris 数据集：")
print("特征数据（前5行）：\n", X[:5])
print("标签数据（前5行）：\n", y[:5])

# 3. 五折交叉验证进行模型训练
kf = KFold(n_splits=5, shuffle=True, random_state=42)
rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)

# 自定义评估指标的计算
scoring = {
    'accuracy': make_scorer(accuracy_score),
    'precision': make_scorer(precision_score, average='weighted'),
    'recall': make_scorer(recall_score, average='weighted'),
    'f1': make_scorer(f1_score, average='weighted')
}

# 使用交叉验证评估模型
cv_results = cross_val_score(rf_classifier, X, y, cv=kf, scoring='accuracy')
print("\n交叉验证的准确度结果：", cv_results)
print("平均准确度：", np.mean(cv_results))

# 计算并输出准确度、精度、召回率和 F1 值
from sklearn.model_selection import cross_validate

results = cross_validate(rf_classifier, X, y, cv=kf, scoring=scoring)
print("\n交叉验证的评估结果：")
print("准确度：", np.mean(results['test_accuracy']))
print("精度：", np.mean(results['test_precision']))
print("召回率：", np.mean(results['test_recall']))
print("F1 值：", np.mean(results['test_f1']))

posted @ 2024-12-26 00:56 我也不想的阅读(2) 评论(0) 编辑收藏举报

刷新页面返回顶部

（评论功能已被禁用）

相关博文：

· 2024.12.13

· 2024.12.12

· 2024.11.27（周三）

· 2024.11.28（周四）

· 2024.12.9（周一）

公告

昵称：我也不想的
园龄： 1年11个月
粉丝： 0
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

ztydebeishanglaojia

2024.11.11

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜