大三打卡（10.8）

实验二：逻辑回归算法实现与测试

一、实验目的

深入理解对数几率回归（即逻辑回归的）的算法原理，能够使用 Python 语言实现对数几率回归的训练与测试，并且使用五折交叉验证算法进行模型训练与评估。

二、实验内容

（1）从 scikit-learn 库中加载 iris 数据集，使用留出法留出 1/3 的样本作为测试集（注意同分布取样）；（2）使用训练集训练对数几率回归（逻辑回归）分类算法；（3）使用五折交叉验证对模型性能（准确度、精度、召回率和 F1 值）进行评估和选择；（4）使用测试集，测试模型的性能，对测试结果进行分析，完成实验报告中实验二的部分。

三、算法步骤、代码、及结果

1. 算法伪代码

BEGIN

# 1. 加载数据集

X, y = load_data()

# 2. 划分训练集和测试集

X_train, X_test, y_train, y_test = split_data(X, y)

# 3. 训练模型

model = train_model(X_train, y_train)

# 4. 评估模型性能

cv_results = evaluate_model(X_train, y_train) # 用训练集进行交叉验证

PRINT "五折交叉验证结果:", cv_results

# 5. 测试模型性能

test_model(model, X_test, y_test) # 用测试集进行测试

END

2. 算法主要代码

完整源代码\调用库方法（函数参数说明）

# 导入必要的库
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split, cross_val_score, cross_validate
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import accuracy_score, precision_score, recall_score, f1_score
import numpy as np

# （1）从 scikit-learn 库中加载 iris 数据集，并留出 1/3 的样本作为测试集
iris = load_iris()
X = iris.data
y = iris.target

# 留出法留出 1/3 的样本作为测试集
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=1/3, random_state=42, stratify=y)

# （2）使用训练集训练对数几率回归（逻辑回归）分类算法
logistic = LogisticRegression(max_iter=200)
logistic.fit(X_train, y_train)

# （3）使用五折交叉验证对模型性能进行评估和选择
scores = cross_validate(logistic, X_train, y_train, cv=5,
scoring=('accuracy', 'precision_macro', 'recall_macro', 'f1_macro'))

# 打印交叉验证结果
print("交叉验证结果：")
print("准确度: ", np.mean(scores['test_accuracy']))
print("精度: ", np.mean(scores['test_precision_macro']))
print("召回率: ", np.mean(scores['test_recall_macro']))
print("F1 值: ", np.mean(scores['test_f1_macro']))

# （4）使用测试集，测试模型的性能
y_pred = logistic.predict(X_test)

# 计算测试集的性能指标
accuracy = accuracy_score(y_test, y_pred)
precision = precision_score(y_test, y_pred, average='macro')
recall = recall_score(y_test, y_pred, average='macro')
f1 = f1_score(y_test, y_pred, average='macro')

# 打印测试集的性能指标
print("测试集性能指标：")
print("准确度: ", accuracy)
print("精度: ", precision)
print("召回率: ", recall)
print("F1 值: ", f1)