逻辑斯谛回归(Logistic Regression)算法及Python实现

逻辑回归(Logistic Regression)，又称为 logistic 回归分析，是一种广义的线性回归模型，通常用于解决分类问题。虽然名字里有“回归”，但实际上它属于机器学习中的监督学习方法。逻辑回归最初用于解决二分类问题，它也可以通过一些技巧扩展到多分类问题。在实际应用中，我们通常使用给定的训练数据集来训练模型，并在训练结束后利用测试集来评估模型的性能，以确保模型的泛化能力和预测准确性。逻辑回归因其简单、高效且易于解释的特点，在实际应用中得到了广泛的应用，特别是在医学、金融和市场营销等领域。

一、逻辑回归基础

考虑如下线性函数：

\begin{matrix} (1) & y = w^{T} x + b \end{matrix}

$y = \mathbf{w}^\mathbf{T} \mathbf{x} + b \tag{1}$

输出 $y$ 为连续的实值，如何让输出成为二值来完成二分类任务？即 $y \in {0, 1}$ ，最理想的是单位阶跃函数即：

\begin{matrix} (2) & y = {\begin{cases} 0, & if z < 0 \\ 0.5, & if z = 0 \\ 1, & if z > 0 \end{cases} \end{matrix}

$y = \begin{cases} 0, & \text{if } z < 0 \\ 0.5, & \text{if } z = 0 \\ 1, & \text{if } z > 0 \end{cases} \tag{2}$

但是，单位阶跃函数不连续，不利于求解权值，构建模型。于是引入sigmoid函数（对数几率函数，logistic function），它单调可微，并且形似阶跃函数，其公式描述如下所示：

\begin{matrix} (3) & y = \frac{1}{1 + e^{- (w^{T} x + b)}} \end{matrix}

$y = \frac{1}{1 + e^{-(\mathbf{w}^\mathbf{T} \mathbf{x} + b)}} \tag{3}$

对数线性回归	阶跃函数和对数几率

令 $y$ 表示当输入为 $x$ 时，输出为正例的概率（可能性），即 $y = P(Y=1|X=x)$ ； $1 - y$ 表示当输入为 $x$ 时，输出为反例的概率（可能性），即 $1 - y = P(Y=0|X=x)$ 。两者的比值 $\frac{y}{1-y}$ 称为几率（odds），对其取对数即达到对数几率，所以logistic回归又称为对数几率回归。因此根据（2）可得对数几率回归（logistic回归）公式如下所示：

$\log \frac{y}{1-y} = \mathbf{w}^\mathbf{T} \mathbf{x} + b \tag{4}$

由式（3）可得二项逻辑斯蒂回归模型如下所示：

$\log \frac{P(Y=1|X=x)}{1-P(Y=1|X=x)} = \mathbf{w}^\mathbf{T} \mathbf{x} \tag{5}$

其中， $\mathbf{w} = (w_1, w_2, ..., w_m,b)^\mathbf{T}，\mathbf{x} = (x_1, x_2, ..., x_m, 1)$ 学习模型的关键是对权值 $\mathbf{w}$ 的学习，已知的是训练样本即输入及其对应的标签，利用已知输入样本来如何学习权值？该学习过程可以转化为带约束的最优化问题，或者以极大似然函数为目标函数（策略）并使用梯度上升或者牛顿法等最优化算法。
极大似然函数的假设：训练样本出现的概率最大。换句话所就是，有些事情具有多种可能，而其中一种可能值出现，其他可能值未出现，在这个过程中，出现的可能值具有较大概率，所以才会出现。
一种学习方法的假设很重要，合理、科学的假设代表了学习方法的正确方向，在该假设条件下，得出的模型往往能够达到预期效果。设训练样本，其中 $\mathbf{X} = {\mathbf{x}_j }，\mathbf{x}_j \in \mathbb{R}^n ，\mathbf{y} \in \mathbb{R}^n ，y_i \in {0, 1} ，i = 1, 2, ..., n ，j = 1, 2, ..., m$ ，则逻辑斯蒂回归输出 $\hat{y} = \frac{1}{1+e^{-(\mathbf{w}^\mathbf{T} \mathbf{x})}} \in (0,1)$ 为区间在0和1的连续实值（表示概率）。则 样本的似然函数为：

\begin{matrix} (6) & L (w) = \prod_{i = 1}^{n} {\hat{y}}_{i}^{y_{i}} (1 - {\hat{y}}_{i})^{(1 - y_{i})} \end{matrix}

$L(\mathbf{w})=\prod_{i=1}^{n}\hat{y}_i^{y_i}(1-\hat{y}_i)^{(1-y_i)} \tag{6}$

对数似然函数为：

\begin{matrix} (7) & L (w) = \sum_{i = 1}^{n} (y_{i} \log {\hat{y}}_{i} + (1 - y_{i}) \log (1 - \hat{y_{i}})) = \sum_{i = 1}^{n} (y_{i} \log \frac{{\hat{y}}_{i}}{(1 - \hat{y_{i}})} + \log (1 - \hat{y_{i}})) = \sum_{i = 1}^{n} (y_{i} w^{T} x_{i} - \log (1 + e^{(w^{T} x_{i})})) \end{matrix}

$L(\mathbf{w})=\sum_{i=1}^{n}(y_i\log\hat{y}_i+(1-y_i)\log(1-\hat{y_i})) \\\\ \quad =\sum_{i=1}^{n}(y_i\log\frac{\hat{y}_i}{(1-\hat{y_i})}+\log(1-\hat{y_i})) \\\\ \qquad =\sum_{i=1}^{n}(y_i\mathbf{w}^\mathbf{T}\mathbf{x}_i-\log(1+e^{(\mathbf{w}^\mathbf{T}\mathbf{x}_i)}))\tag{7}$

则逻辑斯蒂回归模型学习可转化为如下最优化问题：

$\max_{\mathbf{w}}L(\mathbf{w}) \quad \tag{8}$

采用梯度上升算法来求解函数的最大值（梯度下降求解函数的最小值）：对式（7）对权值求偏导得如下公式：

\begin{matrix} (9) & \nabla_w = [\begin{matrix} \nabla_{w_{1}} \\ \nabla_{w_{2}} \\ ⋮ \\ \nabla_{w_{m}} \end{matrix}] = \frac{\partial L (w)}{\partial w} = \sum_{i = 1}^{n} (y_{i} x_{i} - \frac{1}{1 + e^{(w^{T} x_{i})}} e^{(w^{T} x_i)} x_{i}) = \sum_{i = 1}^{n} (y_{i} - \frac{1}{1 + e^{- (w^{T} x_{i})}}) x_{i} = \sum_{i = 1}^{n} (y_{i} - {\hat{y}}_{i}) x_{i} = X^{T} (y - \hat{y}) \end{matrix}

$\nabla\_{\mathbf{w}}=\left[ \begin{matrix} \nabla_{w_1}\\\\ \nabla_{w_2}\\\\ \vdots\\\\ \nabla_{w_m} \end{matrix} \right] =\frac{\partial L(\mathbf{w})}{\partial \mathbf{w}} =\sum_{i=1}^{n}(y_i\mathbf{x}_i-\frac{1}{1+e^{(\mathbf{w}^\mathbf{T}\mathbf{x}_i)}}e^{(\mathbf{w}^\mathbf{T}\mathbf{x}\_i)}\mathbf{x}_i) \\\\ =\sum_{i=1}^{n}(y_i-\frac{1}{1+e^{-(\mathbf{w}^\mathbf{T}\mathbf{x}_i)}})\mathbf{x}_i=\sum_{i=1}^{n}(y_i-\hat{y}_i)\mathbf{x}_i \\\\ =\mathbf{X}^\mathbf{T}(\mathbf{y}-\hat{\mathbf{y}}) \tag{9}$

在此需注意到： $\mathbf{y}-\hat{\mathbf{y}}$ 为误差向量。梯度上升算法的迭代公式如下所示：

\begin{matrix} (10) & w := w + α \nabla_{w} \end{matrix}

$\mathbf{w}:= \mathbf{w}+\alpha \nabla_{\mathbf{w}} \tag{10}$

其中， $\alpha$ 为步长因子，需人为给定， $\mathbf{w}$ 的初始值一般设置为 $[-0.01,0.01]$ 之间。梯度下降算法为：

w := w - α \nabla_{w}

$\mathbf{w}:= \mathbf{w}-\alpha \nabla_{\mathbf{w}}$

二、逻辑回归理论推导

2.1 二项逻辑斯谛回归

二项逻辑斯谛回归模型定义了如下的条件概率分布：

\begin{matrix} (11) & P (Y = 1 | x) = \frac{\exp (w \cdot x + b)}{1 + \exp (w \cdot x + b)} \end{matrix}

$P(Y=1|x) = \frac{\exp(w \cdot x + b)}{1 + \exp(w \cdot x + b)} \tag{11}$

\begin{matrix} (12) & P (Y = 0 | x) = \frac{1}{1 + \exp (w \cdot x + b)} \end{matrix}

$P(Y=0|x) = \frac{1}{1 + \exp(w \cdot x + b)} \tag{12}$

其中 $x \in \mathbb{R}^n$ 是输入， $Y \in \{0,1\}$ 是输出， $w\in \mathbb{R}^n$ 是权重向量参数，是偏置项，表示 $w$ 和 $x$ 的内积。

通过将权重向量和输入向量扩充，记作 $w$ 和 $x$ ，即：

w = {(w^{(1)}, w^{(2)}, . . ., w^{(n)}, b)}^{T}

$w = \left( w^{(1)}, w^{(2)}, ..., w^{(n)}, b \right)^T$

x = (x^{(1)}, x^{(2)}, . . ., x^{(n)}, 1)

$x = \left( x^{(1)}, x^{(2)}, ..., x^{(n)} ,1\right)$

二项逻辑斯谛回归模型可以转换为：

\begin{matrix} (13) & P (Y = 1 | x) = \frac{\exp (w \cdot x)}{1 + \exp (w \cdot x)} \end{matrix}

$P(Y=1|x) = \frac{\exp(w \cdot x)}{1 + \exp(w \cdot x)} \tag{13}$

\begin{matrix} (14) & P (Y = 0 | x) = \frac{1}{1 + \exp (w \cdot x)} \end{matrix}

$P(Y=0|x) = \frac{1}{1 + \exp(w \cdot x)} \tag{14}$

2.2 多项逻辑斯谛回归

二项逻辑斯谛回归通常用于二分类问题。它可以扩展为多项逻辑斯谛回归模型，用于多分类任务。
假设离散型随机变量 $Y$ 的取值集合为 ${1, 2, ..., K}$ ，则多项逻辑斯谛回归模型为：

\begin{matrix} (15) & P (Y = k | x) = \frac{\exp (w_{k} \cdot x)}{1 + \sum_{k = 1}^{K - 1} \exp (w_{k} \cdot x)} \end{matrix}

$P(Y=k|x) = \frac{\exp(w_k \cdot x)}{1 + \sum_{k=1}^{K-1} \exp(w_k \cdot x)} \tag{15}$

其中， $x \in \mathbb{R}^{n+1})，( w_k \in \mathbb{R}^{n+1}$ 。

2.3 优化求解

在机器学习中我们有损失函数的概念，其衡量的是模型预测错误的程度。如果取整个数据集上的平均对数似然损失，就可以得到:

J (w) = - \frac{1}{n} l n L (w)

$J(w)=-\frac{1}{n}lnL(w)$

即在逻辑回归模型中，最大化似然函数和最小化损失函数实际上是等价的。求解逻辑回归的方法有非常多，主要有梯度下降和牛顿法。优化的主要目标是找到一个方向，参数朝这个方向移动之后使得损失函数的值能够减小，这个方向往往由一阶偏导或者二阶偏导各种组合求得。逻辑回归的损失函数是：

J (w) = - \frac{1}{n} \sum_{i = 1}^{n} [y_{i} \ln p (x_{i}) + (1 - y_{i}) \ln (1 - p (x_{i}))]

$J(w) = -\frac{1}{n}\sum_{i=1}^{n}\left[y_i\ln p(x_i) + (1-y_i)\ln(1-p(x_i))\right]$

随机梯度下降

梯度下降通过 ( J(w) ) 对 ( w ) 的一阶导数来找下降方向，并且以迭代的方式更新参数，更新方式为：

g_{i} = \frac{\partial J (w)}{\partial w_{i}} = (p (x_{i}) - y_{i}) x_{i}

$g_i = \frac{\partial J(w)}{\partial w_i} = (p(x_i) - y_i)x_i$

w_{i}^{k + 1} = w_{i}^{k} - α g_{i}

$w^{k+1}_i = w^k_i - \alpha g_i$

其中 $k$ 为迭代次数。每次更新参数后，可以通过比较 $||J(w^{k+1}) - J(w^k)||$ 小于阈值或者到达最大迭代次数来停止迭代。

牛顿法

牛顿法的基本思路是在现有极小点估计值的附近对 $f(x)$ 做二阶泰勒展开，进而找到极小点的下一个估计值。假设 $w^k$ 为当前的极小值估计值，那么有：

φ (w) = J (w^{k}) + J^{'} (w^{k}) (w - w^{k}) + \frac{1}{2} J^{″} (w^{k}) (w - w^{k})^{2}

$\varphi(w) = J(w^k) + J'(w^k)(w - w^k) + \frac{1}{2}J''(w^k)(w - w^k)^2$

然后令 $\varphi^{'}(w) = 0$ ，得到

w^{k + 1} = w^{k} - \frac{J^{^{'}} (w^{k})}{J^{^{″}} (w^{k})}

$w^{k+1} = w^k - \frac{J^{'}(w^k)}{J^{''}(w^k)}$

因此有迭代更新式：

w^{k + 1} = w^{k} - H_{k}^{- 1} \cdot g_{k}

$w^{k+1} = w^k - H_{k}^{-1} \cdot g_k$

其中 $H_{k}^{-1}$ 为海森矩阵：

H_{m n} = \frac{\partial^{2} J (w)}{\partial w_{m} \partial w_{n}} = h_{w} (x^{(i)}) (1 - p_{w} (x^{(i)})) x_{m}^{(i)} x_{n}^{(i)}

$H_{mn} = \frac{\partial^2 J(w)}{\partial w_m \partial w_n} = h_w(x^{(i)})(1 - p_w(x^{(i)}))x^{(i)}_m x^{(i)}_n$

此外，这个方法需要目标函数是二阶连续可微的。

正则化

正则化是一个通用的算法和思想，用于避免过拟合现象。在经验风险最小化的基础上（也就是训练误差最小化），尽可能采用简单的模型，可以有效提高泛化预测精度。正则化一般会采用 $L_1$ 范式或者 $L_2$ 范式，其形式分别为：

Φ (w) = | | x | |_{1} 和 Φ (w) = | | x | |_{2}

$\Phi(w) = ||x||_1 \quad \text{和} \quad \Phi(w) = ||x||_2$

$L_1$ 正则化

LASSO 回归，相当于为模型添加了这样一个先验知识： $w$ 服从零均值拉普拉斯分布。拉普拉斯分布的概率密度函数为：

f (w | μ, b) = \frac{1}{2 b} \exp (- \frac{| w - μ |}{b})

$f(w|\mu, b) = \frac{1}{2b}\exp \left( -\frac{|w-\mu|}{b} \right)$

引入先验知识后，似然函数为：

L (w) = \prod_{i = 1}^{N} p (x_{i})^{y_{i}} (1 - p (x_{i}))^{1 - y_{i}} \prod_{j = 1}^{d} \frac{1}{2 b} \exp (- \frac{| w_{j} |}{b})

$L(w) = \prod_{i=1}^{N} p(x_i)^{y_i}(1-p(x_i))^{1-y_i} \prod_{j=1}^{d} \frac{1}{2b}\exp \left( -\frac{|w_j|}{b} \right)$

取对数后得到目标函数：

- \ln L (w) = - \sum_{i} [y_{i} \ln p (x_{i}) + (1 - y_{i}) \ln (1 - p (x_{i}))] + \frac{1}{2 b^{2}} \sum_{j} | w_{j} |

$-\ln L(w) = -\sum_{i}\left[y_i\ln p(x_i) + (1-y_i)\ln(1-p(x_i))\right] + \frac{1}{2b^2}\sum_{j}|w_j|$

这等价于原始损失函数后面加上了 $L_1$ 正则。

$L_2$ 正则化

Ridge 回归，相当于为模型添加了这样一个先验知识：( w ) 服从零均值正态分布。正态分布的概率密度函数为：

f (w | μ, σ) = \frac{1}{\sqrt{2 π} σ} \exp (- \frac{(w - μ)^{2}}{2 σ^{2}})

$f(w|\mu, \sigma) = \frac{1}{\sqrt{2\pi}\sigma}\exp \left( -\frac{(w-\mu)^2}{2\sigma^2} \right)$

引入先验知识后，似然函数为：

L (w) = \prod_{i = 1}^{N} p (x_{i})^{y_{i}} (1 - p (x_{i}))^{1 - y_{i}} \prod_{j = 1}^{d} \frac{1}{\sqrt{2 π} σ} \exp (- \frac{w_{j}^{2}}{2 σ^{2}}) = \prod_{i = 1}^{N} p (x_{i})^{y_{i}} (1 - p (x_{i}))^{1 - y_{i}} \frac{1}{\sqrt{2 π} σ} \exp (- \frac{w^{T} w}{2 σ^{2}})

$L(w) = \prod_{i=1}^{N} p(x_i)^{y_i}(1-p(x_i))^{1-y_i} \prod_{j=1}^{d} \frac{1}{\sqrt{2\pi}\sigma}\exp \left( -\frac{w_j^2}{2\sigma^2} \right) = \prod_{i=1}^{N} p(x_i)^{y_i}(1-p(x_i))^{1-y_i} \frac{1}{\sqrt{2\pi}\sigma}\exp \left( -\frac{w^Tw}{2\sigma^2} \right)$

取对数后得到目标函数：

- \ln L (w) = - \sum_{i} [y_{i} \ln p (x_{i}) + (1 - y_{i}) \ln (1 - p (x_{i}))] + \frac{1}{2 σ^{2}} w^{T} w

$-\ln L(w) = -\sum_{i}\left[y_i\ln p(x_i) + (1-y_i)\ln(1-p(x_i))\right] + \frac{1}{2\sigma^2}w^Tw$

这等价于原始的损失函数后面加上了 $L_2$ 正则。

流程图	逻辑回归思想

三、逻辑回归Python实现

3.1 案例1

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn import metrics
import seaborn as sn

candidates = {'gmat': [780,750,690,710,680,730,690,720,740,690,610,690,710,680,770,610,580,650,540,590,620,600,550,550,570,670,660,580,650,660,640,620,660,660,680,650,670,580,590,690],
              'gpa': [4,3.9,3.3,3.7,3.9,3.7,2.3,3.3,3.3,1.7,2.7,3.7,3.7,3.3,3.3,3,2.7,3.7,2.7,2.3,3.3,2,2.3,2.7,3,3.3,3.7,2.3,3.7,3.3,3,2.7,4,3.3,3.3,2.3,2.7,3.3,1.7,3.7],
              'work_experience': [3,4,3,5,4,6,1,4,5,1,3,5,6,4,3,1,4,6,2,3,2,1,4,1,2,6,4,2,6,5,1,2,4,6,5,1,2,1,4,5],
              'admitted': [1,1,1,1,1,1,0,1,1,0,0,1,1,1,1,0,0,1,0,0,0,0,0,0,0,1,1,0,1,1,0,0,1,1,1,0,0,0,0,1]
              }

df = pd.DataFrame(candidates,columns= ['gmat', 'gpa','work_experience','admitted'])
df[:10]

X = df[['gmat', 'gpa','work_experience']]
y = df['admitted']
#  75%的数据用来做训练集，25%的数据用作测试集
X_train,X_test,y_train,y_test = train_test_split(X,y,test_size=0.25,random_state=0)
#建模
logistic_regression= LogisticRegression()
#训练
logistic_regression.fit(X_train,y_train)
#预测
y_pred=logistic_regression.predict(X_test)

#绘制热力图
confusion_matrix = pd.crosstab(y_test, y_pred, rownames=['Actual'], colnames=['Predicted'])
sn.heatmap(confusion_matrix, annot=True)

print('精度: ',metrics.accuracy_score(y_test, y_pred))

3.2 案例2

[Dry_Bean_Dataset.csv数据下载地址链接]（https://www.kaggle.com/datasets/muratkokludataset/dry-bean-dataset）

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn import metrics
import seaborn as sn
import matplotlib.pyplot as plt

# Read the dataset
data = pd.read_csv('Dry_Bean_Dataset.csv')
df = pd.DataFrame(data)

# Drop rows with missing values
df.dropna(inplace=True)

# Plotting the scatter plot
color = []
for i in df['Class'][:len(df)]:
    if i == 'SEKER':
        color.append('red')
    else:
        color.append('blue')

plt.scatter(df['MajorAxisLength'][:len(df)], df['MinorAxisLength'][:len(df)], color=color)
plt.xlabel('MajorAxisLength')
plt.ylabel('MinorAxisLength')
plt.show()

# Assuming the target column is one of the existing columns, let's choose the last column as the target
target_column = df.columns[-1]  # Assuming the last column is the target column

X = df.drop(columns=[target_column])  #去掉空值数据，数据预处理
y = df[target_column]

# Splitting the data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=0)

# Creating the logistic regression model
logistic_regression = LogisticRegression()

# Training the model
logistic_regression.fit(X_train, y_train)

# Making predictions
y_pred = logistic_regression.predict(X_test)

# Creating a confusion matrix
confusion_matrix = pd.crosstab(y_test, y_pred, rownames=['Actual'], colnames=['Predicted'])

# Plotting the confusion matrix as a heatmap with values rounded to two decimal places
sn.heatmap(confusion_matrix, annot=True, fmt=".2f")
plt.show()

# Calculating and printing the accuracy
print('Accuracy: ', metrics.accuracy_score(y_test, y_pred))

分类展示	混淆矩阵

3.3 案例3

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_breast_cancer
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.metrics import confusion_matrix

# Load the breast cancer dataset
data = load_breast_cancer()
X, y = data.data, data.target

# Standardize features
scaler = StandardScaler()
X = scaler.fit_transform(X)

# Split data into training and testing sets
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Build and train the logistic regression model
logistic_regression = LogisticRegression()
logistic_regression.fit(X_train, y_train)

# Predict
y_pred = logistic_regression.predict(X_test)

# Print accuracy
train_accuracy = logistic_regression.score(X_train, y_train) * 100
test_accuracy = logistic_regression.score(X_test, y_test) * 100
print("Training accuracy: {:.2f}%".format(train_accuracy))
print("Test accuracy: {:.2f}%".format(test_accuracy))

# Compute confusion matrix
conf_matrix = confusion_matrix(y_test, y_pred)
print("Confusion Matrix:")
print(conf_matrix)

# Visualize confusion matrix
sns.heatmap(conf_matrix, annot=True, cmap='Blues', fmt='d')
plt.title('Confusion Matrix')
plt.xlabel('Predicted Label')
plt.ylabel('True Label')
plt.show()

总结

逻辑斯特回归（Logistic Regression）是一种常用的分类算法，尤其适用于二分类问题。该算法基于线性回归模型，但通过对输出结果应用逻辑斯特函数（Sigmoid函数）来实现输出结果在0到1之间的概率值，进而进行分类决策。以下是逻辑斯特回归的主要特点和总结：

概率建模：逻辑斯特回归通过Sigmoid函数将线性组合的输入转换为0到1之间的概率值。这种概率模型使得逻辑斯特回归可以输出样本属于某个类别的概率，而不仅仅是简单的分类结果。
线性决策边界：逻辑斯特回归基于线性回归模型，因此其决策边界是一个线性函数。这意味着它假设数据是线性可分的，因此在非线性数据集上的表现可能不佳。
参数学习：逻辑斯特回归的参数学习通常使用最大似然估计法。通过最大化样本观测到的标签概率的乘积，可以得到模型参数的最优估计。
易于解释：逻辑斯特回归的结果是概率值，可以直观地解释为样本属于某个类别的可能性。此外，模型的系数（权重）也可以解释为不同特征对分类结果的影响程度。
适用性广泛：逻辑斯特回归适用于许多应用场景，包括医学诊断、金融风控、自然语言处理等。它的简单性和可解释性使得它成为了许多实际问题的首选算法之一。

参考资料

posted @ 2024-05-11 10:51 郝hai 阅读(1712) 评论(0) 编辑收藏举报

刷新页面返回顶部

登录后才能查看或发表评论，立即登录或者逛逛博客园首页

相关博文：

· 正则化技术的Lasso和Ridge回归——Python实现

· 一元线性回归分析—统计学（九）

· 逻辑回归原理及实现

· 逻辑回归算法实验

阅读排行：
· 【.NET】调用本地 Deepseek 模型
· CSnakes vs Python.NET：高效嵌入与灵活互通的跨语言方案对比
· DeepSeek “源神”启动！「GitHub 热点速览」
· 我与微信审核的“相爱相杀”看个人小程序副业
· Plotly.NET 一个为 .NET 打造的强大开源交互式图表库

历史上的今天：
2023-05-11 车辆路径问题——CVRP的Python实现

公告

昵称：郝hai
园龄： 2年10个月
粉丝： 92
关注： 0

+加关注

2025年2月

日

一

二

三

四

五

六

haohai9309

格物致知，知行合一！

逻辑斯谛回归(Logistic Regression)算法及Python实现

一、逻辑回归基础

二、逻辑回归理论推导

2.1 二项逻辑斯谛回归

2.2 多项逻辑斯谛回归

2.3 优化求解

三、逻辑回归Python实现

3.1 案例1

3.2 案例2

3.3 案例3

总结

参考资料

公告

搜索

常用链接

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论