基于支持向量机SVM和MLP多层感知神经网络的数据预测matlab仿真

1.算法运行效果图预览

2.算法运行软件版本

matlab2022a

3.算法理论概述

支持向量机（SVM）和多层感知器（MLP）是两种常用的机器学习算法，它们在数据预测和分类任务中都有广泛的应用。下面将详细介绍这两种算法的原理和数学公式。

一、支持向量机（SVM）

支持向量机是一种二分类算法，其基本思想是在特征空间中找到一个最优超平面，使得该超平面能够将不同类别的数据点尽可能地分开。具体来说，对于一个二分类问题，假设数据集包含n个样本{(x1, y1), (x2, y2), ..., (xn, yn)}，其中xi是输入特征向量，yi是对应的类别标签（+1或-1）。SVM的目标是找到一个最优超平面wx+b=0，使得该超平面能够将不同类别的数据点尽可能地分开，同时使得超平面两侧的空白区域（即“间隔”）最大化。

在数学上，SVM的优化问题可以表示为以下形式：

min 1/2 ||w||^2 + C ∑ ξ_i

s.t. y_i (w^T x_i + b) ≥ 1 - ξ_i, i=1,2,...,n

ξ_i ≥ 0, i=1,2,...,n

其中，w是超平面的法向量，b是超平面的截距，C是一个惩罚参数，用于控制误分类的惩罚力度，ξ_i是第i个样本的松弛变量，用于容忍一些不可分的样本。该优化问题的目标是最小化超平面的法向量长度（即||w||^2）和误分类的惩罚项（即C ∑ ξ_i）。

对于非线性可分的情况，可以通过核函数将输入特征映射到高维空间，使得在高维空间中数据变得线性可分。此时，优化问题中的内积运算需要用核函数来替代。常见的核函数包括线性核、多项式核和高斯核等。

二、多层感知器（MLP）

多层感知器是一种前向传播的神经网络，其基本结构包括输入层、隐藏层和输出层。在数据预测任务中，MLP通过学习输入数据和输出数据之间的非线性映射关系，来对新的输入数据进行预测。具体来说，对于一个回归问题，假设数据集包含n个样本{(x1, y1), (x2, y2), ..., (xn, yn)}，其中xi是输入特征向量，yi是对应的输出值。MLP的目标是找到一个最优的网络参数θ，使得对于任意一个新的输入x，都能够输出一个尽可能接近真实值y的预测值。

在数学上，MLP的预测过程可以表示为以下形式：

y_pred = f(x; θ)

其中，f(·)表示MLP的网络结构，θ表示网络参数。通常，MLP的网络结构包括多个隐藏层和非线性激活函数，如ReLU、sigmoid或tanh等。网络参数的优化通常采用梯度下降算法及其变种，如批量梯度下降、随机梯度下降和小批量梯度下降等。在训练过程中，通过反向传播算法计算损失函数对网络参数的梯度，并根据梯度更新网络参数，以最小化预测误差。常见的损失函数包括均方误差损失、交叉熵损失等。

需要注意的是，MLP的训练过程容易陷入局部最优解和过拟合等问题。为了避免这些问题，可以采用一些正则化技术，如L1正则化、L2正则化和dropout等。此外，还可以采用一些集成学习技术，如bagging和boosting等，以提高模型的泛化能力和鲁棒性。

4.部分核心程序

%SVM
% 以下是关于SVM模型的设置。  
% 并行计算设置，使用多核CPU进行计算。  
svm_opt      = statset('UseParallel',true);
 
tic% 开始计时，计算模型训练时间。  
% 使用fitcsvm函数训练SVM模型，其中标准化设为真，核函数、多项式阶数、盒子约束等参数进行设置。结果为最优的SVM模型svm_optimal。  
svm_models   = fitcsvm(xTrain,yTrain, 'Standardize', true,...
                                     'KernelFunction',"polynomial",...% "polynomial"核函数是一个多项式核函数，它对应于无穷维特征空间中的点积。  
                                     'PolynomialOrder' ,2,...% "2"定义了多项式的阶数
                                     'BoxConstraint',0.8);%"0.8"定义了约束条件。  
% 计算并存储SVM模型训练时间。
Time_svm     = toc;  
% 对测试集进行预测和评价。  
yr_svm       = predict(svm_models, xTest);
 
........................................................................
%MLP
% 以下是关于多层感知器（MLP）模型的设置。  
% MLP的超参数
mlp_models.divideFcn = 'dividerand';  %将数据随机划分  
mlp_models.divideMode = 'sample';     %对每个样本进行划分  
mlp_models.divideParam.trainRatio = 0.85;% 训练集占85%  
mlp_models.divideParam.valRatio   = 0.15;% 验证集占15%  
% 创建一个有35个隐藏层节点的模式识别神经网络，训练函数为'trainrp'（反向传播） 
mlp_models = patternnet(35, 'trainrp'); 
mlp_models.trainParam.lr = 0.004;% 设置学习率为0.004 
mlp_models.trainParam.mc = 0.35;% 设置动量系数为0.35  
% 设置第一层的传递函数为'transig'（Sigmoid函数）  
mlp_models.trainParam.epochs=300;% 设置训练次数为300次  
tic% 开始计时，计算模型训练时间。
 % 使用训练数据进行训练，结果存储在net中，同时返回训练记录tr，预测输出y和误差e。  
..........................................................................
figure
plot(xSVM,ySVM,'r')
hold on
plot(xMLP,yMLP,'b')
legend('SVM','MLP')
xlabel('FP'); 
ylabel('TP');
title('ROC曲线')
grid on
 
 
figure
bar([aucSVM,aucMLP]);
xlabel('模型类型');
ylabel('R auc');
xticklabels({'SVM','MLP'});
ylim([0.75,1]);

posted @ 2023-12-09 21:47 简简单单做算法阅读(724) 评论(0) 收藏举报

刷新页面返回顶部

matlabworld，程序链接：https://mbd.pub/o/easy16333/work

公众号 matlabworld。从事人工智能，机器学习，机器视觉，图像处理，信号通信等工作，熟悉MATLAB/verilog/python/opencv/tensorflow/caffe/C/C++等编程语言

基于支持向量机SVM和MLP多层感知神经网络的数据预测matlab仿真

公告