基于支持向量机SVM和MLP多层感知神经网络的数据预测matlab仿真

1.算法运行效果图预览

 

 

 

2.算法运行软件版本

matlab2022a

 

3.算法理论概述

       支持向量机(SVM)和多层感知器(MLP)是两种常用的机器学习算法,它们在数据预测和分类任务中都有广泛的应用。下面将详细介绍这两种算法的原理和数学公式。

 

一、支持向量机(SVM)

      支持向量机是一种二分类算法,其基本思想是在特征空间中找到一个最优超平面,使得该超平面能够将不同类别的数据点尽可能地分开。具体来说,对于一个二分类问题,假设数据集包含n个样本{(x1, y1), (x2, y2), ..., (xn, yn)},其中xi是输入特征向量,yi是对应的类别标签(+1或-1)。SVM的目标是找到一个最优超平面wx+b=0,使得该超平面能够将不同类别的数据点尽可能地分开,同时使得超平面两侧的空白区域(即“间隔”)最大化。

 

在数学上,SVM的优化问题可以表示为以下形式:

 

min 1/2 ||w||^2 + C ∑ ξ_i

s.t. y_i (w^T x_i + b) ≥ 1 - ξ_i, i=1,2,...,n

ξ_i ≥ 0, i=1,2,...,n

 

       其中,w是超平面的法向量,b是超平面的截距,C是一个惩罚参数,用于控制误分类的惩罚力度,ξ_i是第i个样本的松弛变量,用于容忍一些不可分的样本。该优化问题的目标是最小化超平面的法向量长度(即||w||^2)和误分类的惩罚项(即C ∑ ξ_i)。

 

       对于非线性可分的情况,可以通过核函数将输入特征映射到高维空间,使得在高维空间中数据变得线性可分。此时,优化问题中的内积运算需要用核函数来替代。常见的核函数包括线性核、多项式核和高斯核等。

 

二、多层感知器(MLP)

       多层感知器是一种前向传播的神经网络,其基本结构包括输入层、隐藏层和输出层。在数据预测任务中,MLP通过学习输入数据和输出数据之间的非线性映射关系,来对新的输入数据进行预测。具体来说,对于一个回归问题,假设数据集包含n个样本{(x1, y1), (x2, y2), ..., (xn, yn)},其中xi是输入特征向量,yi是对应的输出值。MLP的目标是找到一个最优的网络参数θ,使得对于任意一个新的输入x,都能够输出一个尽可能接近真实值y的预测值。

 

在数学上,MLP的预测过程可以表示为以下形式:

 

y_pred = f(x; θ)

 

        其中,f(·)表示MLP的网络结构,θ表示网络参数。通常,MLP的网络结构包括多个隐藏层和非线性激活函数,如ReLU、sigmoid或tanh等。网络参数的优化通常采用梯度下降算法及其变种,如批量梯度下降、随机梯度下降和小批量梯度下降等。在训练过程中,通过反向传播算法计算损失函数对网络参数的梯度,并根据梯度更新网络参数,以最小化预测误差。常见的损失函数包括均方误差损失、交叉熵损失等。

 

        需要注意的是,MLP的训练过程容易陷入局部最优解和过拟合等问题。为了避免这些问题,可以采用一些正则化技术,如L1正则化、L2正则化和dropout等。此外,还可以采用一些集成学习技术,如bagging和boosting等,以提高模型的泛化能力和鲁棒性。

 

 

 

 

4.部分核心程序

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
%SVM
% 以下是关于SVM模型的设置。 
% 并行计算设置,使用多核CPU进行计算。 
svm_opt      = statset('UseParallel',true);
  
tic% 开始计时,计算模型训练时间。 
% 使用fitcsvm函数训练SVM模型,其中标准化设为真,核函数、多项式阶数、盒子约束等参数进行设置。结果为最优的SVM模型svm_optimal。 
svm_models   = fitcsvm(xTrain,yTrain, 'Standardize', true,...
                                     'KernelFunction',"polynomial",...% "polynomial"核函数是一个多项式核函数,它对应于无穷维特征空间中的点积。 
                                     'PolynomialOrder' ,2,...% "2"定义了多项式的阶数
                                     'BoxConstraint',0.8);%"0.8"定义了约束条件。 
% 计算并存储SVM模型训练时间。
Time_svm     = toc
% 对测试集进行预测和评价。 
yr_svm       = predict(svm_models, xTest);
  
........................................................................
%MLP
% 以下是关于多层感知器(MLP)模型的设置。 
% MLP的超参数
mlp_models.divideFcn = 'dividerand'%将数据随机划分 
mlp_models.divideMode = 'sample';     %对每个样本进行划分 
mlp_models.divideParam.trainRatio = 0.85;% 训练集占85% 
mlp_models.divideParam.valRatio   = 0.15;% 验证集占15% 
% 创建一个有35个隐藏层节点的模式识别神经网络,训练函数为'trainrp'(反向传播)
mlp_models = patternnet(35, 'trainrp');
mlp_models.trainParam.lr = 0.004;% 设置学习率为0.004
mlp_models.trainParam.mc = 0.35;% 设置动量系数为0.35 
% 设置第一层的传递函数为'transig'(Sigmoid函数) 
mlp_models.trainParam.epochs=300;% 设置训练次数为300次 
tic% 开始计时,计算模型训练时间。
 % 使用训练数据进行训练,结果存储在net中,同时返回训练记录tr,预测输出y和误差e。 
..........................................................................
figure
plot(xSVM,ySVM,'r')
hold on
plot(xMLP,yMLP,'b')
legend('SVM','MLP')
xlabel('FP');
ylabel('TP');
title('ROC曲线')
grid on
  
  
figure
bar([aucSVM,aucMLP]);
xlabel('模型类型');
ylabel('R auc');
xticklabels({'SVM','MLP'});
ylim([0.75,1]);

  

posted @   简简单单做算法  阅读(449)  评论(0编辑  收藏  举报
(评论功能已被禁用)
相关博文:
阅读排行:
· 分享4款.NET开源、免费、实用的商城系统
· 全程不用写代码,我用AI程序员写了一个飞机大战
· MongoDB 8.0这个新功能碉堡了,比商业数据库还牛
· 白话解读 Dapr 1.15:你的「微服务管家」又秀新绝活了
· 记一次.NET内存居高不下排查解决与启示
点击右上角即可分享
微信分享提示