数学建模方法-遗传算法(实战篇part 2)
一、引言
在上一个篇章中,我们用遗传算法来计算一个一元函数的最大值,但是,有人会讲,这样是不是有些大材小用了,明明我可以用更少的代码来实现求最大值的功能。确实,将遗传算法用在那里确实大材小用了,但是,博主的目的并不是为求最大值,而是为了给大家展示,遗传算法是一种可行的算法,并且博主编写的matlab代码是可行的。现在,我们就要利用上一篇写的代码作为基本代码,来解决本篇的问题。放心,本篇的问题可不是用普通的方法就能就解决的。遗传算法的春天终于来了。让我们开始吧。。
二、问题描述和建模
负载均衡调度问题:假设有N个任务,需要负载均衡器分配给M个服务器节点去处理。每个任务的任务长度、每台服务器节点(下面简称“节点”)的处理速度已知,请给出一种任务分配方式,使得所有任务的总处理时间最短。
好,那么现在题目有了,但是我们要想办法对题目进行数学建模。显然,我们需要2个矩阵,一个存放任务(含任务数量、任务长度),一个存放服务器节点(含节点数量、处理速度)。
(1)任务长度矩阵(简称:任务矩阵)
我们将所有任务的任务长度用矩阵tasks表示,其中tasks(i)中的i表示任务的编号,tasks(i)表示任务i的任务长度。比如
tasks = [2, 4, 6, 8]
表明,任务1的长度是2;任务2的长度是4,以此类推。
(2)节点处理速度矩阵(简称:节点矩阵)
我们将所有服务器节点的处理速度用nodes表示,其中nodes(i)中的i表示节点的编号,nodes(i)表示节点j的处理速度。比如
nodes = [2, 1]
表明,节点1的速度是2;节点2的速度是1,以此类推。
(3)任务处理时间矩阵
当任务矩阵task和节点矩阵nodes确定下来后,那么所有任务分配给所有节点的任务处理时间就可以确定了,我们用矩阵timeMat来存所有节点的任务处理时间,那么timeMat(i, j)表示任务i分配给节点j处理所需的时间,它通过以下公式计算:
timeMat(i, j) = task(i) / nodes(j);
有了上面三个矩阵后,我们就算是成功将题目用数学的方式描述出来了。
我们用matlab代码创建一个createData.m文件,用来对题目进行建模并且保存数据。如下:
%% I. 清空自变量 clear all clc %% II. 题目建模 % 参数定义 taskNum = 100; % 任务数量 taskLengthRange = [10, 100]; % 任务长度范围 nodeNum = 10; % 节点数量 nodeSpeedRange = [10, 100]; % 节点长度范围 tasks = initRandomMat(taskNum, taskLengthRange); % 构建任务矩阵(含任务数量和任务长度) nodes = initRandomMat(nodeNum, nodeSpeedRange); % 构建节点矩阵(含节点数量和节点处理速度) timeMat = zeros(taskNum, nodeNum); % 构建处理时间矩阵 for i = 1: taskNum for j = 1: nodeNum timeMat(i, j) = tasks(1, i) / nodes(1, j); end end %% III. 数据保存 save('data', 'tasks', 'nodes', 'timeMat');
其中initRandomMat()函数代码如下:
% [name] -- initRandomMat(初始化随机矩阵) % [function]-- % [input] -- length (数组的长度) % -- range (数组元素的取值范围range(1) to range(2)) % [output] -- randomMat function randomMat = initRandomMat(length, range) randomMat = zeros(1, length); for i = 1: length randomMat(1, i) = round(rand() * (range(2) - range(1)) + range(1)); end
三、遗传算法解决问题
还是老样子,我们先回顾下遗传算法的步骤,如下:
1. 种群初始化
2. 计算每个种群的适应度值
3. 选择(Selection)
4. 交叉(Crossover)
5. 变异(Mutation)
6. 重复2-5步直至达到进化次数
正如我们上一篇所说,为了让我们的代码有更好的包容性,我们需要先写几个函数包,到时再main.m里面引用,就很方便了。
(1)种群初始化函数popInit(),能根据提供的种群大小和染色体长度产生初始的种群。代码如下:
% [name] -- popInit(种群初始化函数) % [function]-- 构建种群矩阵,其中行数为种群个数,列数为染色体长度(即基因的个数),并随机分配染色体的样式 % [input] -- 1. popSize(种群大小/个数) % -- 2. cLength(染色体长度) % -- 3. range (染色体上基因的数值范围0 - range) % [output] -- popMat(种群矩阵) function popMat = popInit(popSize, cLength, range) popMat = zeros(popSize, cLength); % 预分配内存 for i = 1: popSize for j = 1: cLength popMat(i, j) = ceil(rand() * range); % rand产生(1,range)之间的随机数 end end clear i; clear j;
(2)计算每个种群的适应度值函数getfitnessValue()。代码如下:
% [name] -- getfitnessValue(计算种群个体适应度值) % [function]-- 根据不同的题目要求,设计适应度方程计算的算法 % -- 在实际的负载均衡调度中,各个节点的任务处理是并行计算的,所以,所有任务的完成时间应该是所有节点任务完成时间的最大值,并非所有任务完成时间的总和。 % [input] -- timeMat (时间处理矩阵) -- timeMat(i, j): 第i个任务分配到第j个节点,需要的处理时间 % -- popMat (种群矩阵) -- popMat(i, j): 第i个染色体上, 第j个任务分配到的节点标号 % -- nodeNumMax (节点的最大标号) % [output] -- fitValMat(每个染色体的适应度值) function fitnessValueMatrix = getfitnessValue(popMat, timeMat, nodeNumMax) [popSize, cLength] = size(popMat); % 获取种群的数目(行)和染色体长度(列) fitnessValueMatrix = zeros(popSize, 1); % 初始化适应度矩阵 % 最大的节点标号 for i = 1: popSize maxLength = eps; % 大于0的最小正数 for nodeIndex = 1: nodeNumMax sumLength = 0; % 清零 for j = 1: cLength if popMat(i, j) == nodeIndex sumLength = sumLength + timeMat(j, nodeIndex); end end if sumLength > maxLength maxLength = sumLength; end end fitnessValueMatrix(i) = maxLength; end clear i; clear j; clear nodeIndex;
(3)选择函数selection(),可以对种群进行选择,具体算法和代码如下:
% [name] -- selection(选择操作) % [function]-- 采用轮盘赌的一个形式来进行选择,增加不确定性,这样种群就不容易趋向局部最优 % [input] -- 1. fitnessValueMatrix (适应度值矩阵) % -- 2. popMat(未选择的种群矩阵) % -- 3. type -- 1: 保留亲代最优个体 % 0: 不保留亲代最优个体 % [output] -- updatedPopMat(经选择后的种群矩阵) function updatedPopMat = selection(fitnessValueMatrix, popMat, type) [popSize, cLength] = size(popMat); updatedPopMat = zeros(popSize, cLength); fitnessValueMatrix = 100 ./ fitnessValueMatrix; % 剔除适应值为负的种群,使其适应值为0 for i = 1: popSize if fitnessValueMatrix(i, 1) < 0 fitnessValueMatrix(i, 1) = 0; end end % 轮盘赌算法 P = fitnessValueMatrix / sum(fitnessValueMatrix); Pc = cumsum(P); for i = 1: popSize index = find(Pc >= rand); updatedPopMat(i, :) = popMat(index(1), :); end % 是否要保留亲本适应度值最高的,若是,则type = 1,否则为0 if type [~, bestIndex] = max(fitnessValueMatrix); updatedPopMat(popSize, :) = popMat(bestIndex, :); % 将亲代最优染色体放到子代的最后一个个体中 end clear i; clear j;
(4)交叉函数crossover(),可以对种群进行交叉,交叉的方式又分为单点交叉和多点交叉,根据输入不同的参数来选择不同的实现方式,具体算法和代码如下:
% [name] -- crossover(交叉操作) % [function]-- 选定交叉点并进行互换 % [input] -- 1. popMat (未交叉的种群矩阵) % -- 2. type -- 1: 单点交叉 % -- 2: 多点交叉 % -- 3. crossrate (交叉率) -- 建议值为0.6 % [output] -- updatedPopMat(经交叉后的种群矩阵) function updatedPopMat = crossover(popMat, type, crossrate) [popSize, cLength] = size(popMat); if type == 1 % 单点交叉 for i = 1: 2: popSize if crossrate >= rand crossPosition = round(rand() * (cLength - 2) + 2); % 随机获取交叉点,去除0和1 % 对 crossPosition及之后的二进制串进行交换 for j = crossPosition: cLength temp = popMat(i, j); popMat(i, j) = popMat(i + 1, j); popMat(i + 1, j) = temp; end end end updatedPopMat = popMat; elseif type == 2 % 多点交叉 for i = 1: 2: popSize if crossrate >= rand crossPosition1 = round(rand() * (cLength - 2) + 2); % 第一个交叉点 crossPosition2 = round(rand() * (cLength - 2) + 2); % 第二个交叉点 first = min(crossPosition1, crossPosition2); last = max(crossPosition1, crossPosition2); for j = first: last temp = popMat(i, j); popMat(i, j) = popMat(i + 1, j); popMat(i + 1, j) = temp; end end end updatedPopMat = popMat; else h = errordlg('type的类型只能为1(单点交叉)或者2(多点交叉)', '进行交叉时发生错误'); end clear i; clear j;
(5)变异函数mutation(),可以对种群进行变异,具体算法和代码如下:
% [name] -- mutation(变异操作) % [function]-- 单点变异:随机选择变异点,将其变为0或1 % [input] -- 1. popMat (未交叉的种群矩阵) % -- 2. mutateRate (交叉率) -- 建议值为0.1 % -- 3. randValur (变异后的随机数范围0-randValue) % [output] -- updatedPopMat(经交叉后的种群矩阵) function updatedPopMat = mutation(popMat, mutateRate, randValue) [popSize, cLength] = size(popMat); for i = 1: popSize if mutateRate >= rand mutatePosition = ceil(rand() * cLength); % 随机获取交叉点,去除0 % 对mutatePosition点进行变异 popMat(i, mutatePosition) = ceil(rand() * randValue); end end updatedPopMat = popMat; clear i; clear j;
(6)画图函数plotGraph:用于直观的显示在进化的过程中,种群平均总处理时间的变化。代码如下:
% [name] -- plotGraph(画图) % [function]-- 直观的展示在进化过程中,平均适应度值的趋势变化 % [input] -- 1. generationTime(进化次数) % 2. fitnessAverageValueMatrix(平均适应度值矩阵) % [output] -- none function plotGraph(fitnessAverageValueMatrix, generationTime) x = 1: 1: generationTime; y = fitnessAverageValueMatrix; plot(x, y); xlabel('迭代次数'); ylabel('平均总处理时间'); title('种群平均总处理时间的进化曲线');
好了,至此,我们就完成了解决本题目需要的函数块。接下来,我们只需要编写主函数main.m,针对本章的题目,对其进行求解即可。代码如下:
%% I. 清空变量 clear all clc %% II. 导入数据和参数初始化 %导入参数数据 tasks = load('data', 'tasks'); % 导入任务矩阵(含任务数量和任务长度) tasks = tasks.tasks; % 导入的是struct格式,因此要再多此一步 nodes = load('data', 'nodes'); % 导入节点矩阵(含节点数量和节点处理速度) nodes = nodes.nodes; timeMat = load('data', 'timeMat'); % 导入处理时间矩阵 timeMat = timeMat.timeMat; taskNum = length(tasks); % 任务数量 nodeNum = length(nodes); % 节点数量 iteratorNum = 1000; % 迭代次数 popSize = 300; % 种群大小(染色体数量) crossRate = 0.6; % 交叉概率 mutateRate = 0.01; % 变异概率 fitnessAverageValueMatrix = zeros(iteratorNum, 1); % 每代平均适应度值 fitnessBestValueMatrix = zeros(iteratorNum, 1); % 每代最优适应度值 bestIndividual = zeros(iteratorNum, taskNum); % 每代最佳自变量 %% III. 初始化种群 popMat = popInit(popSize, taskNum, nodeNum); %% IV. 迭代繁衍获取更好的个体(选择、交叉、变异) for currentNum = 1: iteratorNum % 求单个染色体的总处理时间和适应度矩阵 sumTimeMat = getfitnessValue(popMat, timeMat, nodeNum); % 染色体的总处理时间 % 记录当前最好的数据 if currentNum == 1 [~, bestIndex] = min(sumTimeMat); fitnessBestValueMatrix(currentNum) = min(sumTimeMat); fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat); bestIndividual(currentNum, :)= popMat(bestIndex, :); % 最佳适应度值所对应的染色体(分配方案) else [~, bestIndex] = min(sumTimeMat); fitnessBestValueMatrix(currentNum) = min(fitnessBestValueMatrix(currentNum - 1), min(sumTimeMat)); fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat); if fitnessBestValueMatrix(currentNum) == fitnessBestValueMatrix(currentNum - 1) bestIndividual(currentNum, :) = bestIndividual(currentNum - 1, :); elseif fitnessBestValueMatrix(currentNum) == min(sumTimeMat) bestIndividual(currentNum, :) = popMat(bestIndex, :); else h = errordlg('请检查代码', '意外错误'); end end if currentNum ~= iteratorNum % 选择 popMat = selection(sumTimeMat, popMat, 1); % 保留亲代最佳个体 % 交叉 popMat = crossover(popMat, 1, crossRate); % 单点交叉 % 变异 popMat = mutation(popMat, mutateRate, nodeNum); end end %% V. 画图并展示结果 % 画图 plotGraph(fitnessAverageValueMatrix, iteratorNum); % 展示数据 disp 最短处理时间 fitnessBestValueMatrix(currentNum, 1) plan = bestIndividual(currentNum, :);
运行上述程序,可以得到:
ans = 9.5278
可以得知,经过我们的遗传算法,可以设计出一套方案,让总处理时间大大减小(不能保证是最小,但接近最小)。下面大家可以看看,随着迭代次数的增加,遗传算法对方案的优化进而平均总处理时间的变化。
可以看到,随着迭代次数的增加,平均总处理时间从30多降到最后的9点多。