数学建模方法-遗传算法(实战篇part 2)

一、引言

  在上一个篇章中,我们用遗传算法来计算一个一元函数的最大值,但是,有人会讲,这样是不是有些大材小用了,明明我可以用更少的代码来实现求最大值的功能。确实,将遗传算法用在那里确实大材小用了,但是,博主的目的并不是为求最大值,而是为了给大家展示,遗传算法是一种可行的算法,并且博主编写的matlab代码是可行的。现在,我们就要利用上一篇写的代码作为基本代码,来解决本篇的问题。放心,本篇的问题可不是用普通的方法就能就解决的。遗传算法的春天终于来了。让我们开始吧。。

二、问题描述和建模

  负载均衡调度问题:假设有N个任务,需要负载均衡器分配给M个服务器节点去处理。每个任务的任务长度、每台服务器节点(下面简称“节点”)的处理速度已知,请给出一种任务分配方式,使得所有任务的总处理时间最短。

  好,那么现在题目有了,但是我们要想办法对题目进行数学建模。显然,我们需要2个矩阵,一个存放任务(含任务数量、任务长度),一个存放服务器节点(含节点数量、处理速度)。

(1)任务长度矩阵(简称:任务矩阵)

  我们将所有任务的任务长度用矩阵tasks表示,其中tasks(i)中的i表示任务的编号,tasks(i)表示任务i的任务长度。比如

  tasks = [2, 4, 6, 8]                

  表明,任务1的长度是2;任务2的长度是4,以此类推。

(2)节点处理速度矩阵(简称:节点矩阵)

  我们将所有服务器节点的处理速度用nodes表示,其中nodes(i)中的i表示节点的编号,nodes(i)表示节点j的处理速度。比如

  nodes = [2, 1]

  表明,节点1的速度是2;节点2的速度是1,以此类推。

(3)任务处理时间矩阵

  当任务矩阵task和节点矩阵nodes确定下来后,那么所有任务分配给所有节点的任务处理时间就可以确定了,我们用矩阵timeMat来存所有节点的任务处理时间,那么timeMat(i, j)表示任务i分配给节点j处理所需的时间,它通过以下公式计算:

  timeMat(i, j) = task(i) / nodes(j);

  有了上面三个矩阵后,我们就算是成功将题目用数学的方式描述出来了。

  我们用matlab代码创建一个createData.m文件,用来对题目进行建模并且保存数据。如下:

%% I. 清空自变量
clear all
clc
%% II. 题目建模
% 参数定义
taskNum = 100;												% 任务数量
taskLengthRange = [10, 100];								% 任务长度范围
nodeNum = 10;												% 节点数量
nodeSpeedRange = [10, 100];									% 节点长度范围

tasks = initRandomMat(taskNum, taskLengthRange);			% 构建任务矩阵(含任务数量和任务长度)

nodes = initRandomMat(nodeNum, nodeSpeedRange);				% 构建节点矩阵(含节点数量和节点处理速度)

timeMat = zeros(taskNum, nodeNum);							% 构建处理时间矩阵
for i = 1: taskNum
    for j = 1: nodeNum
        timeMat(i, j) = tasks(1, i) / nodes(1, j);
    end
end
    
%% III. 数据保存
save('data', 'tasks', 'nodes', 'timeMat');

  其中initRandomMat()函数代码如下:

% [name] 	--		initRandomMat(初始化随机矩阵)
% [function]--		
% [input]	--		length (数组的长度)
%			--		range (数组元素的取值范围range(1) to range(2))
% [output]	--		randomMat

function randomMat = initRandomMat(length, range)
    randomMat = zeros(1, length);
    for i = 1: length
        randomMat(1, i) = round(rand() * (range(2) - range(1)) + range(1));
    end

  三、遗传算法解决问题

  还是老样子,我们先回顾下遗传算法的步骤,如下:

  1.  种群初始化
  2. 计算每个种群的适应度值
  3. 选择(Selection)
  4. 交叉(Crossover)
  5. 变异(Mutation)
  6. 重复2-5步直至达到进化次数

  正如我们上一篇所说,为了让我们的代码有更好的包容性,我们需要先写几个函数包,到时再main.m里面引用,就很方便了。

  (1)种群初始化函数popInit(),能根据提供的种群大小染色体长度产生初始的种群。代码如下:

% [name] 	--		popInit(种群初始化函数)
% [function]--		构建种群矩阵,其中行数为种群个数,列数为染色体长度(即基因的个数),并随机分配染色体的样式
% [input]	--		1. popSize(种群大小/个数)
%			--		2. cLength(染色体长度)
%			--		3. range (染色体上基因的数值范围0 - range)
% [output]	--		popMat(种群矩阵)

function popMat = popInit(popSize, cLength, range)
	popMat = zeros(popSize, cLength);                           % 预分配内存
	for i = 1: popSize
		for j = 1: cLength
			popMat(i, j) = ceil(rand() * range);                % rand产生(1,range)之间的随机数
		end
	end

clear i;
clear j;

   (2)计算每个种群的适应度值函数getfitnessValue()。代码如下:

% [name] 	--		getfitnessValue(计算种群个体适应度值)
% [function]--		根据不同的题目要求,设计适应度方程计算的算法
%			--		在实际的负载均衡调度中,各个节点的任务处理是并行计算的,所以,所有任务的完成时间应该是所有节点任务完成时间的最大值,并非所有任务完成时间的总和。
% [input]	--		timeMat (时间处理矩阵)		-- timeMat(i, j): 第i个任务分配到第j个节点,需要的处理时间
%			--		popMat (种群矩阵)				-- popMat(i, j): 第i个染色体上, 第j个任务分配到的节点标号
%			--		nodeNumMax (节点的最大标号)
% [output]	--		fitValMat(每个染色体的适应度值)

function fitnessValueMatrix = getfitnessValue(popMat, timeMat, nodeNumMax)
	[popSize, cLength] = size(popMat);														% 获取种群的数目(行)和染色体长度(列)
	fitnessValueMatrix = zeros(popSize, 1);													% 初始化适应度矩阵																		% 最大的节点标号											
	for i = 1: popSize
		maxLength = eps;																	% 大于0的最小正数
		for nodeIndex = 1: nodeNumMax
			sumLength = 0;                                                            		% 清零
			for j = 1: cLength
				if popMat(i, j) == nodeIndex
					sumLength = sumLength + timeMat(j, nodeIndex);
				end				
			end
			if sumLength > maxLength
				maxLength = sumLength;
            end 
		end
		fitnessValueMatrix(i) = maxLength;
	end

clear i;
clear j;
clear nodeIndex;

  (3)选择函数selection(),可以对种群进行选择,具体算法和代码如下:

% [name] 	--		selection(选择操作)
% [function]--		采用轮盘赌的一个形式来进行选择,增加不确定性,这样种群就不容易趋向局部最优
% [input]	--		1. fitnessValueMatrix (适应度值矩阵)
%			--		2. popMat(未选择的种群矩阵)
%			--		3. type        --       1: 保留亲代最优个体
%                                           0: 不保留亲代最优个体
% [output]	--		updatedPopMat(经选择后的种群矩阵)

function updatedPopMat = selection(fitnessValueMatrix, popMat, type)
	[popSize, cLength] = size(popMat);
    updatedPopMat = zeros(popSize, cLength);
    fitnessValueMatrix = 100 ./ fitnessValueMatrix;
	% 剔除适应值为负的种群,使其适应值为0
	for i = 1: popSize
		if fitnessValueMatrix(i, 1) < 0
			fitnessValueMatrix(i, 1) = 0;
		end
	end
	% 轮盘赌算法
	P = fitnessValueMatrix / sum(fitnessValueMatrix);
	Pc = cumsum(P);
	
	for i = 1: popSize
		index = find(Pc >= rand);
		updatedPopMat(i, :) = popMat(index(1), :);
	end

	% 是否要保留亲本适应度值最高的,若是,则type = 1,否则为0
	if type
		[~, bestIndex] = max(fitnessValueMatrix);
		updatedPopMat(popSize, :) = popMat(bestIndex, :);		% 将亲代最优染色体放到子代的最后一个个体中
	end

clear i;
clear j;

  (4)交叉函数crossover(),可以对种群进行交叉,交叉的方式又分为单点交叉多点交叉,根据输入不同的参数来选择不同的实现方式,具体算法和代码如下:

% [name] 	--		crossover(交叉操作)
% [function]--		选定交叉点并进行互换
% [input]	--		1. popMat (未交叉的种群矩阵)
%			--		2. type		--		1: 单点交叉
%								--		2: 多点交叉
%			--		3. crossrate (交叉率)	 -- 建议值为0.6
% [output]	--		updatedPopMat(经交叉后的种群矩阵)

function updatedPopMat = crossover(popMat, type, crossrate)
	[popSize, cLength] = size(popMat);
	if type == 1
		% 单点交叉
		for i = 1: 2: popSize
			if crossrate >= rand
				crossPosition = round(rand() * (cLength - 2) + 2);		% 随机获取交叉点,去除0和1
				% 对 crossPosition及之后的二进制串进行交换
				for j = crossPosition: cLength
					temp = popMat(i, j);
					popMat(i, j) = popMat(i + 1, j);
					popMat(i + 1, j) = temp;
				end
			end
        end
        updatedPopMat = popMat;
	elseif type == 2
		% 多点交叉
		for i = 1: 2: popSize
			if crossrate >= rand
				crossPosition1 = round(rand() * (cLength - 2) + 2);		% 第一个交叉点
				crossPosition2 = round(rand() * (cLength - 2) + 2);		% 第二个交叉点
				first = min(crossPosition1, crossPosition2);
				last = max(crossPosition1, crossPosition2);
				for j = first: last
					temp = popMat(i, j);
					popMat(i, j) = popMat(i + 1, j);
					popMat(i + 1, j) = temp;
				end
			end

        end
        updatedPopMat = popMat;
	else
		h = errordlg('type的类型只能为1(单点交叉)或者2(多点交叉)', '进行交叉时发生错误');
    end
    

clear i;
clear j;

  (5)变异函数mutation(),可以对种群进行变异,具体算法和代码如下:

% [name] 	--		mutation(变异操作)
% [function]--		单点变异:随机选择变异点,将其变为0或1
% [input]	--		1. popMat (未交叉的种群矩阵)
%			--		2. mutateRate (交叉率)	 -- 建议值为0.1
%			--		3. randValur (变异后的随机数范围0-randValue)
% [output]	--		updatedPopMat(经交叉后的种群矩阵)

function updatedPopMat = mutation(popMat, mutateRate, randValue)
	[popSize, cLength] = size(popMat);
	for i = 1: popSize
		if mutateRate >= rand
			mutatePosition = ceil(rand() * cLength);			% 随机获取交叉点,去除0
			% 对mutatePosition点进行变异
			popMat(i, mutatePosition) = ceil(rand() * randValue);
		end
	end
	updatedPopMat = popMat;
clear i;
clear j;

  (6)画图函数plotGraph:用于直观的显示在进化的过程中,种群平均总处理时间的变化。代码如下:

% [name] 	--		plotGraph(画图)
% [function]--		直观的展示在进化过程中,平均适应度值的趋势变化
% [input]	--		1. generationTime(进化次数)
%					2. fitnessAverageValueMatrix(平均适应度值矩阵)
% [output]	--		none

function plotGraph(fitnessAverageValueMatrix, generationTime)
x = 1: 1: generationTime;
y = fitnessAverageValueMatrix;

plot(x, y);
xlabel('迭代次数');
ylabel('平均总处理时间');
title('种群平均总处理时间的进化曲线');

  好了,至此,我们就完成了解决本题目需要的函数块。接下来,我们只需要编写主函数main.m,针对本章的题目,对其进行求解即可。代码如下:

%% I. 清空变量
clear all
clc
%% II. 导入数据和参数初始化
%导入参数数据
tasks = load('data', 'tasks');                                                          % 导入任务矩阵(含任务数量和任务长度)
tasks = tasks.tasks;                                                                    % 导入的是struct格式,因此要再多此一步

nodes = load('data', 'nodes');                                                          % 导入节点矩阵(含节点数量和节点处理速度)
nodes = nodes.nodes;

timeMat = load('data', 'timeMat');                                                      % 导入处理时间矩阵
timeMat = timeMat.timeMat;

taskNum = length(tasks);                                                                % 任务数量
nodeNum = length(nodes);                                                                % 节点数量

iteratorNum = 1000;                                                                     % 迭代次数
popSize = 300;                                                                          % 种群大小(染色体数量)
crossRate = 0.6;                                                                        % 交叉概率
mutateRate = 0.01;                                                                      % 变异概率 

fitnessAverageValueMatrix = zeros(iteratorNum, 1);                                      % 每代平均适应度值
fitnessBestValueMatrix = zeros(iteratorNum, 1);                                         % 每代最优适应度值
bestIndividual = zeros(iteratorNum, taskNum);                                           % 每代最佳自变量

%% III. 初始化种群
	popMat = popInit(popSize, taskNum, nodeNum);

%% IV. 迭代繁衍获取更好的个体(选择、交叉、变异)
for currentNum = 1: iteratorNum
	% 求单个染色体的总处理时间和适应度矩阵
	sumTimeMat = getfitnessValue(popMat, timeMat, nodeNum);								% 染色体的总处理时间	
    % 记录当前最好的数据
    if currentNum == 1
        [~, bestIndex] = min(sumTimeMat);
        fitnessBestValueMatrix(currentNum) = min(sumTimeMat);
        fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat);
        bestIndividual(currentNum, :)= popMat(bestIndex, :);							% 最佳适应度值所对应的染色体(分配方案)
    else
        [~, bestIndex] = min(sumTimeMat);
        fitnessBestValueMatrix(currentNum) = min(fitnessBestValueMatrix(currentNum - 1), min(sumTimeMat));
        fitnessAverageValueMatrix(currentNum) = mean(sumTimeMat);
        if fitnessBestValueMatrix(currentNum) == fitnessBestValueMatrix(currentNum - 1)
            bestIndividual(currentNum, :) = bestIndividual(currentNum - 1, :);              
        elseif fitnessBestValueMatrix(currentNum) == min(sumTimeMat)
            bestIndividual(currentNum, :) = popMat(bestIndex, :);                           
        else
            h = errordlg('请检查代码', '意外错误');
        end 
    end
    
    if currentNum ~= iteratorNum
        % 选择
        popMat = selection(sumTimeMat, popMat, 1);										% 保留亲代最佳个体
        % 交叉
        popMat = crossover(popMat, 1, crossRate);										% 单点交叉
        % 变异
        popMat = mutation(popMat, mutateRate, nodeNum);
    end
end

%% V. 画图并展示结果
 
% 画图
plotGraph(fitnessAverageValueMatrix, iteratorNum);
% 展示数据
 
disp 最短处理时间
fitnessBestValueMatrix(currentNum, 1)
 
plan = bestIndividual(currentNum, :);

  运行上述程序,可以得到:

ans = 
            9.5278

  可以得知,经过我们的遗传算法,可以设计出一套方案,让总处理时间大大减小(不能保证是最小,但接近最小)。下面大家可以看看,随着迭代次数的增加,遗传算法对方案的优化进而平均总处理时间的变化。

  可以看到,随着迭代次数的增加,平均总处理时间从30多降到最后的9点多。

posted @ 2018-08-22 16:33  Qling的随笔  阅读(4343)  评论(4编辑  收藏  举报