[学习笔记] GA解TSP问题

GA解TSP问题

遗传算法

遗传算法之前写过用来求最大值问题的blog,不再赘述,记录一下求解TSP问题的代码。
算法很简单,唯一需要注意的是如何定义问题的表示、交叉算子、变异算子以及适应度函数。
水一篇,上课老师讲的太困了,边听边写~

问题表示

用一组序列表示访问顺序,只有三个节点的样本可以用一组序列表示,如[2,1,0]表示先访问二号节点,然后访问1号节点,最后访问0号节点。
所以生成样本直接np.random.shuffle(np.arange(n))就可以生成样本了。

交叉算子

本问题中涉及两个序列之间的交叉,比如序列[2,1,3,4,0]和序列[1,2,3,4,0]在第0到第3之间的位置进行交叉,但是直接交换会导致交换后的样本有重复数字,所以我在设计的时候直接用这些位置的shuffle。
实质上并没有实现交叉,但是交叉存在的意义其实是保留两者优秀的基因,随机选择的位置可能是优秀基因,也可能不是,通过交叉可以交换优秀的基因,我这种操作其实等同于局部变异,但是是针对优秀父代的局部变异,同时保留了父代,如果这种变异不好,会被淘汰掉的。虽然设计的不是很好,但结果上还是work的。

变异算子

变异算子比较好实现,随机选取一个区间,区间内的序列随机打乱即可。

Coding

import numpy as np

class GA(object):
    def __init__(self,cities,num_iters = 250):
        self.cities = cities
        self.num_iters = num_iters
        init_number = 500
        n = self.cities.shape[0]
        self.weight = np.tile(np.arange(n)[np.newaxis,:],[init_number,1]) # 种群初始化数量为100个个体
        for i in range(n):
            np.random.shuffle(self.weight[i])
        self.distance = np.zeros((n,n))
        for i in range(n):
            for j in range(n):
                self.distance[i,j] = np.linalg.norm(self.cities[i] - self.cities[j])
    def solve(self):
        for iter in range(self.num_iters):
            
            n = self.weight.shape[0]
            w = [self.fitness(self.weight[i]) for i in range(n)]
            print(sum(w) / len(w))
            w/= sum(w)
            probablity = [sum(w[:i+1]) for i in range(len(w))]
            new_x = []
            for _ in range(n):
                p = np.random.random()
                for j in range(n):
                    if j ==0:
                        if p >=0 and p <= probablity[j]:
                            temp = self.weight[j].copy()
                            q = np.random.random()
                            if q > 0.4:
                                self.variation(temp)
                            new_x.append(temp)
                            break
                    else:
                        if p >= probablity[j-1] and p <= probablity[j]:
                            temp = self.weight[j].copy()
                            q = np.random.random()
                            if q > 0.4:
                                self.variation(temp)
                            new_x.append(temp)
                            break
            fm = sorted(new_x,key = lambda x:self.fitness(x))[0:2]
            new_x.extend(self.cross(fm[0],fm[1]))
            
            self.weight = np.array(new_x)
        result = sorted(self.weight.tolist(),key = lambda x:self.fitness(x))[-1]
        print(result,1./self.fitness(result))
    @staticmethod
    def variation(x):
        n = x.shape[0]
        a = np.random.randint(0,n-1)
        b = np.random.randint(0,n-1)
        a,b = (b,a) if b<a else (a,b)
        np.random.shuffle(x[a:b])
    @staticmethod
    def cross(x,y):
        n = x.shape[0]
        a = np.random.randint(0,n-1)
        b = np.random.randint(0,n-1)
        a,b = (b,a) if b<a else (a,b)
        xx = x.copy()
        yy = y.copy()
        np.random.shuffle(xx[a:b])
        np.random.shuffle(yy[a:b])
        #xx[a:b],yy[a:b] = yy[a:b],xx[a:b]
        return [xx,yy]


    def fitness(self,x):
        n = self.cities.shape[0]
        fit = 0.
        for i in range(n):
            j = i+1 if i+1 <n else 0
            fit += self.distance[x[i],x[j]]
        return 1./fit

if __name__ == "__main__":
    #cities = np.array([[0,0],[0,1],[1,0],[1,1]])
    cities = np.array([[2,6],[2,4],[1,3],[4,6],[5,5],[4,4],[6,4],[3,2]])
    # [2, 1, 0, 3, 5, 4, 6, 7] 16.084259940083065

    solver = GA(cities)
    #print(1./solver.fitness(np.array([1,2,0,3,5,4,6,7]))) # 17.246537600251443
    #solver.solve()

结果

[2, 1, 0, 3, 5, 4, 6, 7] 16.084259940083065

感觉和hopfield网络一样,每次运行其实结果都会不太一样,hopfield我跑的比较好的一次总距离是14.714776642118863,比这个要好一点,也有跑的比这个差的情况。跑节点比较少的比如四个节点,结果是百分百正确,节点多了可能会有点不稳定。(因为多了我也不知道最小距离是多少了/)

posted @ 2020-03-23 16:50  aoru45  阅读(346)  评论(0编辑  收藏  举报