由于昨天仿真实验没有观察到曲线上升的过程,在昨晚睡前将博弈轮数设置为50000次,困境强度 \((DS)\) 为0.02,Q-Learning智能体占比约为0.1 \((\frac{1018}{10000})\) ,截止到第二天中午十二点,已经完成约25000轮次,重新进行绘图后结果如下:
已经可以观察到后续的合作率曲线上升的过程! 最终50000轮结果: