摘要:
这篇论文是发在 2013 Sigcomm 顶会,应该是将机器学习的思想应用到拥塞控制领域的新的尝试。Remy 算法通过在不同的网络环境下找到该环境的最佳 Remy CC,将网络环境建模为 马尔可夫 过程,定义 objective function,并且定义 state 和 action,建立映射表,有 RL 的意思了。以现在的眼光看,网络环境的变化 是很难 通过映射表列举出来,同样也要耗费很大内存资源去存储这些映射,如果遇到未知的memory,性能就会比较差。但无疑推动了DRL 在 拥塞控制的应用。 阅读全文