摘要: **发表时间:**2021 (AAMAS 2021 extended abstract) **文章要点:**这篇文章想说通常RL都是去最大化累计回报,这个值通常都是标量,标量反映出来的信息肯定就没有分布多。这篇文章就在risk-aware and multi-objective的设定下用MCTS来做 阅读全文
posted @ 2021-11-06 12:25 initial_h 阅读(125) 评论(0) 推荐(0) 编辑
摘要: **发表时间:**2019(IEEE Transactions on Multimedia) **文章要点:**这篇文章想说现在的online PCA对于changing point不能识别,就会造成online的更新不能及时调整适应,造成性能变差。这里的changing point指的是突然变化的 阅读全文
posted @ 2021-11-06 12:03 initial_h 阅读(63) 评论(0) 推荐(0) 编辑