随笔档案「2021年10月」 - 凯鲁嘎吉

双层优化问题：统一GAN，演员-评论员与元学习方法(Bilevel Optimization Problem unifies GAN, Actor-Critic, and Meta-Learning Methods)

摘要：双层优化问题：统一GAN，演员-评论员与元学习方法 (Bilevel Optimization Problem unifies GAN, Actor-Critic, and Meta-Learning Methods) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kai 阅读全文

posted @ 2021-10-21 13:15 凯鲁嘎吉阅读(5961) 评论(2) 推荐(1)

COMPLETER: 基于对比预测的缺失视图聚类方法

摘要：COMPLETER: 基于对比预测的缺失视图聚类方法作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 本文对COMPLETER: Incomplete Multi-view Clustering via Contrastive Prediction这篇阅读全文

posted @ 2021-10-19 16:43 凯鲁嘎吉阅读(2253) 评论(1) 推荐(0)

重要性采样(Importance Sampling)——TRPO与PPO的补充

摘要：重要性采样(Importance Sampling)——TRPO与PPO的补充作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 上两篇博客已经介绍了信赖域策略优化(Trust Region Policy Optimization, TRPO)与近端策略阅读全文

posted @ 2021-10-13 11:32 凯鲁嘎吉阅读(2726) 评论(0) 推荐(2)

近端策略优化算法(Proximal Policy Optimization Algorithms, PPO)

摘要：近端策略优化算法(Proximal Policy Optimization Algorithms, PPO) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇博文是Schulman, J., Wolski, F., Dhariwal, P., Ra 阅读全文

posted @ 2021-10-12 09:54 凯鲁嘎吉阅读(3370) 评论(0) 推荐(0)

信赖域策略优化(Trust Region Policy Optimization, TRPO)

摘要：信赖域策略优化(Trust Region Policy Optimization, TRPO) 作者：凯鲁嘎吉 - 博客园 http://www.cnblogs.com/kailugaji/ 这篇博文是John S., Sergey L., Pieter A., Michael J., Philip 阅读全文

posted @ 2021-10-10 13:31 凯鲁嘎吉阅读(3877) 评论(1) 推荐(2)