摘要:
根据使用者的 feedback 更新我们的模型.有一个问题是学完不同 domain 的数据(多个任务)之后会忘了之前学过的内容,但如果把数据混在一起学却能同时学会.这种状况是 catastrophic forgetting,用 catastrophic(灾难性的)来形容足见遗忘的夸张程度. 那把之前 阅读全文
posted @ 2025-05-02 16:30
383494
阅读(40)
评论(0)
推荐(0)
摘要:
title: NTU ML2023Spring Part2.13 Reinforcement Learning date: 2025-05-01 15:45:00+0800 lastmod: 2025-05-02 14:44:00+0800 RL: reinforcement learning,强化 阅读全文
posted @ 2025-05-02 14:45
383494
阅读(25)
评论(0)
推荐(0)

浙公网安备 33010602011771号