随笔分类 - 深度强化学习
摘要:NLP知识图谱项目合集(信息抽取、文本分类、图神经网络、性能优化等) 这段时间完成了很多大大小小的小项目,现在做一个整体归纳方便学习和收藏,有利于持续学习。 1. 信息抽取项目合集 1.PaddleNLP之UIE技术科普【一】实例:实体识别、情感分析、智能问答 https://aistudio.ba
阅读全文
摘要:强化学习调参技巧二:DDPG、TD3、SAC算法为例:先写一个简化版的训练环境。把任务难度降到最低,确保一定能正常训练。记录正常训练的智能体的分数,与随机动作、传统算法得到的分数做比较。
DRL算法的分数应该明显高于随机动作(随机执行动作)。DRL算法不应该低于传统算法的分数。如果没有传统算法,那么也需要自己写一个局部最优的算法
阅读全文