随笔档案「2024年11月17日」：任务预测指标整理 ... - GraphL

2024年11月17日

摘要： A Graph-based Representation Framework for Trajectory Recovery via Spatiotemporal Interval-Informed Seq2Seq 预测路段比例 + 坐标（欧几里得距离）+ 坐标（道路比例之间的距离）根据您提供阅读全文

posted @ 2024-11-17 21:21 GraphL 阅读(322) 评论(0) 推荐(0)

强化学习整理

摘要： Q-Learning 是off-policy，采样和Q值更新不一致。使用的是值更新 Q-Learning 是一种基于值的强化学习算法，主要通过与环境交互来更新 Q 值，从而找到最优策略。以下是 Q-Learning 的主要步骤和关键组成部分： 1. 初始化初始化 Q 值表：为所有状态-动作对 $ 阅读全文

posted @ 2024-11-17 02:53 GraphL 阅读(183) 评论(0) 推荐(0)

csjywu01

公告