轨迹数据 Motivation & Challenge
LightTR: A Lightweight Framework for Federated Trajectory Recovery
general的问题,数据来源于边缘设备。无法很好的训练一个最优的模型
框架分散训练的得问题 (边缘设备)
一般来说,这些网络是由一堆时空(ST)块组成的,旨在学习轨迹之间的复杂的时空依赖性。st块包含基st算子,可以进一步分为卷积神经网络(CNN)[18]、递归神经网络(RNN)[16]、[19]和基于注意神经网络(Attn)[15]的st算子。然而,现有的方法假设模型是用从边缘设备收集的集中数据进行训练的,这导致了较高的收集和存储成本,并且无法处理分散的训练数据。
specific的问题
数据中低采样率,存在数据缺失。因此需要补全===========》(所以这里是没有提出针对补全数据中的异质性提出问题)
由于移动传感设备的爆炸性采用和发展,大量的轨迹以分散的方式收集,使各种基于轨迹的应用[1]-[8],如交通预测[9]、目的地预测[10]和车辆导航[4]。尽管如此,在实践中,收集到的轨迹数据通常以低采样率[11]进行采样,称为不完全轨迹(a.k.a.低采样率轨迹),由于详细信息的丢失和高不确定性,损害了上述应用程序的有效性。因此,恢复被称为轨迹恢复的不完全轨迹的缺失点是很重要的,以便能够更有效地利用这些低采样率的轨迹
数据的时空依赖性===========》(针对轨迹数据中的特性,时空依赖性)
然而,现有的基于fl的方法[20]、[21]没有考虑到固有的时空依赖性,而这对于有效的轨迹嵌入[16]很重要。在本研究中,我们的目标是开发一种新的基于fl的轨迹恢复模型,它可以弥补分散数据处理和复杂的时空依赖建模之间的差距。尽管如此,由于以下挑战,开发这种模型是很重要的。
框架的问题
计算资源 (ST+MLP)
挑战一:可扩展性。现有流行的轨迹恢复方法通常具有较差的可伸缩性,因为这些基于深度学习的模型往往很大,其中训练和推理往往耗时和计算昂贵。这限制了轨迹恢复模型在资源约束的边缘计算设备上的可扩展性,这在分散计算中起着至关重要的作用。此外,这些方法可能会在大规模的轨迹学习设置中导致内存溢出,因为整个网络在训练过程中必须驻留在内存中。例如,给定N个轨迹,每个轨迹都有L个点,基于attn的st运算符的内存成本随L和N呈二次增加(见表II)。然而,目前的轨迹恢复模型中没有定制的闪电模块,简单地减轻这些模型会显著降低[22]的性能,这也限制了轨迹学习的可扩展性。
数据异质性问题,导致模型难以收敛 (知识蒸馏)
挑战二:通信成本。在FL培训过程中,中央服务器和所有参与客户之间存在一定的通信。有两行因素,如有限的网络带宽和爆炸性的参与客户端,可能会在FL环境中造成通信瓶颈,从而增加延迟并降低实用性。统计上,不同客户端收集的轨迹通常不是独立的、同分布的(Non-IID)和异构的,这导致通信轮显著增加以实现收敛,并难以获得最优的全局模型。系统地说,FL环境中涉及一定数量的客户端,而每个客户端的通信容量可能由于硬件、网络连接和电源方面的重大限制而不同。在联邦轨迹恢复中开发一种降低通信成本的方法,它能够解决这些统计和系统的问题是非常可取的,但也不是不简单的。
解决方案
客户端确保时空依赖
为了避免巨大的内存消耗和有限的可伸缩性(挑战I),我们为每个客户端设计了一个本地轻量级轨迹嵌入(LTE)模型。具体来说,LTE包含一个嵌入组件和一个st块堆栈来学习有效的时空表示。与以往的研究[19],我们形式化一个轻量级的运算符和取代流行的算符(如CNN和附加)纯MLP(多层感知器)架构考虑较低的空间复杂性(即O(L + D + 1))和时间复杂性(即O(N·(L + D)))的MLP,其中L表示每个轨迹,D是嵌入大小,N是轨迹的数量。在这里,我们只使用一个RNN层与MLP结合来确保时间依赖项捕获。
知识蒸馏解决通信成本问题
为了降低通信成本并加快模型的收敛速度(挑战II),我们提出了一种基于知识蒸馏的元知识增强的局部-全局训练模块。在联合培训之前,我们提出了一个教师模型(即元学习者),使用其中的一部分本地数据为每个客户学习本地元知识。我们将局部轻量级轨迹嵌入模型作为学生模型。在FL过程中,采用教师模型来指导学生模型的优化,以更好地学习共同特征,实现更快的收敛速度
实验,使用的都是车辆数据,并且是将以一个数据集拆分成20个客户端。每个数据集的实验是独立的
在这项研究中,提出了一个轻量级的联邦学习框架 LightTR,用于实现高效的轨迹恢复。研究使用了 Geolife 和 Tdrive 两个数据集,数据保留比例分别为 6.25%、12.5% 和 25%,并在每两个保留的轨迹点之间平均插入 6 个数据点,以实现高采样率的轨迹恢复。
LightTR 框架在客户端使用以下方法模块来协同完成轨迹恢复任务:
-
FC+FL:结合水平联邦学习 (FL) 和堆叠的全连接层 (FC) 用于轨迹恢复。在此方法中,使用隐马尔可夫模型 (HMM) 作为匹配算法。
-
RNN+FL:一种去中心化的轨迹恢复模型,通过堆叠递归神经网络 (RNN) 与水平联邦学习相结合,协作学习轨迹的表示。
-
MTrajRec+FL:利用 MTrajRec 作为本地模型的去中心化轨迹恢复方法。MTrajRec 是基于序列到序列 (Seq2Seq) 的先进轨迹恢复方法。
-
RTrajRec+FL:使用 RNtrajRec 作为本地模型的水平联邦学习轨迹恢复方法。RNtrajRec 应用了图神经网络,以捕捉轨迹中的丰富时空相关性。
LightTR 框架通过上述模块在客户端完成轻量化的轨迹嵌入,并结合联邦学习的水平协同训练,确保数据隐私和分散化。同时,LightTR 还采用了增强的本地-全局训练方案,以减少客户端与服务器之间的通信成本,从而进一步提升了计算效率。
实验结果表明,LightTR 框架在实现高效轨迹恢复的同时,能够有效保障数据隐私并降低计算资源消耗。
Physics-Informed Trajectory Prediction for Autonomous Driving under Missing Observation
specific的数据问题=====》缺失数据,传感器观测缺失
在自动驾驶汽车的领域中,在动态环境中有效预测周围车辆的轨迹遇到了两个经常被忽视但相互关联的挑战。最大的挑战来自于现实世界的观测限制,如传感器的限制和环境因素,包括障碍物、不利天气或交通拥堵。这些约束经常导致观察结果的缺失[Liao et al.,2024b],这对传统的深度学习模型构成了重大障碍。尽管这些模型在理想的数据集上很有效,但它们通常难以适应现实世界驾驶的不可预测和变化的条件特征[巴塔查里亚等人,2023年],这是一个问题
物理定律,运动学约束========》导致预测在统计上是准确的,但在运动学上不可行
其次,同样被忽视的挑战包括确保这些模型在轨迹预测中符合物理定律。目前的许多模型没有充分考虑车辆运动的运动学约束,导致预测在统计上是准确的,但在运动学上不可行。这种限制可能会损害无人机运动计划的安全性和可靠性[Huang等人,2022;Shen等人,2023],但在现有文献中还没有给予应有的关注
解决方案
为了弥补这些差距,我们的研究引入了一种新的双阶段轨迹预测方法,该方法将数据分割和基于物理的方法与物理增强阶段相结合,如图1所示,以及轨迹预测阶段。这种方法结合了深度学习的鲁棒性和物理信息原理,确保在缺少观测的情况下,即使是现实和稳健的轨迹预测。为了证明它的有效性,我们的方法始终优于最先进的(SOTA)
基于运动学的补全
我们介绍了一个开创性的物理增强阶段,其中包括一个小波重建网络和一个运动学自行车模型。这种集成促进了轨迹预测领域的显著进步,显著提高了该方法对缺失观测值的鲁棒性,并增强了预测轨迹的运动学可行性。我们创新的波聚变编码器,受到量子力学的启发,彻底改变了相互作用建模。通过将车辆特征概念化为波形,该模块促进了一种利用波叠加原理建模车辆相互作用的新方法。
实验
在实验设置部分描述的缺失率和时间步可能确实让人困惑。以下是对文中提到的时间步和缺失率的解析:
-
时间步的含义:文中提到的 "3秒用于轨迹历史"((t_h = 3))和"5秒用于模型预测"((t_f = 5))指的是时间跨度,而不是时间步的个数。通常在轨迹数据中,时间步是以更小的时间间隔采样的(例如每秒采样一次)。因此,虽然历史部分的总时长为3秒,但在采样频率较高的情况下,可能会包含多个时间步数据点(例如3秒内可能有3个或更多时间步,具体取决于采样频率)。
-
缺失率的理解:文中提到的缺失率(25%、50%、75%)是指在数据样本中,观察到的数据点被随机移除的比例,而不是时间段的缺失。例如,在“MoCAD-missing, NGSIM-missing, 和 HighD-missing”数据集中,25%、50% 或 75% 的观测点被随机移除。因此,如果原始轨迹包含多个时间步(多个采样点),即使总时间跨度为3秒或5秒,仍然可以设置较高的缺失率,因为每个样本包含的具体数据点数可能足够多,允许这种比例的随机移除。
-
73%的缺失率可能的原因:文件没有具体说明是如何达成 73% 缺失的,但推测是一个统计上的缺失率或一种特定的实验设定。例如,如果某些段的数据极其稀疏或故意以高缺失率设计以测试模型的适应性和鲁棒性,可能会出现非标准的缺失率。
总结来说,缺失率是在一个包含多个时间步的轨迹数据点上实施的,并非仅针对 3 秒或 5 秒的时间跨度。这样可以确保数据集能够包含足够的点数以支持实验,即使缺失率较高。
COLA: Cross-city Mobility Transformer for Human Trajectory
数据上的长尾问题。每个城市都基本上是长尾数据 (数据稀疏)========》通过迁移知识缓解数据稀疏的问题
普遍存在的数据稀缺问题促使我们将人类流动的普遍模式从丰富的外部城市转移过来,以帮助提高我们的目标城市的综合质量。如图1(a)所示,城市市民的日常活动通常受到类似的意图的驱动,包括工作、娱乐、通勤、购物、休息等。这些共同的意图表现出不同城市人类轨迹的普遍模式,导致了相似的长尾频率分布,如图1(b).所示如果能够适当地转移城市间的移动知识,就可以在很大程度上缓解人类发展轨迹的数据稀缺性。
数据异质性的问题
然而,与跨城市[22,28,36]的时空转移相比,跨城市移动转移带来了相当特殊的挑战。[22,28,36]研究空气质量指标[36]、大流行病例[28]或交通速度[22]。首先,外部城市的位置与目标城市的位置很难相互作用,导致位置嵌入不能在城市间转移,这称为知识转移中的领域异质性。相比之下,时空传输通常处理相同特征空间的指标,如空气质量指标,减轻了传输的难度。其次,由于城市文化或地理影响,不同城市呈现出细微不同的长尾频率分布。这些细微的差异需要在知识转移过程中仔细校准现有的过度自信的深度神经网络[18]。上述挑战要求我们重新思考跨城市流动转移的原则。
解决方案上的问题
针对轨迹数据,循环网络的不适应。对抗方法也不适应
最近的深度学习模型[9,10、14、20,43-45]在很大程度上促进了基于先进的序列生成技术的人类轨迹的合成质量。一方面,递归模型[9,14,20]涉及到人类轨迹序列的归纳偏差。DeepMove [9]设计了一种个体轨迹的注意机制来检索相关信息;CGE [14]利用个体轨迹的时空上下文信息。尽管如此,循环模型很难从零开始生成高保真度的轨迹,因为它们依赖于历史模型
轨迹另一方面,基于对抗的方法[10,43-45]结合了人类流动性的高阶语义,如地理关系[10]、活动动态[44]和Maslow的需求层次[45],同时基于双人最大游戏最大化长期生成奖励。尽管他们做出了努力,但人类轨迹数据的严重缺乏将导致这些专用模型的次优解决方案。
针对异质性的问题,使用transformer来迁移
为了解决这些挑战,我们在迁移学习框架中引入了强大的变压器[29,31]块,以学习基于标记(位置)之间的注意相似性的人类移动的通用模式,这已经证明了它在许多NLP任务中的泛化能力。具体地说,我们用一个模型不可知的传输框架[11,28]定制了一个跨城市的移动模型,称为COLA,以处理领域异质性和跨城市的位置的不同长尾频率分布。首先,可乐将变压器划分为城市专用模块共享模块占城市通用知识,称为半开放变压器。它将注意力计算机制置于共享模块中,以更好地促进城市人类轨迹之间的模式转移。一旦转移,目标城市就可以通过私人模块展示其特定的移动行为,包括不可转移的位置嵌入及其潜在的表示。其次,COLA将其位置的预测概率与真实的长尾频率分布进行事后[26]对齐,以解决过度自信问题[18]。与重加权损失函数[48,50]的迭代优化相比,预测概率的后调整仅对移动迁移完成后的目标城市有效,使得迁移框架复杂优化的变化最小。COLA可以有效地适应强大的变压器跨城市移动转移。
Improving Transferability for Cross-Domain Trajectory Prediction via Neural Stochastic Diferential Equation
数据异质性的困难
数据驱动模型的一个众所周知的问题是,当训练数据和测试数据之间的数据分布存在差异时,它们的性能有限。因此,要在一个特定的环境下构建一个轨迹预测系统,最优的方法是从该环境中收集数据。然而,最近的模型需要大量的数据来获得最佳性能,这需要一个繁琐的获取如此数量的数据。从这个意义上说,充分利用现有的大规模数据集在规避这一障碍方面具有优势。最近的方法试图通过提出领域自适应来克服这一挑战(Xu等人2022;Wang等人2022b)或通过多源数据集训练来增加模型的通用性(Wang等人20222a)。与这些处理域间隙的方法相比,每个数据采集策略之间的差异导致的数据集特定差异被排除在域间隙之外,访问次数较少。我们的工作表明,对这些数据集特定差异的充分处理可以释放出跨数据集运动模式的集体潜力。
在处理跨数据集的轨迹或运动模式时,不同数据集的采集方式会导致一些特有的差异,这种差异通常没有被视为“领域差异”(domain gap),也就是说,它们往往没有被认为是需要适应或处理的领域差异。这些差异指的是各个数据集因不同的采集策略或技术导致的数据特征差异,比如传感器的分辨率、采样频率、地理区域、甚至环境因素的不同。
许多最新的研究通过 领域适应(domain adaptation) 或 多源数据集训练 来提高模型的通用性,以此来应对不同领域之间的差异(即传统意义上的“领域差异”)。然而,这些研究通常忽略了由数据采集策略差异所带来的数据集特定的偏差(即数据集特定的差异,并不被视为典型的领域差异)。
本文的工作展示了,如果能够有效地处理这些数据集特有的差异,那么可以从不同数据集的运动模式中挖掘出一种集体的潜力,进而提升模型的性能。这意味着,通过充分利用各数据集的特定信息,可以更好地结合这些数据集的优势,提升模型对跨数据集任务的适应性和表现。
这段话讨论的是不同数据集之间在 时间步配置 上的差异,以及这种差异对模型表现的影响。这里的“偏差”指的是 由于各数据集的采样策略和预测配置不同,导致的输入输出特征空间的差异,这使得模型在跨数据集时难以适应。
具体来说:
- 时间步配置差异:不同的数据集有不同的时间配置,例如:
- 观察和预测时间长度:一个数据集可能使用短时间的过去轨迹来预测较长时间的未来轨迹,另一个数据集则可能配置不同的过去和未来时间长度。
- 采样频率:不同的数据集采样频率不同,比如 10Hz、2Hz 等,即每秒采样的次数不同,这会导致特征在时间上的分布不同。
- 特征空间的差异:时间步配置的不同会导致输入和输出轨迹的特征空间(feature space)存在差异。举例来说,如果一个模型在 WOMD 数据集上训练,它的任务是基于过去 1 秒的轨迹(10Hz 采样)预测未来 8 秒的轨迹,这个模型学习的是一种从 1 秒的运动特征映射到 8 秒未来特征的函数。
- 跨数据集问题:如果这个模型在 nuScenes 数据集上进行评估,而 nuScenes 的配置是基于 2 秒的轨迹(2Hz 采样)预测未来 6 秒的轨迹,那么模型在输入和输出特征空间上会遇到困难。这是因为 WOMD 和 nuScenes 数据集的时间配置差异导致它们的输入输出特征的分布(或称特征流形)并不相同,模型很难将过去的轨迹特征准确地映射到未来的轨迹特征。
总结来说,这里的“偏差”是指不同数据集之间 由于采样频率、观察和预测时间长度的不同,导致的输入输出特征空间的分布差异。这些差异增加了跨数据集任务的难度,因为模型必须适应不同的特征空间,这种特征空间的偏差并不是典型的“领域差异”,而是数据集采集策略本身带来的差异。
概念上的问题
好的,我们来梳理一下采样频率、观测时间和预测时间之间的关系。这三个因素共同决定了轨迹数据的结构,以及模型输入和输出的特征。
1. 采样频率(Sampling Frequency)
采样频率表示在单位时间内采集数据的次数,通常以Hz为单位。例如:
- 10Hz 表示每秒采集 10 个数据点。
- 2Hz 表示每秒采集 2 个数据点。
采样频率越高,每秒采集的数据点越多,轨迹信息的时间分辨率就越高。采样频率对轨迹的细节捕捉能力有很大影响,频率越高,可以捕捉到更细微的运动变化。
2. 观测时间(Observation Time)
观测时间是模型用于预测未来轨迹的过去时间长度,即模型的输入部分。例如:
- 观测时间为 1 秒,意味着模型仅使用过去 1 秒的数据进行预测。
- 观测时间为 2 秒,则使用过去 2 秒的数据。
观测时间决定了模型在做出预测前可以看到的轨迹长度。观测时间越长,模型能够利用的信息越多,这可能有助于更准确的预测。
3. 预测时间(Prediction Time)
预测时间是模型需要预测的未来轨迹的时间长度,代表模型的输出部分。例如:
- 预测时间为 8 秒,表示模型需要预测未来 8 秒的轨迹。
- 预测时间为 6 秒,表示模型预测未来 6 秒的轨迹。
预测时间决定了模型需要推测的未来轨迹的跨度。预测时间越长,模型的预测难度可能越大,因为需要在更长的时间跨度上推测运动趋势。
三者之间的关系
这三个因素的组合会影响输入输出的特征空间,具体关系如下:
-
采样频率和观测时间的关系:
采样频率决定了在观测时间内的采样点数量。例如,10Hz 采样频率下,1 秒观测时间内会有 10 个数据点,而 2 秒观测时间内会有 20 个数据点。因此,观测时间 × 采样频率 = 观测数据点的数量。 -
采样频率和预测时间的关系:
采样频率同样影响预测时间内的采样点数量。例如,8 秒预测时间在 10Hz 采样下会有 80 个数据点,而在 2Hz 采样下只有 16 个数据点。因此,预测时间 × 采样频率 = 预测数据点的数量。 -
观测时间和预测时间的关系:
观测时间和预测时间的比例决定了输入和输出之间的“跨度”关系。例如,如果模型使用 1 秒观测时间预测未来 8 秒的轨迹,模型的输入比输出少得多,需要根据短时的信息预测较长的未来。如果是 2 秒观测时间预测 6 秒未来,输入和输出的比值更接近,预测难度可能稍微减小。 -
三者共同影响特征空间的差异:
当不同的数据集具有不同的采样频率、观测时间和预测时间时,输入输出的轨迹分布和特征空间会有显著差异。例如:- 一个数据集可能是1 秒观测 + 8 秒预测 + 10Hz采样,输入输出点数是 10 和 80;
- 另一个数据集是2 秒观测 + 6 秒预测 + 2Hz采样,输入输出点数是 4 和 12。
这会导致输入和输出的特征在不同数据集中分布差异显著,使得模型难以在跨数据集的情况下泛化。
总结
- 采样频率决定了单位时间内的采样点数,影响轨迹的时间分辨率。
- 观测时间是输入数据的时间跨度,影响模型能观察到的轨迹长度。
- 预测时间是模型需要预测的时间跨度,决定了模型输出轨迹的长度。
- 三者的组合会影响输入和输出的特征空间,不同组合会导致不同的数据分布,使得模型在跨数据集时难以直接适应。
噪声的影响
这段话讨论了在轨迹数据集的采集过程中,由于传感器噪声和检测与跟踪误差带来的问题,以及它们对预测性能的负面影响。这些误差和噪声在不同的数据集中表现出独特的趋势和模式,从而给跨数据集的预测带来了额外的挑战。
具体来说,主要的问题包括:
-
传感器噪声和检测/跟踪误差:
轨迹数据集通常是通过从自车(ego-agent)传感器数据中检测并跟踪周围的目标物体(例如其他车辆或行人)来生成的。这些跟踪结果(tracklets)容易受到传感器噪声的影响,也可能因为检测和跟踪算法的精度不足而产生错误。这些噪声和误差会直接影响到后续模型的预测性能。 -
数据集特定的跟踪误差模式:
每个数据集的采集过程使用的传感器类型、检测器和跟踪器配置不同,导致不同数据集在跟踪误差上表现出独特的模式或趋势。不同数据集在噪声和误差的类型、分布和严重程度上有所不同,这使得模型在一个数据集上训练后,难以适应其他数据集的特定误差模式。 -
采样频率对噪声模式的影响:
跟踪噪声的模式还受到采样频率(时间步长配置)的影响。例如,较高的采样频率(即较小的时间步长 Δt)通常会导致更严重的噪声。文中提到 Argoverse 数据集比 nuScenes 数据集在相同的时间长度内表现出更严重的跟踪噪声,这可能是因为 Argoverse 的采样频率更高,因此更容易捕捉到微小的、但可能不准确的位移变化。 -
对预测性能的影响:
跟踪误差和噪声会导致模型的输入数据质量下降,从而降低模型的预测准确性。这种噪声还具有数据集特定的特点,增加了跨数据集迁移或泛化的难度,因为模型需要适应每个数据集特有的噪声模式。
总结
该段描述了由于传感器噪声、检测和跟踪误差带来的数据集特定问题,以及采样频率对噪声模式的影响。这些因素使得不同数据集在轨迹数据上表现出不同的噪声模式,给模型的跨数据集泛化和预测性能带来了挑战。这意味着在跨数据集预测中,除了领域差异,还必须考虑每个数据集特有的跟踪误差和噪声模式对模型的影响。
解决方案 处理时间步不同的问题
我们利用NSDE的连续表示来进行轨迹预测,以减少在任意时间混淆中收集的数据集之间的内部差异。
处理数据中存在噪声的问题
这里的第二个贡献点可以理解为,提出了一个特定于数据集的扩散网络框架及其训练方法,用于处理不同数据集中独特的跟踪误差。
具体来说:
-
数据集特定的扩散网络框架:
作者提出了一种框架,能够针对不同的数据集进行定制化处理,尤其是处理由于传感器、检测器和跟踪器配置的差异而导致的各数据集特有的跟踪误差(tracklet errors)。每个数据集的采集过程和配置不同,误差的类型、分布和严重程度也不同,这种特定于数据集的扩散网络框架能够识别和适应这些差异,从而提升预测性能。 -
训练方法:
提出了一个训练方法,使得这个数据集特定的扩散网络可以在有噪声和误差的情况下进行更有效的学习。扩散网络的设计使得它具有一定的随机性(stochasticity),因此可以更好地应对和纠正跟踪误差,增强模型的鲁棒性。
总结
这个贡献点的核心在于,作者为每个数据集设计了一个专门的扩散网络,以应对数据集采集过程中产生的特有噪声和误差。这种定制化的网络和训练方法能够帮助模型更好地处理不同数据集中的噪声模式和跟踪误差,从而提高预测的准确性和泛化能力。
实验=======》只使用了车辆轨迹
我们使用nuScenes(30k)和Lyft(160k)作为小规模的目标数据集,因为它们的规模相对较小。我们利用交互、Argogirse(200k)和WOMD(500k)数据集作为大规模的数据集进行额外的训练。为了利用数据集之间的公共信息,我们只使用过去/未来的轨迹和车道中心线信息。此外,虽然这些数据集同时有车辆和行人的轨迹数据,但为了简单起见,我们只训练和评估车辆的轨迹。为了展示我们的框架的有效性,我们选择了HiVT(Zhou等人. 2022)和MUSE-VAE(Lee et al. 2022)作为最新的回归和基于目标预测的轨迹预测方法,并表明即使是最先进的
设置不同的时间步
从实验设置和数据集的描述来看,本文的训练和预测方法大致如下:
训练过程
-
目标:
本文的目标是在目标数据集上的性能提升,并通过在大规模源数据集上的额外训练来实现。为了解决跨数据集传递性的问题,模型会联合多个数据集的训练集来训练,然后在目标数据集的验证集上评估。 -
训练数据组合:
- 基于回归的预测模型:
- 仅使用 nuScenes 训练集 (N)。
- 使用 nuScenes + Argoverse 训练集 (N+A)。
- 使用 nuScenes + WOMD 训练集 (N+W)。
- 基于目标条件的模型:
- 在 nuScenes 验证集上,模型只用 nuScenes 训练集 (N) 或 nuScenes + INTERACTION 训练集 (N+I)。
- 在 Lyft 验证集上,模型只用 Lyft 训练集 (L) 或 Lyft + INTERACTION 训练集 (L+I)。
- 基于回归的预测模型:
-
时间步配置的处理:
- 为了让基线模型适应不同的时间步配置,重新排列了两个数据集的时间序列数据。为每个时间步创建了空时间条,以对齐不同数据集的时间步配置。例如,在 nuScenes (2秒, 2Hz) 和 Argoverse (2/3秒, 10Hz) 的情况下,会创建 81 个 (2/6s, 10Hz) 的空时间条。
-
使用的数据集:
- 小规模目标数据集:nuScenes (30k samples) 和 Lyft (160k samples)。
- 大规模源数据集:INTERACTION, Argoverse (200k samples) 和 WOMD (500k samples)。
- 为了确保一致性,只使用了数据集中车辆的轨迹数据,并采用了历史/未来轨迹和车道中心线信息。
-
基线模型:
- 选择了 HiVT 和 MUSE-VAE 作为最新的基线方法,用于基于回归和目标预测的轨迹预测。
预测过程
-
验证集的评估:
- 在联合训练后,模型在目标数据集的验证集上进行预测和评估,特别是在 nuScenes 和 Lyft 验证集上。
-
评估指标:
- 使用 mADE10 作为评估指标(广泛使用的均方平均位移误差),用于衡量模型在目标数据集上的预测精度。
-
性能提升:
- 实验的重点在于通过融合多源数据集来提升模型的泛化能力和在目标数据集上的表现。即便是现有的最先进方法,通过融合作者提出的 SDE 框架仍然有改进空间。
总结
本文的训练过程是基于多源数据集联合训练,通过重新排列时间步配置来处理不同数据集的时间步差异。预测过程则在目标数据集的验证集上进行,并使用 mADE10 指标进行评估。通过这种方式,作者探索了如何利用源数据集的信息来增强目标数据集的性能,并展示了 SDE 框架的改进潜力。
A Graph-based Representation Framework for Trajectory Recovery via Spatiotemporal Interval-Informed Seq2Seq
general的问题,数据的低采样率
低采样率数据集在分析和利用城市环境中的轨迹数据时是一个巨大的障碍。这些限制往往导致重要任务的严重不准确性和空间差异,如估计出行时间[Wang等人,2022;张等人,2028],预测交通流量[李和朱,202121;Lan等人,2022]和轨迹相似度测量[Yao等人,2022;Han等人,2021]。因此,开发通过有效恢复轨迹内的缺失点来提高采样率的方法变得十分必要
轨迹数据specific的问题
在本文中,作者提出了现有轨迹数据处理方法中存在的三个特定问题,并指出这些问题会限制轨迹恢复的精度和有效性。以下是这三个具体问题的整理:
1. 忽视轨迹与道路网络的动态交互
- 问题描述:许多研究忽略了轨迹与道路网络之间的动态交互关系,仅关注静态的道路网络(即固定的道路拓扑结构),而未考虑穿行其中的动态轨迹信息。
- 影响:静态的道路网络只包含道路的连接关系和拓扑信息,但动态的轨迹信息(如车辆或行人实际经过的路径)对恢复缺失的轨迹至关重要。例如,在图 1 中,蓝色的轨迹点表明车辆经过的路径,而红色圆圈内的轨迹点缺失。如果不考虑轨迹动态信息,仅基于静态道路拓扑,难以准确恢复缺失的部分。
- 重要性:动态的轨迹信息可以为道路选择和轨迹补全提供有力的参考。因此,考虑轨迹与道路网络的动态交互有助于更精确地恢复缺失的轨迹点。
2. 缺乏整体和协同的时空轨迹表示
- 问题描述:大多数方法仅依赖于栅格信息或原始的 GPS 点作为输入,导致提取的轨迹表示缺乏整体性和协同性。
- 影响:使用栅格或单个 GPS 点的简单表示,无法捕捉轨迹在空间和时间上的全局特征以及点之间的协同关系,因而无法形成全面的轨迹表示。
- 重要性:轨迹是由多个点构成的时空序列,应该包含所有点的整体特征以及点与点之间的协同关系。更全面的轨迹表示能帮助模型更准确地理解轨迹的空间结构和时间变化趋势,从而提升轨迹恢复的效果。
3. 忽视序列模型中轨迹点之间的关键时空间隔
- 问题描述:许多研究依赖简单的序列到序列(seq2seq)模型,但忽略了轨迹点之间的时空间隔的作用。
- 影响:轨迹点之间的时空间隔包含重要的时空上下文信息。例如,间隔较小的轨迹点往往具有更高的关联性,而间隔较大的轨迹点关联较弱。如果不考虑这些间隔信息,模型无法准确捕捉轨迹点之间的关系,导致恢复结果不精确。
- 重要性:时空间隔反映了轨迹点的时间和空间分布特征,在轨迹恢复中尤为重要。忽略这些间隔会影响模型对轨迹整体结构的理解,削弱恢复的准确性。
总结
这三个问题共同指出了当前轨迹数据处理中对时空信息和动态交互的不足,具体包括:
- 忽视轨迹与道路网络的动态交互;
- 缺乏整体和协同的时空轨迹表示;
- 忽视轨迹点之间的关键时空间隔。
这些问题使得现有方法难以充分利用轨迹的时空特征,进而影响轨迹恢复的准确性。
轨迹-道路网络交互进行轨迹恢复任务。提出新任务
我们提出了一个新的框架,即GRFTrajRec1。据我们所知,GRNTrajRec是使用轨迹-道路网络交互进行轨迹恢复任务的第一次尝试
解决方案
轨迹和道路的交互 + 动态轨迹信息
我们引入了一种轨迹感知图表示来提取先进的道路嵌入,使我们能够深入理解轨迹和道路之间的相互作用,并考虑到动态轨迹信息的相互作用。此外,我们利用轨迹表示法来捕获每个轨迹点的时空特征。
针对时间间隔
我们提出了一个时空间隔通知的seq2seq模型,该模型结合了注意增强变压器和特征差异感知解码器,所有这些都考虑了点之间的时空间隔。该模型增强了道路和轨迹表征的集成,提取了轨迹点之间全面的时空背景信息。
实验=============》三种不同的缺失
本文的实验数据设置如下:
数据集
-
数据来源:
- 实验使用了三个真实世界的轨迹数据集及其对应的道路网络,这些道路网络来自 OpenStreetMap。
- 数据集名称:
- Porto 数据集:公开可用。
- YanCheng 和 NanJing 数据集:由公司合作伙伴提供。
- 每个数据集的详细统计信息列在表 1 中。
-
数据集划分:
- 每个数据集按 7:2:1 的比例划分为 训练集、验证集和测试集。
- 这种划分方式可以确保有足够的数据进行模型训练,同时留出部分数据用于验证和测试。
数据缺失类型(低采样轨迹的生成)
为了模拟轨迹数据中的缺失点情况,本文设置了三种不同的缺失类型,具体如下:
-
随机缺失(Random Missing):
- 缺失的轨迹点是随机分布的,即缺失点在整个轨迹中是散布的,没有固定的模式。
-
均匀缺失(Uniform Missing):
- 缺失的轨迹点均匀分布在整个轨迹中,确保缺失点在轨迹上以均匀的方式间隔分布。
-
块状缺失(Block Missing):
- 缺失的轨迹点形成一个连续的子轨迹段,即在轨迹中某个区间内的点是连续缺失的,形成一个缺失的区块。
数据缺失率
为了模拟不同程度的轨迹点缺失,本文采用了两种缺失率:
- 7/8 缺失率:在整个轨迹中,只有 1/8 的点被保留,其余 7/8 的点缺失。
- 15/16 缺失率:在整个轨迹中,只有 1/16 的点被保留,其余 15/16 的点缺失。
这两种缺失率参考了 RNTrajRec 的设置(Chen et al., 2023),能够测试模型在高缺失率下的恢复能力。
总结
实验使用了三个真实世界的轨迹数据集,并模拟了三种缺失类型(随机、均匀和块状缺失)和两种缺失率(7/8 和 15/16)。这种设置能够测试模型在不同缺失模式和缺失程度下的表现,以验证其轨迹恢复能力的有效性。
G2LTraj: A Global-to-Local Generation Approach for Trajectory Prediction
轨迹数据specific的问题
时空一致性的问题=========》由于没有考虑时间步之间的关联性,这种方法会导致各个时间步之间缺乏协调性或一致性。
这里的“约束”指的是未来轨迹点之间的时空一致性约束,即在预测轨迹时,需要考虑到各个时间步之间的动态关系和连续性,以确保生成的轨迹在物理上是合理的、符合运动规律的。
具体来说:
-
缺乏时空一致性:
传统的深度学习方法在预测轨迹时通常采用“同时预测”(simultaneous prediction)方法,即假设未来的每个时间步是相互独立的,然后一次性生成所有的未来轨迹点。由于没有考虑时间步之间的关联性,这种方法会导致各个时间步之间缺乏协调性或一致性。例如,两个连续的时间步预测的轨迹点可能相距过远,或者速度、方向不一致,导致轨迹出现“抖动”或“跳跃”的现象。 -
运动学不可行的预测:
由于忽视了时间步之间的约束,预测出来的轨迹可能会违反运动学规律,产生“运动学不可行”的结果(kinematically infeasible predictions)。这意味着预测的路径在实际中难以实现,因为缺少物理上的合理性,例如在短时间内急转弯或突然加速,这在图 1(a) 的 “GraphTERN” 示例中有体现。 -
G2LTraj的改进:
为了解决这些问题,G2LTraj 方法(图 1(b))引入了时空约束来生成一致的轨迹,确保每个时间步的预测都考虑了之前和之后的时间步。G2LTraj 采用“全局到局部”的生成策略,逐步生成关键时间点(例如 (t_1)、(t_9) 等),然后通过这些关键时间点来约束和生成中间时间点。这样可以保证轨迹的平滑性和一致性,使其符合实际的运动规律。
总结
这里的“约束”主要指的是确保未来时间步之间的时空一致性,以避免在生成轨迹时出现不合理或不符合物理规律的预测。G2LTraj 通过逐步生成关键点的方式引入这些约束,从而实现平滑和合理的轨迹预测。
使用rnn方式的缺陷 (会有一个累计误差)
另一方面,为了捕获未来步骤之间的时间约束,递归策略利用先前预测的时间步长来预测后续的步骤。然而,该策略在整个递归过程中都存在累积的误差[Bae和Jeon,2023],误差从初始步骤传播到fnal步骤。为了平衡未来步骤之间的累积误差和约束条件,[Jia et al.,2023a]同时生成所有未来步骤,并利用递归网络进行轨迹重构。然而,在更新过程中,累积误差仍然从最初步骤传播到初始步骤
解决方案
针对累计误差的问题=========》使用global-local
我们提出了一种全局到局部生成方法,以减少累积误差,并在未来步骤中引入约束。
针对动力学的问题==============》加入空间约束
为了提高运动学的可行性,我们提出了关键步骤之间的空间约束,并加强了中间步骤之间的时间约束。
针对数据异质性的问题============》为了保证每个轨迹的关键步骤的最优粒度,我们设计了一个可选择的粒度策略。
CDSTraj: Characterized Diffusion and Spatial-Temporal Interaction Network for Trajectory Prediction in Autonomous Driving
异质性问题=====================》主要是对象的异质性
在这篇文章中,轨迹数据的异质性主要体现在以下两个方面:
1. 异质性的定义
-
目标不确定性:交通场景中的目标(如车辆或行人)具有不确定性,不同目标的运动特征存在差异,并且不同目标的行为受到各种因素的影响。这种不确定性使得准确预测未来的运动轨迹变得复杂。
-
时空动态交互性:交通场景中存在着复杂的时空交互,不同的交通参与者(如车辆、行人)之间会在空间和时间上相互影响。这种交互的多样性导致轨迹数据具有异质性。例如,某些情况下,目标之间的空间关系更重要,而在其他情况下,时间因素对预测更为关键。
2. 针对数据异质性的解决方案
为了应对上述轨迹数据的异质性,作者提出了 CDSTraj 模型,该模型包含两个主要模块:
1. Characterized Diffusion Module(特征化扩散模块)
- 功能:该模块通过动态模拟未来交通场景,逐步减小不确定性,从而提高预测的准确性。
- 方法:利用扩散模型逐步迭代地生成未来的轨迹预测,整合复杂的上下文场景特征,从而实现更为细致的运动理解。
- 优点:这种方法能有效捕捉目标的不确定性,特别是在复杂情境下能够生成高保真的轨迹预测。
2. Spatial-Temporal Interaction Module(时空交互模块)
- 功能:该模块通过时空注意力机制,建模和分析交通场景中不同参与者之间复杂的时空交互关系。
- 架构:该模块采用三阶段架构,能够在不同尺度上高效地捕获并处理时空信息。
- 优点:通过时空注意力机制,模型能够更加精确地理解和模拟交通场景中的动态交互,从而提升轨迹预测的准确性。
总结
这篇文章将轨迹数据的异质性定义为目标的不确定性和时空交互的复杂性。针对这一异质性,文章提出了 CDSTraj 模型,通过 Characterized Diffusion Module 和 Spatial-Temporal Interaction Module 来分别处理不确定性和时空交互问题。这两个模块的结合可以帮助模型更好地捕捉复杂交通场景中的异质特征,从而提升轨迹预测的精度和可靠性。
尽管轨迹预测模型不断发展,但在深入研究异质性和不确定性的交通情景对未来运动的影响时,仍存在明显的差距。
从框架图中可以看到,该轨迹预测模型主要处理车辆的数据,包含三个模块:
1. Behavior-aware Module(行为感知模块)
- 功能:捕捉目标车辆及其周围车辆的行为特征。
- 内容:使用了一些中央性指标(例如 Katz、Power、Between、Eigenvector、Closeness、Degree)和行为感知准则(Behavior-aware Criteria, BCI, BTI, BMI)来评估每个车辆在场景中的重要性。然后,这些特征被传递到行为编码器(Behavior Encoder),进一步提取出行为特征。
- 输出:得到的行为特征通过 GRU 编码,得到目标车辆及周围车辆的行为信息,反映其行为上的相互影响。
2. Position-aware Module(位置感知模块)
- 功能:处理并编码车辆的空间位置信息。
- 内容:首先将位置点集合转换为位置向量,然后通过位置编码器(Position Encoder),通常是 LSTM,来生成位置特征。LSTM 编码器可以捕捉到不同时间步的位置信息。
- 输出:该模块的输出是车辆的位置信息特征,这些特征可以进一步融合在一起用于轨迹预测。
3. Interaction-aware Module(交互感知模块)
- 功能:捕捉目标车辆与周围车辆之间的交互信息。
- 内容:交互感知模块使用了一系列的适应性层(BN Adaptive)和 ReLU 激活函数,并结合了一个 Linformer 结构(简化版的 Transformer),来高效建模车辆之间的时空交互关系。该模块关注车辆之间的相对位置和速度等信息,以理解它们之间的复杂交互。
- 输出:生成的交互特征反映了目标车辆与周围车辆的相互影响。
Residual Decoder(残差解码器)
- 在三个模块的输出特征被融合之后,通过残差解码器对特征进行解码,以生成最终的轨迹预测。
- 结构:残差解码器包含了 Group Normalization 和全连接层(Fully Connected Layers),可以进一步提升模型的稳定性和性能。
总结
该框架中的 Behavior-aware Module 负责处理车辆的行为特征,Position-aware Module 负责捕捉位置信息,Interaction-aware Module 建模车辆之间的交互。通过这些模块的组合,模型可以更精确地预测目标车辆的未来轨迹,处理复杂的车辆行为和交互。
CausalTAD: Causal Implicit Generative Model for Debiased Online Trajectory Anomaly Detection
不同地点的泛化问题
然而,所有基于学习的方法都只能检测到SD对出现在历史轨迹数据集中的轨迹,而对未观察到的SD对表现较差,导致了分布外泛化问题。这个问题限制了这些方法的实际应用,因为训练数据集不能覆盖所有潜在的SD对,而且在现实中总是会有看不见的SD对。
从你提供的内容来看,本文的关键是在轨迹数据异常检测中的因果视角分析。具体来说,为了应对轨迹数据的异质性(主要来源于不同的出发地-目的地(SD)对及其隐藏的道路偏好因素),文章提出了一种名为 CausalTAD 的方法。该方法通过因果推断,解决了传统异常检测中的偏差问题。
异质性问题
这里的异质性主要是指由不同的出发地-目的地对(SD pairs)以及道路偏好带来的不同轨迹模式。每个 SD 对的轨迹模式会因为道路网络和用户偏好等因素而有所差异,从而使得数据呈现出异质性。
解决方案
-
双 VAE 模型:CausalTAD 包含两个变分自编码器(VAE),即轨迹生成 VAE(TG-VAE)和道路偏好 VAE(RP-VAE)。
- TG-VAE 用于学习每个 SD 对的轨迹模式,估计隐藏的轨迹表示。
- RP-VAE 则用于分解轨迹的去偏因子,将整个轨迹的偏差按路段分解,以更精确地估计每个路段的概率。
-
去偏因子:RP-VAE 利用道路网络的约束,以概率方式分解去偏因子,并将其应用于每个路段,从而实现轨迹的因果推断,消除因道路偏好带来的混淆效应。
-
实时检测:通过预计算并存储去偏因子,支持在线的轨迹异常检测。最终的异常检测时间复杂度为 (O(1)),提高了检测效率。
贡献
- 论文提供了轨迹生成过程的因果分析,是首个明确指出 SD 对分布和轨迹生成受道路偏好影响的工作。
- 提出了去偏轨迹异常检测任务,并通过 CausalTAD 来解决轨迹数据异质性问题,使得模型更具泛化性。
总体来说,CausalTAD 通过因果推断消除了轨迹数据中的异质性问题,使得轨迹异常检测更加准确。
AdapTraj: A Multi-Source Domain Generalization Framework for Multi-Agent Trajectory Prediction
地点的异质性
有鉴于此,对解决分布转移问题所带来的挑战的研究十分有限。例如,计数器[6]和mo[7]被设计为从一个域的轨迹学习可转移模型,并在应用于另一个域时保持其有效性,从而实现单源域泛化。不幸的是,单个域可用的实例数量相对有限,再加上源域和目标域之间的轨迹特征的显著差异,使得这些方法难以充分编码关于目标域中存在的变化的所需知识。
解决方案
为了解决这两个问题,我们提出了一个用于多智能体轨迹预测的多源域泛化框架,名为AdapTraj,它是一个适用于多种模型的插件和播放模块。为了缓解第一个问题,除了获得跨域一致的不变特征外,我们的目标是基于每个源域内的差异自适应地聚合特定领域的特征,从而捕获不变特征中忽略的更多样的个性化模式范围。
特别地,我们使用具有正交约束的提取器将每个域中包含的知识分割为域不变的和域特定的特征。利用这些解纠缠的特征,我们设计了一个教师学习过程,在这个过程中,提出的聚合器可以利用经过训练的提取器的集体经验来获得有效的领域特定特征,以适应在推理过程中不可见的领域呈现的轨迹
ITPNet: Towards Instantaneous Trajectory Prediction for Autonomous Driving
数据问题=================》历史轨迹的缺失
具体来说,我们提出了一种逆向预测机制,基于代理的两个观测位置,反向预测其未观测到的历史轨迹的潜在特征表示,然后利用它们作为未来轨迹预测的互补信息。同时,由于不可避免的噪声和冗余的存在预测潜在特征表示,我们进一步设计一个噪声冗余减少前(NRRFormer)模块,旨在过滤掉噪声和冗余的轨迹和过滤特性和观察特性集成到一个紧凑的查询表示未来的轨迹预测。
解决方案
是的,从你提供的描述来看,这里的方法确实涉及对历史轨迹中缺失数据的补全和去噪,然后再用于预测未来的轨迹。
具体方法
-
缺失数据补全:该方法会通过预测未观测到的历史轨迹位置(unobserved trajectory locations)来补全历史数据。通过补全这些缺失的轨迹特征,可以为观测到的轨迹提供更多的信息,以更好地预测未来轨迹。
-
去噪和冗余信息过滤:在补全未观测轨迹的过程中,随着补全数量的增加,模型的性能先提升后下降。这是因为:
- 噪声:预测的未观测特征可能不准确,导致噪声的引入。
- 冗余信息:补全的历史轨迹信息可能包含冗余部分,尤其是在轨迹变化(如突然转弯)发生之前。冗余信息会导致模型对连续性的信心增加,从而降低对轨迹转变的敏感度。
-
NRRFormer 模块:为了应对这些问题,文章设计了一个 Noise Redundancy Reduction Former (NRRFormer) 模块。该模块的功能是:
- 过滤噪声和冗余信息:通过一个紧凑的查询嵌入(compact query embedding),NRRFormer 可以从一系列预测的未观测特征中去除噪声和冗余信息。
- 特征融合:将过滤后的未观测特征与观测到的特征进行有效融合,以获得最有用的信息用于未来轨迹的预测。
-
可插拔架构:该方法可以无缝集成到现有的轨迹预测模型中,以提高其对瞬时轨迹预测的处理能力。
总结
因此,这个方法确实是对历史缺失数据进行补全和去噪,然后将其与观测数据结合,以更准确地进行未来轨迹的预测。NRRFormer 模块的设计正是为了应对缺失数据带来的噪声和冗余问题,使得模型能更好地处理轨迹中突然变化的场景。
1)我们设计了一种逆向预测机制来重建未观测到的历史轨迹信息用于瞬时轨迹预测,减轻了仅因两个观测位置而缺乏信息的问题。2)设计了一种噪声冗余减少前体(NRRrorter),可以消除预测未观测特征之间的噪声和冗余,进一步提高预测性能。
More Than Routing: Joint GPS and Route Modeling for Refine Trajectory Representation Learning
GPS轨迹+路径轨迹的融合
在实践中,联合建模两种类型的轨迹是非常重要的:(1)GPS轨迹的不确定性。GPS轨迹中存在大量的冗余信号和有噪声信号,严重影响了模型的计算效率和性能。(2)路线轨迹中存在复杂的时空相关性。当一个物体经过一个路段换位时,必须考虑路网的拓扑结构,而一个路段的行驶时间与历史交通模式和当前的行驶状态有关。(3)这两种模式的异质性。考虑到,虽然GPS轨迹和路径轨迹描述了相同的概念,但由于不同的视角,这两个数据源暗示了两个领域。融合来自不同领域的信息是一个挑战。此外,为了获得广义的轨迹表示,我们希望使用自监督范式来训练模型
解决方案
我们提出了一个基于多模态融合思想的轨迹表示学习框架,它名为JGRM。它包括一个用于建模道路实体特征的分层GPS编码器,一个考虑轨迹的时空相关性的路线编码器,和一个用于信息融合的模态交互器
为了解决这些问题,我们开发了一个新的表示学习框架,它基于自监督技术联合建模GPS和路由,即JGRM。它包含三个组件,GPS编码器、路由编码器和模态交互器,它们对应于上述三个挑战。具体来说,GPS编码器采用分层设计,通过路段分组自助法对相应的子轨迹进行编码,解决了GPS轨迹中的冗余和噪声问题。该路径编码器使用基于道路网络的空间编码器GE和轻量级时间编码器TE来捕获路径轨迹中的时空相关性。路线轨迹的自相关由路线编码器中的变压器捕获
最后,我们将这两种类型的轨迹视为两种模式,并使用共享变压器作为信息融合的模态交互器。我们还设计了两个自我监督的任务来训练我们的JGRM,分别是MLM(掩模语言建模)[7]和CMM(跨模态匹配)[15]。MLM通过恢复在轨迹被输入编码器之前被随机掩蔽的路段来获得监控信息。相比之下,CMM利用GPS和路径轨迹成对的事实,产生成对的损失,以引导两种模态在输入表示空间之前对齐表示空间。
TrajRecovery: An Efficient Vehicle Trajectory Recovery Framework based on Urban-Scale Traffic Camera Records
地点不同,如何转移
挑战2:如何将学习到的知识推广到未被观察到的路段?大多数现有的面向gps轨迹的恢复方法通常需要大量的观测轨迹数据来进行模型训练。当模型遇到训练数据中没有包含的路段时,它会遇到恢复方面的困难。然而,在现实生活中,有相当大比例的路段,特别是在郊区,缺乏摄像头覆盖。在这种情况下,如何将学习到的知识从观察到的路段推广到未观察到的路段是具有挑战性的。
对象不同
挑战3:如何实现考虑不同车辆移动性偏好的个性化轨迹恢复?在进行轨迹恢复时,以往的方法倾向于从粗粒度的角度平等地对待所有驾驶员,从而忽略了驾驶习惯中的偏好多样性。这种疏忽导致了不同车辆在相似的环境条件下恢复了相同的轨迹。因此,我们可以从驾驶员的历史行为中了解他们的驾驶习惯,从而实现细粒度的轨迹恢复。因此,如何学习驾驶员的驾驶习惯,实现个性化的轨迹恢复具有挑战性。
解决方案
为了解决挑战2,我们设计了一个空间转移概率模型(STPM),通过车辆快照捕捉摄像头覆盖路段的驾驶员转弯概率。为了将这一知识扩展到没有摄像头覆盖的地区,我们开发了一个运动-gat模块,通过聚集周围路段的特征来捕捉路段之间的内在连接和特征。通过将Motion-GAT模块纳入STPM,我们确保STPM强调道路条件对城市转弯的影响,而不是路段之间的特定转弯,从而实现更有效的知识转移。为了解决挑战3,我们在STPM中引入了开放注意模块,它将注意机制纳入到历史驾驶行为的检索中。通过利用驾驶习惯,OD-注意模块实现了车辆级的个性化轨迹恢复,避免了在相同的OD场景下产生相同的结果。
Learning to Hash for Trajectory Similarity Computation and Search
搜索的复杂性
尽管类似的轨迹搜索的重要性,精确搜索数据库与巨大的轨迹是费时的由于巨大的轨迹和二次计算的距离函数的复杂性,如动态时间扭曲(DTW)[15],弗雷切特距离[16],编辑距离与真正的惩罚(ERP)[17]。为了加速类似的轨迹搜索,提出了一些具有可容忍搜索误差的近似方法
基于神经的方法将计算查询轨迹与数据库中轨迹之间的所有距离,当数据库中轨迹的潜在向量不能持续地在主存中时,这不可能是一种有效的方法。因此,需要一种具有紧凑表示的数据结构来组织潜在空间进行修剪。此外,基于LSH的不同相似度度量方法需要特定的设计来实现可证明的碰撞概率,这很难从一个相似度度量推广到其他相似度量。据我们所知,现有的关于轨迹的LSH方法只能用于使用弗雷切特距离或豪斯多夫距离来测量轨迹之间的距离
解决方案
我们提出了一种轨迹数据的学习哈希方法,以支持快速相似度计算和top-k相似搜索。据我们所知,Traj2哈希是第一个学习轨迹数据的哈希方法。我们提出了一种双通道轨迹编码器,其中开发了一种轻量级网格表示和快速网格预训练方法,并专门为DTW和弗氏距离设计了一种低界诱导读出层。此外,通过我们的模型设计也保留了反对称特性。
Trajectory Similarity Measurement: An Efficiency Perspective
传统的方法
主要目的是利用深度学习来提高计算效率,最近引起了大量的兴趣。它们通常遵循以下步骤:(1)将轨迹编码为向量(称为轨迹嵌入),(2)计算轨迹嵌入之间的向量距离(如曼哈顿距离)作为轨迹
KGTS: Contrastive Trajectory Similarity Learning over Prompt Knowledge Graph Embedding
需要标签
虽然以往的方法已经对人们很好地进行了相似性的描述,但在某些方面仍存在一些问题。首先,现有的深度学习相似度计算工作需要大量的预处理。具体来说,这些研究通常依赖于监督学习,这需要将每对轨迹的相似性度量作为监督标签(Yang等2021;Han等2021;Yang等2022b)。然而,相似度度量在原始数据集中并不能直接可用,因此必须在数据集预处理过程中进行计算,需要大量的计算。假设数据集中有q个轨迹,每个轨迹都有l个点,因此计算所有轨迹对相似性的复杂度为二次为O(q 2 l 2)。因此,当原始数据集有许多较长的轨迹时,实现一个现成的数据集是非常昂贵的。
相似性的评定
这段文字讨论了在轨迹数据上训练模型面临的两个主要挑战,特别是在监督学习方法中。总结如下:
-
数据集的局限性:
- 轨迹模式不完整:真实数据集中无法包含所有可能的轨迹模式,换句话说,数据集中的轨迹样本并不“完备”(exhaustive)。这意味着,有些轨迹的“正样本”(即与之相似的样本)可能在数据集中缺失,或者数据集中的正样本并不总是与目标轨迹高度相似。
- 正样本的不一致性:监督学习方法通常依赖于数据集中的正样本来学习轨迹模式,但是有些轨迹的正样本可能在结构上并不完全相似,导致模型在学习时产生偏差。
-
距离与结构相似性的考虑:
- 以往的方法更关注轨迹之间的位置距离,而不是结构相似性。这意味着,如果两个轨迹在位置上接近,模型会认为它们相似,即使它们的结构(例如,转弯和路径变化)可能不同。因此,仅关注位置距离的模型可能会忽略轨迹的模式和结构,从而影响预测精度。
-
数据集的多样性和广泛性挑战:
- 要训练一个具有高泛化能力的模型,需要一个包含多样化轨迹关系的大规模数据集。然而,现实中要获得一个涵盖所有轨迹关系的完备数据集是不现实的。因此,模型可能会因为缺乏代表性样本而无法很好地泛化到新的、未见过的轨迹模式。
总结
这段话强调了在真实场景中进行轨迹预测的难点:
- 数据集不完备,导致缺乏全面的正样本。
- 以往方法更关注位置距离,而非轨迹结构的相似性。
- 大规模、多样性的轨迹数据集很难获得,从而限制了模型的泛化能力。
方法上的缺点
除了这些限制之外,现有的解决方案仍有提高性能的空间。一些研究(Li等人,2018;Yao等人,2019)没有使用专用模块来嵌入三种轨迹信息,即位置、结构和点的顺序,而其他依赖于过时的模块或无效的框架。
基于上述考虑,我们试图解决上述问题。对于第一个问题,我们采用了一种无监督的方法来减少计算标签的负担,这是通过对比学习来实现的。对于第二个问题,只是普通的数据增强(Deng et al. 2022)有很大的局限性,不足以进行相似性计算。我们提出了一种新的方法来缓解无监督方法的缺点。具体地说,这种增强方法旨在生成与原始轨迹相似的正样本。为了准确地提取空间信息,我们考虑了网格之间的关系,并试图通过知识图嵌入方法获得更好的网格表示
解决方案
首先,我们提出了一个包含网格嵌入和提示轨迹嵌入的框架KGTS。•其次,我们提出了用于轨迹网格嵌入的GRot,以鼓励空间相邻网格进行相似的嵌入,以及一个用于轨迹嵌入的即时轨迹嵌入模块,正确掌握轨迹的位置、结构和点顺序信息。•第三,我们使用新设计的正样本生成策略来训练提示轨迹嵌入模块。