无线感知论文阅读笔记(二)——AIoT 时代的智能无线感知:特征、算法、数据集-2020.2

关键词

无线感知、信号特征、识别算法、数据集

文章概要

综述详情

背景

感知手段的发展:主观认识\(\rightarrow\)传感器\(\rightarrow\)​传感网。缺点是部署和维护长期稳定运行的大规模传感系统的难度和成本太高。可以利用环境中已有的无线信号(声、光、射频信号等)在完成本职任务(照明、通信等)的同时,“额外”用来感知环境。

无线感知技术的三个鲜明特点:无传感器、无线、无接触。

问题与挑战

  1. 有效特征湮没 :信号特征与背景环境相关,导致感知结果依赖部署环境,泛化能力差、学习训练成本高。

  2. 识别模型粗陋 :缺乏在无线信号空间对人的行为活动的精细时空建模,导致感知精度低、鲁棒性差。

    “需要在无线信号空间层对人的行为活动的精细时空建模”:已有的工作通常简单地使用计算机视觉领域的方法,直接在原始信号层次上进行识别,或者仅仅使用时间相关性或空间相关性,缺乏同时整合利用二者的有效手段,造成相似动作难以准确判别,在实际环境中感知精度低、鲁棒性差。

  3. 数据集缺失 :高质量公开数据集的缺失造成性能比较不客观、实验结果难复现、技术进步难积累。

特征

  1. 使用CSI取代RSSI:能获得多径信息以及相位信息,但相位信息通常受载波频率误差、采样频率偏差等因素的影响,通常包含较多噪声。因此CSI 相位信息必须先处理再使用。

  2. 波达角 (Arrival of Angle, AoA) 与飞行时间(Time of Flight, ToF):雷达信号与声音信号定位、 追踪目标时常用的两种特征。

    DoA:波达方向;AoA:波达角。

    波达方向是指空间信号的到达方向(各个信号到达阵列参考阵元的方向角,简称波达方向),波达角与波达方向是一回事。

    对于3D空间来说,DoA(或AoA)包括(θ,φ)。对于一个2D平面来说,DoA即为方位角θ。目前基于DoA的定位技术都是在2D平面的基础上进行的,此时DoA即为方位角θ。

    image-20220319003009349

    受多径效应与信号带宽的限制,在室内环境下准确估计经由目标反射而来的信号的 AoA 与 ToF 具有一定挑战性。已有工作观察到在发射机、接收机或目标只有微小位移时,经由目标一次反射而来的信号的 AoA 比其他多次反射信号的 AoA 更加稳定,而且多次反射信号可能只在某些接收机的 AoA 谱上出现。因此可通过多径压缩的算法,滤除多次反射信号,获得定位目标的方位信息。此外,在多天线的基础上,可利用子载波多样性进行空间平滑,从而利用多个数据包提升 AoA 估计精度。为了克服直接测量 AoA与 ToF 的不精确性,最新的研究工作RIM通过对天线阵列收到的 CSI 信息进行处理,测量移动目标的相对位移(位移方向、大小、速度等),创新性地利用无线射频信号实现了类似惯性传感器的功能,使得远距离目标追踪精度达到了 8.4 厘米。

  3. 多普勒频移:目标移动将导致经由目标反射的信号的路径长度产生变化,使得观测到的信号频率发生一定的偏移。对 CSI 功率进行时频分析(如短时傅里叶变换和小波变换),可从功率的动态变化中提取人体运动导致的 DFS。

    一些工作进一步观察到 :只有目标的径向速度分量对应着反射路径长度的变化速率,提取到的 DFS 和运动速度方向、人员位置存在着一定的几何约束关系。因此,通过添加更多链路可消除速度求解的歧义性,获得完整的人员速度信息,并应用于定位、追踪、活动识别等多种场景。

  4. 多维度信号特征的融合:通常可以取得比使用单一信号特征更好的感知效果,在只有一对收发设备的情况下,需要提取出尽可能多的参数,才能对目标进行细粒度的感知与定位。已有工作 [9] 将 CSI 建模成关于幅度衰减、DFS、ToF、AoA 的函数,使用基于期望最大化的算法对多径信道的多参数进行联合估计,并利用图匹配技术得到经由目标反射路径的长度与目标的方位信息的最优解,最终实现了单链路下的分米级被动式人员追踪系统。通过配置更多的发射天线,可对反射路径的 DFS、ToF、AoA 和出发角(Angle of Departure, AoD) 进行联合估计,进一步提升单链路下的感知精度。

  5. 人体坐标系下速度谱(BVP):与上述四点不同的是该特征属于环境无依赖的特征,它不受人员位置、朝向与背景环境等因素的影响,只反映人员活动本身的信息。

    以 BVP 为输入的感知分类器无须重复训练、收集额外数据等操作,即可实现跨位置、跨朝向、跨环境的活动识别。

识别算法

现阶段使用深度学习的方式。但往往使用基于计算机视觉领域的知识,忽视了视觉感知与无线感知在信号层面上的区别(电磁波频率、成像方式等),缺乏在无线信号空间对行为活动的精细时空建模,造成识别模型性能欠佳。

  1. Widar3.0利用卷积神经网络与循环神经网络分别挖掘输入特征 BVP 在空间维度与时间维度的特性。
  2. STFNets没有使用常规的卷积神经网络和循环神经网络,而是提出了一种新的基础神经网络构建模块——短时傅里叶神经网络,来直接学习多种传感输入在频域中的特征,并发现将信号转换到频域会极大地简化学习过程。

此外,为解决跨域的识别问题Widar3.0 通过挖掘环境无依赖的信号特征来提升泛化能力。与更专注在信号层面的 Widar3.0 不同,EI在模型设计上进行了探索——引入对抗学习的思想,通过设计更加复杂的网络结构,定义新的损失函数,在充分利用无标签数据的基础上,直接利用新的模型,学习信号特征在不同环境中的共性表达。

数据集

现有数据集:

  1. 多伦多大学与斯坦福大学于 2017 年公开了一个包含 4GB原始 CSI 信息的数据集,记录了 6 位用户的 6 种活动(躺、摔倒、走路、跑步、坐下、起立)。
  2. 威廉玛丽学院的研究团队于 2018 年公开了两种实验场景(办公室与住宅)下,6 位用户用 276 种手语表达时对应的原始 CSI 数据 [15]。
  3. 清华大学的研究团队于 2018 年公开了 1 位用户在三个场景的 80 条运动轨迹数据,可用于被动式定位与追踪的研究 [8, 9]。然而,已有的公开数据集大都存在数据量不足、应用场景少等问题。
  4. 作者团队在这方面做了进一步探索,公开了Widar3.0 的手势识别数据集。该数据集包含原始CSI 数据以及提取出的信号特征(DFS 和 BVP),包括 75 个不同场景下(包括不同位置、朝向与环境)采集的约 26 万组动作实例,总时长超过 144 小时,数据规模约为 325GB。
posted @ 2022-03-21 13:43  六十里  阅读(1202)  评论(0编辑  收藏  举报