变异系数在fNIRS数据分析中有效性讨论
问题
变异系数又称CV,它是无量纲的,定义为概率分布离散程度的归一化程度。在概率论中常常用来作为比较两组数据离散程度的指标,其在fNIRS信号这类连续信号中常常用来检测通道的信号质量好坏,阈值包括0.1、0.15和0.25等,阈值越大越宽松,当某个通道的CV值超过设定的阈值时判定为坏道。之所以能够通过直接设定阈值来判定通道的好坏,就是因为它的无量纲性,不同数据集之间可以通过CV直接对比,此时各数据集可以理解为放置在一个分布中,在该分布中设定类似与0.05的判定阈值,便可得到通道的好坏。
那么是否CV值具有通用性呢?是否存在CV值失效的情况?
解答
上述问题的答案时肯定存在的。CV值并不是万能的。我们可以从公式中获取到一些信息。CV的计算表示为标准差与平均值之比,而均值是并不稳定,它容易受到极值的影响。结合fNIRS中普遍存在的运动伪影表现,此时极值的表现并不少见。因此,当整体数据还不错,但出现由运动伪影引起的极端值时,CV会不稳定。在实际数据处理时,可以考虑先进行伪影校正,再进行通道信号的好坏判定。
除此之外,当硬件设备出现损坏,通道之间并不能生成有效的信号,此时外界的规律信号(如外界光)被探测器检测到后,在数据中可能体现出有规律变化的数值,此时CV值并不会表现异常。
综上,在fNIRS数据分析过程中,如果对数据质量要求比较高,需要结合多个衡量离散程度的指标进行综合分析,如考虑纳入信息熵的内容等。