AD预测论文研读系列2
EARLY PREDICTION OF ALZHEIMER’S DISEASE DEMENTIA BASED ON BASELINE HIPPOCAMPAL MRI AND 1-YEAR FOLLOW-UP COGNITIVE MEASURES USING DEEP RECURRENT NEURAL NETWORKS
(基于基础海马MRI和1年随访认知测量的阿尔茨海默病痴呆早期预测)
摘要
多模生物学、影像学和神经心理学标记物已经展示了区分阿尔茨海默病(AD)患者和认知正常的老年人的良好表现。然而,早期预测轻度认知功能障碍(MCI)患者何时和哪些会转变为AD痴呆仍然困难。通过模式分类研究表明,基于纵向数据的模式分类器比基于横截面数据的模式分类器具有更好的分类性能。研究人员开发了一个基于递归神经网络(RNN)的深度学习模型,以学习纵向数据的信息表示和时间动态。将个体受试者的纵向认知测量,与基线海马MRI相结合,建立AD痴呆进展的预后模型。大量MCI受试者的实验结果表明,深度学习模型可以从纵向数据中学习信息性测量,以描述MCI受试者发展为AD痴呆的过程,并且预测模型可以以高精度在早期预测AD进展。最近的研究表明,如果使用纵向而非横截面数据构建分类器,可以获得更好的性能
引言
大多数基于纵向数据的预测模型要求不同的对象在同一时间点上拥有数据。然而,缺乏数据是纵向研究中普遍存在的问题。这种问题通常通过输入缺失的数据来规避。多元功能主成分(MFPC)评分被用来代表纵向制造商处理缺失或不规则数据。然而,mfpc采用了一定的假设来模拟潜在的纵向过程,这可能不适用于不同类型的标记
在本研究中,采用LSTM自动编码器从纵向认知测量中学习紧凑的和信息性的表征,以预测MCI受试者发展为AD痴呆。这些表征可以编码纵向认知测量的时间动态,并表征MCI受试者的进展轨迹,而无需对测量背后的纵向过程作出任何明确的假设。根据所学的表达和海马体MRI基线数据,建立了一个时间到事件的预测模型。特别是采用了Cox回归模型来评估MCI患者发展为AD痴呆的风险。实验结果表明,该模型可以获得有希望的预后表现,认知测量和基于成像的测量可以为预后提供补充信息
方法和材料
为了建立基于纵向数据的AD痴呆早期预测模型,首先训练一个LSTM自动编码器学习每个受试者纵向测量的紧凑表示和时间动态编码。然后,将学习的表示与基线成像数据作为特征相结合,在时间到事件分析设置下建立预后模型
数据
参与人员信息
从ADNI-1、GO&2获得822名MCI受试者在基线、6个月和12个月时的认知测量,包括13项版本的阿尔茨海默病评估量表认知子量表(ADAS-COG13)、Rey听觉语言学习测试(RAVLT)即时、RAVLT学习、功能评估问卷(FAQ)和微型精神状态测试(MMSE)。对受试者进行基线结构MRI扫描,以提取海马成像测量值
基于LSTM的特征表示
考虑到每个受试者在多个时间点的纵向认知测量,学习了信息性和紧凑的表示,以编码受试者的总体纵向认知表现及其跨多个时间点的时间变化/轨迹。LSTM自动编码器为实现这一目标提供了一个理想的工具
LSTM自动编码器
编码器接收多个时间点的输入数据,处理连续时间点之间输入测量值及其时间动态的编码。译码器是利用编码器的学习表示,在不同的时间点,按照相反的顺序逐步重建输入测量值。在对网络进行优化以最小化重构和输入度量之间的偏差的同时,期望编码器的学习表示能够表征输入纵向度量的整体认知性能及其动态
自动编码器包含两个分别用于编码器和解码器的LSTM层。\(f_t和f^`_t\)是在时间点t(t=1,2,3)的输入和重构的认知测量。\(W_{ei}\)是编码器第\(i\)层LSTM的可训练参数,\(W_{di}\)是解码器第{i}层LSTM的可训练参数。可训练的参数包括遗忘门、输入门、单元状态和一个LSTM层内的隐藏状态。以重构测度与输入测度之间的欧氏距离为目标函数,对可训练参数进行优化。选择LSTM层的数量,以在少量可训练参数的情况下实现可推广的性能
在本研究中,认知测量的自动编码器是建立在ADNI-1队列受试者的纵向认知测量基础上的。获得自动编码器后,将编码器应用于ADNI-1和GO&2队列的所有MCI患者,从纵向认知测量中提取其潜在特征,然后用于后续的预后分析
预测建模
考虑到纵向认知信息的潜在表现,将其与基于海马MRI的基线测量相结合,使用Cox回归建立预后模型。特别的,认知测量包括ADAS-COG13、RAVLT即时、RAVLT学习、FAQ和MMSE用于学习LSTM编码的认知测量。使用基于深度学习的预后框架,将基线海马MRI数据的成像特征提取为基于成像的进展为AD的风险。在模型中,年龄、性别、教育年限和基线时的apoeε4状态被用作协变量
时间到事件预测模型的示意图
以ADNI-1的MCI受试者数据为基础,建立Cox回归模型,并以ADNI-GO&2的MCI受试者数据为基础,评价其预后
结果
实验设置
采用了两个LSTM层,每个LSTM层中的隐藏节点数设置为5(LSTM编码的认知度量的维数与每个时间点的输入认知度量的维数相同)。采用Adam优化技术对自动编码器进行优化,将基本学习速率设置为0.01,并在每20000次迭代后将学习速率降低0.1倍,使用逐步策略进行更新。训练程序的最大迭代次数设置为100000,批大小设置为64
实验结果
基于任意一次访问数据的预测模型比基于纵向数据的预测模型预测性能差,基于后时间点数据的预测模型比基于前时间点数据的预测模型具有更好的性能。当LSTM编码的认知表征与来自基础海马MRI数据的基于成像的特征相结合时,获得了最佳的预后表现,表明临床测量和成像数据可以为预后提供补充信息。此外,如果将纵向成像数据纳入预测模型中,可以进一步提高预测性能
结论
在这项研究中,开发了一种基于深度学习的方法来描述认知测量的纵向动力学特征,并建立了基于基础海马MRI测量和学习的纵向动力学的预测模型来预测个体MCI受试者向AD的进展。评价结果表明,该模型在1年的随访期内,对预测MCI受试者发展为AD具有良好的效果
注:
sMCI: stable MCI who remained as MCI at the last visit
pMCI: progressive MCI who converted to AD before the last visit