《Deep Transfer Learning for Cross-domain Activity Recognition》阅读笔记
《Deep Transfer Learning for Cross-domain Activity Recognition》阅读笔记
零、Abstract
1、Background:
带标签的人类行为数据很难获取;而迁移学习可以将来自源域(source domain)的带标签的样本对标签很少/没有标签的目标域(target domain)进行注释。
2、Challenge:
多个源域的时候,如何选择正确的那一个呢?正确的源域应该和目标域有最相似的特性。
3、Proposed solution:
① USSAR:用于行为识别的无监督源域选择算法。可以从源域列表中选择最相似的K个源域。
② TNNAR:用于行为识别的迁移网络。在知识迁移过程中可以捕捉时空关系。
壹、Introduction
人类行为识别(HAR)可以通过低层次的传感器输入来判别高层次的信息,比如走路、跑步、睡眠监测等。
不同的身体部分有不同的行为模式,传感器可以收集活动数据随后构建机器学习模型。
从身体多个部位获得的数据可以反映人类健康信息或工作状态等。
但是!如果身体部位数据信号(目标域)遗失。。。
咋整呢??
只能通过利用其他部位的数据(源域)来帮助构建整个模型。
1、挑战点有四个
①不知道哪些身体部位和目标域有高的相似性,因为传感器信号之间是高度相关联的。如果用到和目标域没有相似性的身体部位,还可能会产生负迁移。
②只有原始的行为数据(没有标签),很难去判断相似性。
③即便有了源域和目标域的数据信号,因为不同的domain有不同的分布,使得构建好的机器学习模型依旧很困难。
④不同的人之间也有具有相似性的身体部位,使得问题更具挑战性。
2、解决(贡献点)
①源域的选择算法USSAR:通过计算源域和目标域之间的距离来选择最相似的源域。传感器信号之间存在两种关系(generic和specific),generic关系是指欧氏距离或者余弦相似性,specific是指两个身体部位之间的功能关系。通过计算这两种关系来获得两个domain之间的距离,然后选择正确的源域。
优点在于:不依赖目标域的标签。
②TNNAR:端对端的domain之间的知识迁移算法。
③在三个数据集(大规模、公开、从身体上多部位采集数据)上进行验证:OPPORTUNITY, PAMAP2, and UCI DSADS
贰、Related Work
1、行为识别
2、迁移学习
叁、Our Method
1、问题定义
目标域\(D_t\):需要学习的活动标签\(y_t\)(比如基于传感器信号预测人类的活动状态);
另外有\(C\)个活动状态/标签数;
\(M\)个有标签的源域\(D_s^i\);
还有记得不同的domain的数据分布是不同的。
需要设计的算法:
1)选择\(K\)个源域
2)执行有效的从\(D_s(K)\)到\(D_t\)迁移学习来获得\(y_t\)
2、无监督的源域选择USSAR
3、迁移神经网络TNNAR
肆、Experimental Evaluation
1、数据
2、USSAR的评估
3、TNNAR的评估
4、敏感性分析(Sensitivity Analysis)
伍、Conclusions and Future Work
总结:
USSAR可以从身体部位中捕获语义和运动信息,正确选择源域。
TNNAR可以学习行为的迁移表示。
展望:
将USSAR和TNNAR用于异构和远距离活动领域的活动识别。