代码改变世界

迁移学习

2017-06-09 10:34  xplorerthik  阅读(190)  评论(0编辑  收藏  举报

给定源域Ds和目标域Dt,D={X,P(X)},并且给定源任务和目标任务 Ts 和 Tt,其中T={Y,P(Y|X)}.4种分法:

χs≠χt。源域和目标域的特征空间不同,例如,文档是用两种不同的语言写的

xs=xt, 但P(Xs)≠P(Xt)。源域和目标域的边缘概率分布不同,例如,两个文档有着不同的主题。这个情景通常被称为域适应(domain adaptation)。

YS≠YT。两个任务的标签空间不同,例如,在源领域上的任务要求将文本分为2类,而目标领域的任务要求将文本分类10类

P(Ys|Xs)≠P(Yt|Xt)。源任务和目标任务的条件概率分布不同,例如,源和目标文档在类别上是不均衡的。这种场景在实际中是比较常见的

例如:贷后预警, 预测3天后是否逾期,与预测未来133天后是否坏账,其特征的边缘分布是不一样的。