迁移学习

2017-06-09 10:34 xplorerthik 阅读(217) 评论(0) 收藏举报

给定源域Ds和目标域Dt，D={X,P(X)},并且给定源任务和目标任务 Ts 和 Tt，其中T={Y,P(Y|X)}.4种分法：

χs≠χt。源域和目标域的特征空间不同，例如，文档是用两种不同的语言写的

xs=xt，但P(Xs)≠P(Xt)。源域和目标域的边缘概率分布不同，例如，两个文档有着不同的主题。这个情景通常被称为域适应（domain adaptation）。

YS≠YT。两个任务的标签空间不同，例如，在源领域上的任务要求将文本分为2类，而目标领域的任务要求将文本分类10类

P（Ys|Xs）≠P（Yt|Xt）。源任务和目标任务的条件概率分布不同，例如，源和目标文档在类别上是不均衡的。这种场景在实际中是比较常见的

例如：贷后预警，预测3天后是否逾期，与预测未来133天后是否坏账，其特征的边缘分布是不一样的。

刷新页面返回顶部

xplorerthik