Billion-scale Commodity Embedding for E-commerce Recommendation in Alibaba
阿里发的论文,主要参考了deepwalk的方法,用作推荐系统召回向量。引入了“side information” 信息,比如品牌、价格等性质的embedding 来解决冷启动的问题
Unified Language Model Pre-training for Natural Language Understanding and Generation
利用bert的mask机制实现seq2seq。例如对于语言模型的任务可以实现一个“对角”的mask,从而在某个token 进行attention时只会attention这个token之前的token,这与单向语言模型性质相符。在seq2seq时,encoding 时用的是双向的attention而在decoding阶段用的是单向attention,既在生成序列时只能关注之前出现的token。用这种方法能直接用一个bert实现seq2seq任务。