TALLRec: An Effective and Efficient Tuning Framework to Align Large Language Model with Recommendation

Bao K., Zhang J., Zhang Y., Wang W., Feng F. and He X. TALLRec: An effective and efficient tuning framework to align large language model with recommendation, 2023.

LoRA 微调在推荐上的初步尝试.

TallRec

  • TallRec 实际上就是一种特殊的指令微调框架.

  • 一般的指令微调格式如下:

  • 规范了输入和输出的格式, 通过在这些输入输出对上进行微调, 是的 LLM 具备指令输出的能力.

  • 除了 Alpaca 所用的一些基本的指令数据, TallRec 额外设计了一些针对推荐任务的指令微调数据:

  • Rec Input: "User Preference: \(item_1, item_2, \ldots, item_n\). User Unpreference: \(item_2, item_3, \ldots, item_{n-1}\). Whether the user will enjoy the target movie/book: \(item_{n+1}\)." 其中 \(item_i\) 由物品的 ID 和 Title 构成.

  • Rec Output: "Yes./No."

  • 注: 故, TallRec 实际上是 CTR 任务.

  • 微调, 采用的是 LORA 微调, 即低秩部分.

代码

[official]

posted @ 2023-11-10 14:37  馒头and花卷  阅读(126)  评论(0编辑  收藏  举报