07 2023 档案
摘要:In statistics and probability theory, the tilde means "is distributed as";[13] see random variable(e.g. X ~ B(n,p) for a binomial distribution). (http
阅读全文
摘要:先放上课程上有同学分享的思维导图:  划重点(用数学能更精确地描述强化学习的概念和过程): 强化学习:$O_t,
阅读全文
摘要:概率论与数理统计 $$ \begin{array}{ll} \operatorname{Pr}\{X=x\} & \text { probability that a random variable } X \text { takes on the value } x \\ X \sim p & \
阅读全文
摘要:图的作用: 图结构捕捉不同类型节点(即用户、项目和属性)之间丰富的关联信息,使我们能够发现协作用户对属性和项目的偏好。因此,我们可以利用图结构将推荐和对话组件有机地整合在一起,其中对话会话可以被视为在图中维护的节点序列,以动态地利用对话历史来预测下一轮的行动。 由四个主要组件组成:基于图的 MDP
阅读全文
摘要:论文: Multi-Task Recommendations with Reinforcement Learning 地址: https://arxiv.org/abs/2302.03328 # 摘要 In recent years, Multi-task Learning (MTL) has yi
阅读全文
摘要:论文:Multi-Task Recommendations with Reinforcement Learning 摘要:近年来,多任务学习(MTL)在推荐系统(RS)应用中取得了巨大成功。 然而,当前基于 MTL 的推荐模型往往忽略用户-项目交互的会话模式,因为它们主要是基于项目数据集构建的。 此
阅读全文
摘要:打开autodl,创建实例A100-PCIE-40GB * 1卡使用miniconda镜像。 ## 方法一:从huggingface下载 这个步骤不稳定我们换种下载方式 ```bash apt-get update apt install git-lfs git lfs install git cl
阅读全文