摘要: 一、文章出处 本文题为《Rate Control Method Based on Deep Reinforcement Learni... 阅读全文
posted @ 2021-01-03 16:10 liaojq2020 阅读(37) 评论(0) 推荐(0)
摘要: 一、文章出处 本文题为《Reinforcement Learning for HEVC/H.265 Intra-Frame Rate... 阅读全文
posted @ 2020-12-31 16:39 liaojq2020 阅读(26) 评论(0) 推荐(0)
摘要: Import packages import numpy as npimport randomimport tensorflow a... 阅读全文
posted @ 2020-12-22 08:01 liaojq2020 阅读(151) 评论(0) 推荐(0)
摘要: 一、文章出处 本文题为《Reinforcement Learning for Video Encoder Control in HE... 阅读全文
posted @ 2020-12-19 17:30 liaojq2020 阅读(31) 评论(0) 推荐(0)
摘要: 一、文章出处 本文题为《Comyco: Quality-Aware Adaptive Video Streaming via Imi... 阅读全文
posted @ 2020-12-18 15:03 liaojq2020 阅读(70) 评论(0) 推荐(0)
摘要: 强化学习笔记专栏传送 上一篇:强化学习RL学习笔记8-策略梯度(Policy Gradient) 下一篇:持续创作中… 目录 强化... 阅读全文
posted @ 2020-12-11 22:07 liaojq2020 阅读(341) 评论(0) 推荐(0)
摘要: 强化学习笔记专栏传送 上一篇:强化学习RL学习笔记7-表格型方法(tabular methods) 下一篇:强化学习RL学习笔记9-... 阅读全文
posted @ 2020-12-10 22:40 liaojq2020 阅读(87) 评论(0) 推荐(0)
摘要: 强化学习笔记专栏传送 上一篇:强化学习RL学习笔记6-马尔可夫决策过程(MDP)(3) 下一篇:强化学习RL学习笔记8-策略梯度(P... 阅读全文
posted @ 2020-12-07 09:53 liaojq2020 阅读(206) 评论(0) 推荐(0)
摘要: 目录 前言一、排序模型读取排序特征返回排序后的结果LGB排序模型LGB分类模型DIN模型用户的历史点击行为列表DIN模型简介 ... 阅读全文
posted @ 2020-12-06 10:53 liaojq2020 阅读(98) 评论(0) 推荐(0)
摘要: 强化学习笔记专栏传送 上一篇:强化学习RL学习笔记5-马尔可夫决策过程(MDP)(2) 下一篇:强化学习RL学习笔记7-表格型方法(... 阅读全文
posted @ 2020-12-05 10:35 liaojq2020 阅读(41) 评论(0) 推荐(0)