liaojq2020

摘要：一、文章出处本文题为《Rate Control Method Based on Deep Reinforcement Learni... 阅读全文

posted @ 2021-01-03 16:10 liaojq2020 阅读(37) 评论(0) 推荐(0)

摘要：一、文章出处本文题为《Reinforcement Learning for HEVC/H.265 Intra-Frame Rate... 阅读全文

posted @ 2020-12-31 16:39 liaojq2020 阅读(26) 评论(0) 推荐(0)

摘要： Import packages import numpy as npimport randomimport tensorflow a... 阅读全文

posted @ 2020-12-22 08:01 liaojq2020 阅读(151) 评论(0) 推荐(0)

摘要：一、文章出处本文题为《Reinforcement Learning for Video Encoder Control in HE... 阅读全文

posted @ 2020-12-19 17:30 liaojq2020 阅读(31) 评论(0) 推荐(0)

摘要：一、文章出处本文题为《Comyco: Quality-Aware Adaptive Video Streaming via Imi... 阅读全文

posted @ 2020-12-18 15:03 liaojq2020 阅读(70) 评论(0) 推荐(0)

摘要：强化学习笔记专栏传送上一篇：强化学习RL学习笔记8-策略梯度（Policy Gradient）下一篇：持续创作中… 目录强化... 阅读全文

posted @ 2020-12-11 22:07 liaojq2020 阅读(341) 评论(0) 推荐(0)

摘要：强化学习笔记专栏传送上一篇：强化学习RL学习笔记7-表格型方法（tabular methods）下一篇：强化学习RL学习笔记9-... 阅读全文

posted @ 2020-12-10 22:40 liaojq2020 阅读(87) 评论(0) 推荐(0)

摘要：强化学习笔记专栏传送上一篇：强化学习RL学习笔记6-马尔可夫决策过程（MDP）(3) 下一篇：强化学习RL学习笔记8-策略梯度（P... 阅读全文

posted @ 2020-12-07 09:53 liaojq2020 阅读(206) 评论(0) 推荐(0)

摘要：目录前言一、排序模型读取排序特征返回排序后的结果LGB排序模型LGB分类模型DIN模型用户的历史点击行为列表DIN模型简介 ... 阅读全文

posted @ 2020-12-06 10:53 liaojq2020 阅读(98) 评论(0) 推荐(0)

摘要：强化学习笔记专栏传送上一篇：强化学习RL学习笔记5-马尔可夫决策过程（MDP）(2) 下一篇：强化学习RL学习笔记7-表格型方法（... 阅读全文

posted @ 2020-12-05 10:35 liaojq2020 阅读(41) 评论(0) 推荐(0)