会员
周边
众包
新闻
博问
闪存
赞助商
Chat2DB
所有博客
当前博客
我的博客
我的园子
账号设置
会员中心
简洁模式
...
退出登录
注册
登录
_1024
昵称:
_1024
园龄:
8年2个月
粉丝:
2
关注:
2
+加关注
搜索
常用链接
我的随笔
我的评论
我的参与
最新评论
我的标签
随笔分类
0_数学基础(3)
1_ML基础(8)
2_基础模型(10)
3_模型集成(4)
4_深度学习(4)
5_应用领域(5)
6_其他(3)
7_论文阅读-NLP(1)
7_论文阅读-词向量(1)
7_论文阅读-计算广告(10)
7_论文阅读-深度学习(3)
7_论文阅读-推荐系统(4)
8_课程学习-强化学习(David Silver)(10)
8_课程学习-统计自然语言处理(1)
9_问题整理(1)
vim(1)
更多
随笔档案
2018年8月(10)
2018年7月(1)
2018年6月(2)
2018年1月(2)
2017年10月(9)
2017年8月(13)
2017年6月(3)
2017年5月(5)
2016年12月(28)
阅读排行榜
1. 数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)(2416)
2. 强化学习(David Silver)7:策略梯度算法(1717)
3. 强化学习(David Silver)9:探索与利用(1662)
4. 强化学习(David Silver)1:简介(1354)
5. 强化学习(David Silver)6:值函数近似(1147)
评论排行榜
1. 强化学习(David Silver)6:值函数近似(1)
推荐排行榜
1. 数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)(1)
最新评论
1. Re:强化学习(David Silver)6:值函数近似
你好,我了解到的值函数近似不是上文提到的两种方法,而是参数近似以及非参数近似,其中参数近似里面包括一个线性近似的方法。
--hmj1
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
2018年8月21日
深度学习04-GAN
摘要: 1、GAN 2、各种变形
阅读全文
posted @ 2018-08-21 22:30 _1024
阅读(148)
评论(0)
推荐(0)
编辑
2018年8月20日
【论文阅读-Bidding】《LADDER: A Human-Level Bidding Agent for Large-Scale Real-Time Online Auctions》
摘要: Another
阅读全文
posted @ 2018-08-20 22:22 _1024
阅读(326)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Real-Time Bidding by Reinforcement Learning in Display Advertising》
摘要: Another
阅读全文
posted @ 2018-08-20 22:22 _1024
阅读(435)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Feedback Control of Real-Time Display Advertising》
摘要: today
阅读全文
posted @ 2018-08-20 22:21 _1024
阅读(356)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Optimized Cost per Click in Taobao Display Advertising》
摘要: Another
阅读全文
posted @ 2018-08-20 22:21 _1024
阅读(293)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Optimal Real-Time Bidding for Display Advertising》
摘要: today
阅读全文
posted @ 2018-08-20 22:20 _1024
阅读(362)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Programmatic Buying Bidding Strategies with Win Rate and Winning Price Estimation in Real Time Mobile Advertising》
摘要: Another
阅读全文
posted @ 2018-08-20 22:19 _1024
阅读(166)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Bid Optimizing and Inventory Scoring in Targeted Online Advertising》
摘要: Another
阅读全文
posted @ 2018-08-20 22:18 _1024
阅读(436)
评论(0)
推荐(0)
编辑
【论文阅读-Bidding】《Real-Time Bidding Algorithms for Performance-Based Display Ad Allocation,2011年,微软》
摘要: 0、摘要 已有的出价策略是投放粒度的,本文给出两种: 1)基于控制论的出价 2)基于历史Bindding Landscape的出价 1、介绍 出价优化的目标:在预算和库存限制下,求得平台利益最大化方案。 广告主预算无限的时候,直接按eCPM排序,平台利益最大。但是此策略在存在DSP时,是次优的。 当
阅读全文
posted @ 2018-08-20 22:17 _1024
阅读(496)
评论(0)
推荐(0)
编辑
2018年8月19日
ML基础番外篇-ABtest相关
摘要: 关于这个主题,涉及到以下问题: 1、大数定理 描述样本均值和真实均值的关系:样本足够大,样本均值倾向于真实均值 2、中心极限定理 描述样本均值和正太分布的关系:样本足够大,样本均值分布接近正太分布 3、置信度和置信区间 给定一个置信度,可以查表得出置信区间 4、假设检验 给出一个假设,从而基于这个假
阅读全文
posted @ 2018-08-19 20:59 _1024
阅读(134)
评论(0)
推荐(0)
编辑
下一页
点击右上角即可分享