会员
周边
众包
新闻
博问
闪存
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
_1024
Powered by
博客园
博客园
|
首页
|
新随笔
|
联系
|
订阅
|
管理
上一页
1
2
3
4
5
6
···
8
下一页
2018年7月12日
【论文阅读-Embedding】《GloVe: Global Vectors for Word Representation》
摘要: 0、摘要 GloVe综合了全局矩阵分解和局部窗口方法 1、介绍 词向量评估方法: 1)一般的词向量评估需要依赖pairwise的词向量的距离或者角度作为内在质量的评估; 2)w2v评估方式是使用了类比。 之前模型的缺点: 矩阵分解模型:利用了统计信息,但是在词模拟任务上表现不好,所以它只有次优的向量
阅读全文
posted @ 2018-07-12 15:11 _1024
阅读(276)
评论(0)
推荐(0)
编辑
2018年6月5日
机器学习的问题总结
摘要: 1、什么是ill-conditioned问题,会造成什么影响? 2、Momentum如何解决ill-conditioned问题?Momentum有何作用(减少方向上的波动)? 3、Xavier如何解决梯度爆炸问题?各种初始化方法的作用? 4、如何解决梯度消失问题?
阅读全文
posted @ 2018-06-05 14:16 _1024
阅读(92)
评论(0)
推荐(0)
编辑
2018年6月4日
预算平滑
摘要: 论文:<<Real Time Bid Optimization with Smooth Budget Delivery in Online Advertising>> 介绍两个部分: 1、预估未来消耗率 2、基于消耗率和先验分布来挑选展现和调整bid pacing-rate=bids/reqs 1、
阅读全文
posted @ 2018-06-04 18:53 _1024
阅读(179)
评论(0)
推荐(0)
编辑
2018年1月25日
ML基础番外篇-距离度量
摘要: 不同距离度量的不同含义
阅读全文
posted @ 2018-01-25 19:01 _1024
阅读(143)
评论(0)
推荐(0)
编辑
2018年1月10日
vim配置使用
摘要: ctags mac上的ctags配置 1、http://ctags.sourceforge.net从download源码,源码安装 2、which -a ctags查看ctags版本,观察到有两个版本 /usr/bin/ctags => orginal ctags /usr/local/bin/ct
阅读全文
posted @ 2018-01-10 14:56 _1024
阅读(140)
评论(0)
推荐(0)
编辑
2017年10月30日
强化学习 Note
摘要: 1、这篇note来自https://www.zybuluo.com/tinadu/note/629229 1.1、初步 作者认为,DRL可以用于解决通用人工智能问题,通用人工智能包含3部分: 通用任务:解决一般性任务,减少对领域知识的依赖;非线性的神经网络可以表征这一问题; 学习能力:学习分为归纳和
阅读全文
posted @ 2017-10-30 18:46 _1024
阅读(445)
评论(0)
推荐(0)
编辑
2017年10月23日
强化学习(David Silver)9:探索与利用
摘要: 1、介绍 1.1、探索方案的策略 1) 随机探索 2) 面对不确定性保持乐观: 估计不确定的值; 选择不确定最大的探索 3) 信息状态空间: 把代理的信息看做值的一部分; 考虑那些有助于提高reward的收益 1.2、探索的方式 1) 在状态-动作空间泰索 2) 在参数空间探索 优势: 连续探索 劣
阅读全文
posted @ 2017-10-23 19:04 _1024
阅读(1646)
评论(0)
推荐(0)
编辑
2017年10月22日
强化学习(David Silver)8:集成学习和计划
摘要: 1、介绍 这课中的规划就是预测 1.1、Model-Based的两层含义 agent学习环境从一个状态向另一个状态的转移 agent学习状态转移收益 ps: model的学习主体是agent 1.2、利弊 利: 通过监督学习高效学习; 解释model的不确定原因 弊: 学习模型+构造值函数, 叠加两
阅读全文
posted @ 2017-10-22 23:25 _1024
阅读(963)
评论(0)
推荐(0)
编辑
2017年10月20日
强化学习(David Silver)7:策略梯度算法
摘要: 1、简介 1.1、PolicyBased方法优劣 优势: 更好的收敛特性 在高维或者连续的action空间里面有效 可以学习随机策略 劣势: 收敛到局部最优,而非全局最优 policy估计训练慢、高方差,有时候没有值函数有效:ValueBased方法使用Max贪心优化跑得快; 策略梯度方法在梯度方向
阅读全文
posted @ 2017-10-20 19:52 _1024
阅读(1701)
评论(0)
推荐(0)
编辑
2017年10月16日
数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)
摘要: 1、最优化问题分类 按照约束条件分,可以分为:无约束优化问题、有不等式优化问题、有不等式优化问题。 按照是否线性,可以分为线性优化问题(目标函数和约束均线性)、非线性优化问题(目标函数和约束中任意部分非线性)。 按是否凸,可以分为凸优化问题、非凸优化问题。 对于有约束优化问题,常见的做法是转换到无约
阅读全文
posted @ 2017-10-16 22:08 _1024
阅读(2284)
评论(0)
推荐(1)
编辑
上一页
1
2
3
4
5
6
···
8
下一页