| | | |

2018年7月12日

【论文阅读-Embedding】《GloVe: Global Vectors for Word Representation》

摘要： 0、摘要 GloVe综合了全局矩阵分解和局部窗口方法 1、介绍词向量评估方法: 1)一般的词向量评估需要依赖pairwise的词向量的距离或者角度作为内在质量的评估； 2)w2v评估方式是使用了类比。之前模型的缺点：矩阵分解模型：利用了统计信息，但是在词模拟任务上表现不好，所以它只有次优的向量阅读全文

posted @ 2018-07-12 15:11 _1024 阅读(298) 评论(0) 推荐(0)

2018年6月5日

机器学习的问题总结

摘要： 1、什么是ill-conditioned问题，会造成什么影响？ 2、Momentum如何解决ill-conditioned问题？Momentum有何作用(减少方向上的波动)？ 3、Xavier如何解决梯度爆炸问题？各种初始化方法的作用？ 4、如何解决梯度消失问题？阅读全文

posted @ 2018-06-05 14:16 _1024 阅读(100) 评论(0) 推荐(0)

2018年6月4日

预算平滑

摘要：论文：<<Real Time Bid Optimization with Smooth Budget Delivery in Online Advertising>> 介绍两个部分： 1、预估未来消耗率 2、基于消耗率和先验分布来挑选展现和调整bid pacing-rate=bids/reqs 1、阅读全文

posted @ 2018-06-04 18:53 _1024 阅读(192) 评论(0) 推荐(0)

2018年1月25日

ML基础番外篇-距离度量

摘要：不同距离度量的不同含义阅读全文

posted @ 2018-01-25 19:01 _1024 阅读(177) 评论(0) 推荐(0)

2018年1月10日

vim配置使用

摘要： ctags mac上的ctags配置 1、http://ctags.sourceforge.net从download源码，源码安装 2、which -a ctags查看ctags版本，观察到有两个版本 /usr/bin/ctags => orginal ctags /usr/local/bin/ct 阅读全文

posted @ 2018-01-10 14:56 _1024 阅读(146) 评论(0) 推荐(0)

2017年10月30日

强化学习 Note

摘要： 1、这篇note来自https://www.zybuluo.com/tinadu/note/629229 1.1、初步作者认为，DRL可以用于解决通用人工智能问题，通用人工智能包含3部分：通用任务：解决一般性任务，减少对领域知识的依赖；非线性的神经网络可以表征这一问题；学习能力：学习分为归纳和阅读全文

posted @ 2017-10-30 18:46 _1024 阅读(463) 评论(0) 推荐(0)

2017年10月23日

强化学习(David Silver)9：探索与利用

摘要： 1、介绍 1.1、探索方案的策略 1) 随机探索 2) 面对不确定性保持乐观: 估计不确定的值; 选择不确定最大的探索 3) 信息状态空间: 把代理的信息看做值的一部分; 考虑那些有助于提高reward的收益 1.2、探索的方式 1) 在状态-动作空间泰索 2) 在参数空间探索优势: 连续探索劣阅读全文

posted @ 2017-10-23 19:04 _1024 阅读(1685) 评论(0) 推荐(0)

2017年10月22日

强化学习(David Silver)8：集成学习和计划

摘要： 1、介绍这课中的规划就是预测 1.1、Model-Based的两层含义 agent学习环境从一个状态向另一个状态的转移 agent学习状态转移收益 ps: model的学习主体是agent 1.2、利弊利: 通过监督学习高效学习; 解释model的不确定原因弊: 学习模型+构造值函数, 叠加两阅读全文

posted @ 2017-10-22 23:25 _1024 阅读(984) 评论(0) 推荐(0)

2017年10月20日

强化学习(David Silver)7：策略梯度算法

摘要： 1、简介 1.1、PolicyBased方法优劣优势：更好的收敛特性在高维或者连续的action空间里面有效可以学习随机策略劣势：收敛到局部最优，而非全局最优 policy估计训练慢、高方差，有时候没有值函数有效:ValueBased方法使用Max贪心优化跑得快; 策略梯度方法在梯度方向阅读全文

posted @ 2017-10-20 19:52 _1024 阅读(1757) 评论(0) 推荐(0)

2017年10月16日

数学基础01-最优化(梯度下降法、牛顿法、拟牛顿法等)

摘要： 1、最优化问题分类按照约束条件分，可以分为：无约束优化问题、有不等式优化问题、有不等式优化问题。按照是否线性，可以分为线性优化问题(目标函数和约束均线性)、非线性优化问题(目标函数和约束中任意部分非线性)。按是否凸，可以分为凸优化问题、非凸优化问题。对于有约束优化问题，常见的做法是转换到无约阅读全文

posted @ 2017-10-16 22:08 _1024 阅读(2535) 评论(0) 推荐(1)