随笔档案「2019年2月」 - Django's blog

《Attention is All You Need》

摘要：https://www.jianshu.com/p/25fc600de9fb 谷歌最近的一篇BERT取得了卓越的效果，为了研究BERT的论文，我先找出了《Attention is All You Need》，看看里面的Transformer模型作为基础。 Transformer是为了机器翻译任务中的阅读全文

posted @ 2019-02-27 19:38 Django's blog 阅读(403) 评论(0) 推荐(0)

转:EM算法总结

摘要：https://applenob.github.io/em.html EM算法总结在概率模型中，最常用的模型参数估计方法应该就是最大似然法。 EM算法本质上也是最大似然，它是针对模型中存在隐变量的情况的最大似然。下面通过两个例子引入。没有隐变量的硬币模型假设有两个硬币，AA和BB，这两个硬币阅读全文

posted @ 2019-02-19 17:59 Django's blog 阅读(162) 评论(0) 推荐(0)

EM算法总结

摘要：https://applenob.github.io/em.html EM算法总结在概率模型中，最常用的模型参数估计方法应该就是最大似然法。 EM算法本质上也是最大似然，它是针对模型中存在隐变量的情况的最大似然。下面通过两个例子引入。没有隐变量的硬币模型假设有两个硬币，AA和BB，这两个硬币阅读全文

posted @ 2019-02-19 17:58 Django's blog 阅读(226) 评论(0) 推荐(0)

如何感性地理解EM算法？

摘要：https://www.jianshu.com/p/1121509ac1dc 如果使用基于最大似然估计的模型，模型中存在隐变量，就要用EM算法做参数估计。个人认为，理解EM算法背后的idea，远比看懂它的数学推导重要。idea会让你有一个直观的感受，从而明白算法的合理性，数学推导只是将这种合理性用更阅读全文

posted @ 2019-02-19 17:52 Django's blog 阅读(292) 评论(0) 推荐(0)

Django's blog

02 2019 档案

公告