摘要:
Droupout与Batch Normalization都是深度学习常用且基础的训练技巧了。本文将从理论和实践两个角度分布其特点和细节。 Droupout 2012年,Hinton在其论文中提出Dropout。当一个复杂的前馈神经网络被训练在小的数据集时,容易造成过拟合。为了防止过拟合,可以通过阻止 阅读全文
摘要:
Graph Embedding是推荐系统、计算广告领域最近非常流行的做法,是从word2vec等一路发展而来的Embedding技术的最新延伸;并且已经有很多大厂将Graph Embedding应用于实践后取得了非常不错的线上效果。 word2vec和由其衍生出的item2vec是embedding 阅读全文
摘要:
这是Leetcode第287题,给定一个包含n + 1个整数的数组,其中每一个整数均介于[1, n]之间,证明其中至少有一个重复元素存在。假设只有一个数字出现重复,找出这个重复的数字。 这道题可以用计数排序的思路求解,但更为巧妙的方法是使用 快慢指针 求解。 基本思想是将数组抽象为一条线和一个圆环, 阅读全文
摘要:
Word2vec 本质上是一种降维操作——把词语从 one hot encoder 形式的表示降维到 Word2vec 形式的表示,即 Distributed Representation 。也就是,通过Embedding把原先词所在空间映射到一个新的空间中去,使得语义上相似的单词在该空间内距离相近 阅读全文