摘要:
应用场景:加权采样,即按照随机事件出现的概率抽样 具体算法: 举例如上,随机事件出现的概率依次是1/2,1/3,1/12,1/12;记随机事件的个数为N,则所有事件概率乘以N后概率为2,4/3,1/3,1/3; 记队列small,large分别存放小于1和大于1的事件下标(例子中small=[0,1 阅读全文
摘要:
word2vec
负采样
目标函数
反向梯度
层次softmax
NPLM的目标函数和反向梯度
目标函数
反向梯度
GNN(图神经网络)
deepwalk
node2vec
附录 阅读全文
摘要:
缓存
缓存穿透
缓存雪崩(缓存失效)
缓存击穿(热点key)
缓存并发竞争(并发set)
数据一致性
缓存(双写)一致性
Redis集群(Redis-cluster)一致性原理
哨兵(Sentinel)模式
Redis集群产生的背景
Redis-cluster特点
分布式一致性hash(Consistent hashing) 阅读全文
摘要:
1.窗口函数
1.LAG(col,n,DEFAULT) 用于统计窗口内往上第n行值
2.LEAD(col,n,DEFAULT) 用于统计窗口内往下第n行值
3.FIRST_VALUE(col,false) 用于统计窗口内截止到当前行,第一个出现的值
4.LAST_VALUE(col,false) 用于统计窗口内截止到当前行,最后一个出现的值
5.over子句中的partition by和order by
6.over子句中的window子句(clause)
2.分析函数
1.标准聚合函数
2.RANK
3.DENSE_RANK
4.ROW_NUMBER
6.PERCENT_RANK
7.NTILE
3.应用场景 阅读全文