会员
周边
众包
新闻
博问
闪存
赞助商
所有博客
当前博客
我的博客
我的园子
账号设置
简洁模式
...
退出登录
注册
登录
shiwuxian
导航
博客园
首页
新随笔
联系
订阅
管理
公告
2022年5月19日
知识图谱架构
摘要:
阅读全文
posted @ 2022-05-19 11:10 SHIWUXIAN
阅读(89)
评论(0)
推荐(0)
编辑
2022年4月13日
BERT注意力矩阵
摘要: BERT注意力矩阵
阅读全文
posted @ 2022-04-13 15:44 SHIWUXIAN
阅读(97)
评论(0)
推荐(0)
编辑
2022年3月31日
多头注意力机制
摘要: 注意力机制 橙色与绿色:输入的两个query。 K:key。 V:value 连线为权重,离的近的相似度高,同时权重就高,然后用权重乘以value就得到输出向量 多头注意力机制 MASK掩码:对t时刻(红色笔记)之后的数值,设为很大的负数(绿色笔记),从而将softmax变成0,起到只关注t时刻之前
阅读全文
posted @ 2022-03-31 17:26 SHIWUXIAN
阅读(1045)
评论(0)
推荐(0)
编辑
layernorm与batchnorm
摘要: batch竖切,对属性做normalization(规范化,标准化,正态化) layer横切,对每个样本单独做normalization
阅读全文
posted @ 2022-03-31 17:18 SHIWUXIAN
阅读(110)
评论(0)
推荐(0)
编辑