04 2021 档案

bert的训练数据的简单构建

摘要：一.简介大家都知道原始bert预训练模型有两大任务： 1.masked lm：带mask的语言模型 2.next sentence prediction：是否为下一句话 bert模型的训练数据有三部分，如下图： 1.字的token embeddings 2.句子的embeddings 3.句子位置阅读全文

posted @ 2021-04-06 15:19 石头木阅读(1064) 评论(0) 推荐(0) 编辑

语义匹配，cnn + self-attention孪生网络

摘要：一.模型结构实现一个简单的孪生网络（结构如上图），做语义相似度： 1.从上图可看出整体的结构相对较简单，左右两边基本一致。A句和B句分别进入左右两个结构。输入到网络中是token embedding + position_embedding 2.再经过cnn-encoder进行编码 3.多头注意力阅读全文

posted @ 2021-04-02 20:34 石头木阅读(1301) 评论(0) 推荐(1) 编辑

公告

昵称：石头木
园龄： 9年4个月
粉丝： 28
关注： 0

+加关注

2025年3月

日

一

二

三

四

五

六

石头木

https://jiangnanboy.github.io

04 2021 档案

公告

搜索

常用链接

我的标签

随笔分类

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论