摘要: bert 论文阅读 一、模型结构 是一个多层的双向transformer encoder 注意 这里tranformer模型输入的是embedding后的词向量 二、 "输入编码" 可以编码一个单句或一串单句 Token Embedding 每个词被表示成一个768维的向量 CLS表示开始符号 SE 阅读全文
posted @ 2019-08-12 18:13 FromZeroToOne 阅读(630) 评论(0) 推荐(1) 编辑
摘要: windows cuda10 安装 1. "下载cuda" 和cudnn 2. "参照视频" 3. 测试: nvcc V pytroch 安装 "链接" tensorflow安装 阅读全文
posted @ 2019-08-12 13:35 FromZeroToOne 阅读(1018) 评论(0) 推荐(0) 编辑