10 2021 档案

摘要:前言 没有我想象中的难,毕竟站在前人的肩膀上,但还是遇到许多小困难,甚至一度想放弃 用时:两整天(白天) 目的:训练一个transformer模型,输入[1,2,3,4],能预测出[5,6,7,8] 最终效果:transformer model各层及维度符合预期,能train,predict还有一点 阅读全文
posted @ 2021-10-29 23:49 Rogn 阅读(3515) 评论(1) 推荐(0) 编辑
摘要:indexes转one-hot https://stackoverflow.com/questions/65424771/how-to-convert-one-hot-vector-to-label-index-and-back-in-pytorch https://pytorch.org/docs 阅读全文
posted @ 2021-10-29 14:15 Rogn 阅读(546) 评论(0) 推荐(0) 编辑
摘要:这样 ?这都能报错 啊这,我len怎么是个整数,难怪了 前面写过这么一句代码: 因此,把这个变量换个变量名吧 阅读全文
posted @ 2021-10-29 13:41 Rogn 阅读(307) 评论(0) 推荐(0) 编辑
摘要:ref: https://towardsdatascience.com/how-to-use-datasets-and-dataloader-in-pytorch-for-custom-text-data-270eed7f7c00 https://pytorch.org/tutorials/begi 阅读全文
posted @ 2021-10-29 11:26 Rogn 阅读(398) 评论(0) 推荐(0) 编辑
摘要:参考 https://blog.csdn.net/dong_liuqi/article/details/109823874 这种情况下,你还能发现batch_size为1时是不会报错的, batch_size为大于1会报错,报错的原因是同一batch中的entries的维数不一样 例如, batch 阅读全文
posted @ 2021-10-29 10:15 Rogn 阅读(2752) 评论(0) 推荐(0) 编辑
摘要:可见https://www.cnblogs.com/everfight/p/NotImplementedError.html 补充一个我遇到的情况: MultiHeadAttention继承了nn.Module,因此需要实现forward方法 然后 你说你实现了forward啊 但是 你fowrar 阅读全文
posted @ 2021-10-29 10:01 Rogn 阅读(120) 评论(0) 推荐(0) 编辑
摘要:原文 https://rockt.github.io/2018/04/30/einsum 就是说有一种运算,叫做einsum,可以做各种矩阵和向量的运算,而且特别简洁和优美 自己跑一下里面的例子,就知道是怎么回事了, 这里记录一下其中的tensor contraction,算是最general的形式 阅读全文
posted @ 2021-10-28 00:02 Rogn 阅读(110) 评论(0) 推荐(0) 编辑
摘要:视频1 https://www.youtube.com/watch?v=1_gRK9EIQpc&ab_channel=Hung-yiLee 视频2 https://www.youtube.com/watch?v=gh0hewYkjgo&ab_channel=Hung-yiLee Bert论文链接 h 阅读全文
posted @ 2021-10-27 15:00 Rogn 阅读(82) 评论(0) 推荐(0) 编辑
摘要:Hung-yi Lee李宏毅的课,没有废话,重难点都讲了,可以说是非常棒了 视频地址https://www.youtube.com/watch?v=ugWDIIOHtPA&ab_channel=Hung-yiLee 1. Seq2Seq采用RNN不能并行化,使用CNN代替RNN 例如CNN三角形选取 阅读全文
posted @ 2021-10-26 00:34 Rogn 阅读(497) 评论(0) 推荐(0) 编辑
摘要:如果之前使用的训练命令是 python train.py --device gpu --save_dir ./checkpoints 添加 -m paddle.distributed.launch 就能使用分布式训练,python -m paddle.distributed.launch train 阅读全文
posted @ 2021-10-19 18:59 Rogn 阅读(1166) 评论(0) 推荐(0) 编辑
摘要:做题一时爽,补题... 2042. 检查句子中的数字是否递增 签到题 class Solution: mymax = -1 def areNumbersAscending(self, s: str) -> bool: x_list = s.split() for x in x_list: if x[ 阅读全文
posted @ 2021-10-19 16:33 Rogn 阅读(91) 评论(0) 推荐(0) 编辑
摘要:试一下例子: Text classification examples https://github.com/huggingface/transformers/tree/master/examples/pytorch/text-classification 失败诶 记录 一个报错: 我在新的虚拟环境 阅读全文
posted @ 2021-10-18 11:20 Rogn 阅读(317) 评论(0) 推荐(0) 编辑
摘要:视频:https://www.bilibili.com/video/BV1Ly4y1L7aP 就是用google的一个gvisor项目去解决容器安全问题,它引进了user-kernel "感觉就是增加user-kernel层,但是这个user-kernel能跳过Linux kernel去管理网络和储 阅读全文
posted @ 2021-10-17 22:17 Rogn 阅读(123) 评论(0) 推荐(0) 编辑
摘要:安装 // 首先,创建一个虚拟环境 conda create -n my_paddle python=3.8 // 安装Paddle GPU版 // 没有加版本号会自动下载最新版 pip install paddlepaddle-gpu // 安装PaddleNLP pip install padd 阅读全文
posted @ 2021-10-17 21:38 Rogn 阅读(3500) 评论(0) 推荐(0) 编辑
摘要:有时候想给朋友分享一个文件,或者上传一个文件到服务器,需要一个中介,不会有人用百度网盘吧?? 主要考虑的因素:是否收费,空间与流量、上传与下载速度、是否提供外链 Storj DCS 国外产品,官网 优点:150G免费空间,无限免费流量,有外链 缺点:速度不是很快,上传1M左右,下载也是1M左右,用下 阅读全文
posted @ 2021-10-16 23:59 Rogn 阅读(397) 评论(0) 推荐(0) 编辑
摘要:1.安装 第一步:在 Anaconda官网 选择下载对应系统 Python3.7版本下载(Mac下载Command Line Installer版本即可)。 复制链接wget就行 第二步:安装,执行 bash Anaconda3-2021.05-Linux-x86_64.sh 安装过程中一直回车即可 阅读全文
posted @ 2021-10-16 17:14 Rogn 阅读(2811) 评论(0) 推荐(0) 编辑
摘要:大杂烩,基本翻译自 A brief introduction to XDP and eBPF The eXpress Data Path xdp-ebpf 简介 Kernel Bypass 在过去几年中,我们看到了编程工具包和技术的升级,以克服Linux kernel的限制,来进行高性能数据包处理。 阅读全文
posted @ 2021-10-15 16:40 Rogn 阅读(5090) 评论(0) 推荐(1) 编辑
摘要:有点激动,啊啊啊想明白了attention的含义,然后连着的一大片都能看懂了,茅塞顿开的感觉真好 1. 理解Self-Attention 超详细图解Self-Attention Q, K, V是啥啊??? 我们先看 $Softmax(XX^T)X$的含义 线性代数的知识: X乘X的转置,不就是当前行 阅读全文
posted @ 2021-10-14 11:43 Rogn 阅读(199) 评论(0) 推荐(0) 编辑
摘要:对 Linux内核之旅-BPF C编程入门 的笔记 先说一下,这里的BPF实际上是指eBPF,不是传统的cBPF 1.搭建BPF程序运行环境 1.1.下载内核源码 下载的内核版本应与你系统的版本一致,查看当前内核版本 uname -r 然后在源码镜像站点(http://ftp.sjtu.edu.cn 阅读全文
posted @ 2021-10-13 16:59 Rogn 阅读(3197) 评论(0) 推荐(0) 编辑
摘要:笔记: 一、P2Tree-LLVM基本概念入门 1. Chris Lattner nb 2. Clang的发音是/ˈklæŋ/,这是官方确认过的 3. IR的第三种表示是一种内存格式,只保存在内存中,所以谈不上文件格式和文件后缀,这种格式是LLVM之所以编译快的一个原因,它不像gcc,每个阶段结束会 阅读全文
posted @ 2021-10-10 14:32 Rogn 阅读(245) 评论(0) 推荐(0) 编辑
摘要:0.LLVM是什么 LLVM项目是可重用(reusable)、模块化(modular)的编译器以及工具链(toolchain)技术的集合,有人将其理解为“底层虚拟机(Low Level Virtual Machine)”的简称,但是官方原话为: “The name “LLVM” itself is 阅读全文
posted @ 2021-10-09 17:33 Rogn 阅读(1720) 评论(0) 推荐(0) 编辑
摘要:方法很多,记录两个简单有效的 第一种方法: 在github.com后面加 .cnpmjs.org例如我现在要用git下载gorm项目 https://github.com/babysor/MockingBird.git想要加速则使用指令 git clone https://github.com.cn 阅读全文
posted @ 2021-10-07 22:30 Rogn 阅读(224) 评论(0) 推荐(0) 编辑
摘要:Mark 拉取github报错 gnutls_handshake() failed: The TLS connection was non-properly terminated. 阅读全文
posted @ 2021-10-07 21:13 Rogn 阅读(1238) 评论(0) 推荐(0) 编辑