摘要: 流水线并行相关原理的学习笔记 阅读全文
posted @ 2024-06-26 22:06 SunStriKE 阅读(809) 评论(0) 推荐(1) 编辑
摘要: GPU进行卡间通信/多机通信的算法简介 阅读全文
posted @ 2024-06-17 19:56 SunStriKE 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 在CUDA程序中, 访存优化个人认为是最重要的优化项. 往往kernel会卡在数据传输而不是计算上, 为了最大限度利用GPU的计算能力, 我们需要根据GPU硬件架构对kernel访存进行合理的编写. 阅读全文
posted @ 2024-06-17 15:31 SunStriKE 阅读(1528) 评论(0) 推荐(1) 编辑
摘要: 介绍CUDA的基本概念和架构,帮助读者建立对CUDA的初步认识,包括硬件架构/CUDA基础等内容 阅读全文
posted @ 2024-06-06 19:49 SunStriKE 阅读(438) 评论(0) 推荐(0) 编辑
摘要: Paddle图神经网络训练, PGLBox代码阅读笔记, 主要为核心GPU游走相关逻辑, 分布式训练部分后续补充. 阅读全文
posted @ 2023-09-05 20:04 SunStriKE 阅读(352) 评论(0) 推荐(0) 编辑
摘要: 推荐系统中对embedding维度进行自动调优的常见方法 阅读笔记. 阅读全文
posted @ 2023-03-29 12:57 SunStriKE 阅读(137) 评论(0) 推荐(1) 编辑
摘要: 现代c++设计模式 part2 桥接,适配器,装饰器 阅读全文
posted @ 2023-03-24 19:22 SunStriKE 阅读(28) 评论(0) 推荐(0) 编辑
摘要: 现代c++设计模式 part1 工厂模式,建造者模式与单例模式的现代实现 阅读全文
posted @ 2023-03-24 19:21 SunStriKE 阅读(33) 评论(0) 推荐(0) 编辑
摘要: 结构式设计模式 享元模式:实现对象共享,减少内存开销; 代理模式,提供相同接口的代理 阅读全文
posted @ 2023-03-24 19:21 SunStriKE 阅读(43) 评论(0) 推荐(0) 编辑
摘要: 深度迁移学习综述, 里面讲了一些对于search/recommend system中的迁移学习应用 阅读全文
posted @ 2023-03-24 18:49 SunStriKE 阅读(75) 评论(0) 推荐(0) 编辑
点击右上角即可分享
微信分享提示
more_horiz
keyboard_arrow_up light_mode palette
选择主题