2017 年 10月 2 日随笔档案 - cofludy

2017年10月2日

摘要：原理上来说，共享内存是GPU上可受用户控制的一级缓存。在一个SM中，存在着若干cuda core + DP(双精度计算单元) + SFU（特殊函数计算单元）+共享内存+常量内存+纹理内存。相对于全局内存，共享内存的方寸延迟较低，可以达到惊人的1.5TB/s。而全局内存大约只有150GB/s。（最新的阅读全文

posted @ 2017-10-02 20:36 cofludy 阅读(12200) 评论(6) 推荐(0) 编辑

cofludy

公告