摘要: 书上25页 命令行缓冲区是一个循环队列(在锁页内存上),且有大小限制(书上说是几千) CPU调用GPU干活,就会往队列屁股后添加指令 GPU看到队列头有指令,就开始干活 受CPU限制,受GPU限制 受CPU限制:cpu繁忙,向命令行缓冲区写命令很慢,没有命令那gpu就闲下来了 受GPU限制:gpu繁 阅读全文
posted @ 2023-04-18 17:14 马角的逆袭 阅读(80) 评论(0) 推荐(0) 编辑
摘要: SM(流多处理器)和板块(block) 一个板块会被调度到一个SM上,直到执行结束 一个block一旦被调度到某个SM上,就会一直执行,直到执行结束(gpu不存在时间片轮转),好处是不需要像cpu一样切换上下文,就也不需要保存寄存器和共享内存的开销 一个block里的一个线程,则是被调度到一个SP上 阅读全文
posted @ 2023-04-18 17:14 马角的逆袭 阅读(169) 评论(0) 推荐(0) 编辑