06 2022 档案
摘要:priority queue最大的特点是找出最大值只需要常数时间。 相比vector,push/pop则需要logn的时间;而vector是常数时间。 因此维护topk的问题最适合priority queue。 维护k大小的priority queue。超过时,取出top进行比较,然后根据情况是否p
阅读全文
摘要:TENSOR CORE PERFORMANCE: THE ULTIMATE GUIDE 1. 一个有意思的点,batch size / 108 整除的性能(TFLOPS)更好,因为A100的tensor core sm数为108. 见参考 参考: https://developer.download
阅读全文