GPU编程中UMA的作用及限制

1. UMA和hUMA

传统的UMA由于CPU和GPU各自cache的独立性,如果不能很好的处理cache同步,那么轻则访问速度变慢,重则数据出错。AMD提出的hUMA解决了这一问题,保证了cache层的数据一致性

2. UMA的限制

  • UMA不解决读回的速度慢的问题。读回渲染结果的三件事情:同步->拷贝->untile。由于PCIe是对称的,所以重点问题一般出在同步上。
  • UMA不能显著地提升性能。如前所述,在硬件支持hUMA且可以渲染untile数据的前提下才能节省拷贝的时间,即便如此,拷贝所占时间很少,所以不能显著提升性能
posted @ 2017-09-27 11:26  层序圆儿  阅读(477)  评论(0编辑  收藏  举报