06 2013 档案
摘要:在多线程应用中的资源优化依赖于处理器拓扑层级内相关联的Cache拓扑以及执行资源。在第7章中讨论了处理器拓扑以及标识处理器拓扑的一种软件算法。
在带有共享总线的平台中,总线系统被在SMT层以及在处理器拓扑的处理器核心层的多个代理所共享。因而多线程应用程序设计应该起始于管理对多个处理器代理可用的总线带宽的方法,这些处理器代理以一种合理的方式共享同一个总线连接。这可以通过提升独立应用程序线程的数据位置性或允许两个线程利用一个共享的L2 Cache(在这样的共享Cache中是可用的)来达成。
阅读全文
摘要:自从Apple从08年正式将自己的OpenCL提交到Khronos Group开放标准组织后,先后获得AMD、nVidia、Intel等大公司的支持。OpenCL能充分发挥GPU数据密集型大规模计算的能力,从而使得很多多媒体应用乃至科学计算能获得大幅度的性能提升。
这里将主要介绍如何在Windows 7中使用AMD APP SDK中的OpenCL。
阅读全文
摘要:Visual C++中使用内联纯汇编及其它
阅读全文
摘要:Intel64及IA-32架构优化指南第8章多核与超线程技术——8.7 前端优化 8.8 亲密性和共享的平台资源
阅读全文
摘要:高效的Cache操作是存储器优化的关键方面。Cache的高效操作需要注意以下几点:
阅读全文