摘要: 程序优化的第一步就是消除不必要的内容,让代码尽可能有效地执行他期望的工作。消除不必要的函数调用、条件测试和存储器引用。程序优化的第二步利用处理器提供的指令级并行能力,同时执行多条指令,降低一个计算不同部分之间的数据相关,增加并行度。当一系列操作必须按照严格的顺序执行时,就会遇到延迟界限,因为在下一条指令开始之前,这条指令必须结束。当代码中的数据相关限制令处理器利用指令级并行的能力时,延迟界限能够限定程序性能。吞吐量界限刻画了处理器功能单元的原始计算能力。这个界限是程序性能的终极限制。循环展开能够从两个方面改进程序性能。首先,它减少了不直接有助于程序结果的操作的数量,例如循环索引计算和条件分支。 阅读全文
posted @ 2012-03-04 15:36 o0慢节奏0o 阅读(787) 评论(0) 推荐(0) 编辑