摘要:
5 性能分析方法 当您正在进行高级优化时,例如将更好的算法集成到应用程序中,通常很容易看出性能是否提高,因为基准测试结果通常很明显。从性能分析的角度来看,2 倍、3 倍等大幅提速相对明显。当你从程序中删除大量计算时,你会期望看到运行时间的明显差异。 但同样,在某些情况下,当你看到执行时间的微小变化, 阅读全文
posted @ 2025-03-31 15:48
磁石空杯
阅读(45)
评论(0)
推荐(0)
摘要:
4 性能分析中的术语和指标 与许多工程学科一样,性能分析也大量使用特殊的术语和指标。对于初学者来说,查看 Linux perf 或 Intel VTune Profiler 等分析工具生成的配置文件可能会非常困难。这些工具使用了许多复杂的术语和指标,但是,如果你打算从事任何严肃的性能工程工作,这些指 阅读全文
posted @ 2025-03-31 10:27
磁石空杯
阅读(33)
评论(0)
推荐(0)
摘要:
7 性能分析工具概述 在上一章中,我们探讨了现代处理器中用于辅助性能分析的功能。但是,如果直接开始使用这些功能,很快就会变得非常复杂,因为使用这些功能需要大量的底层编程。幸运的是,性能分析工具解决了有效使用这些硬件性能监控功能所需的所有复杂问题。 这使得剖析工作得以顺利进行,但直观了解此类工具如何获 阅读全文
posted @ 2025-03-13 21:15
磁石空杯
阅读(149)
评论(0)
推荐(0)
摘要:
1 安装 要成功编译、构建和安装 Numdiff,需要一些工具。首先是 ANSI C 编译器。该编译器至少应接受 -o 选项(将输出写入指定文件)、-D 选项(用于宏预定义)、-l 选项(搜索指定库)以及 -I 和 -L 选项(分别将指定目录添加到包含文件和库文件的搜索路径中)。 此外,你还需要一个 阅读全文
posted @ 2025-03-08 12:24
磁石空杯
阅读(18)
评论(0)
推荐(0)
摘要:
2 并行化规划 并行项目的规划步骤 版本控制和团队开发工作流程 了解性能容量和限制 制定程序并行化计划 开发并行应用程序或使现有应用程序并行运行,一开始可能会感觉具有挑战性。初涉并行化的开发人员往往不知道从何入手,也不知道可能会遇到什么陷阱。本章重点介绍开发并行应用程序的工作流模型。该模型提供了在开 阅读全文
posted @ 2025-03-05 19:46
磁石空杯
阅读(24)
评论(0)
推荐(0)
摘要:
1 引言 随着许多 Arm 硬件和软件合作伙伴开发应用程序并将其工作负载移植到基于 Arm 的云实例上,Arm Neoverse 生态系统正在大幅增长。随着基于 Neoverse N1 的系统广泛普及,许多实际工作负载显示出了与传统系统相比极具竞争力的性能和显著的成本节约。最近的一些例子包括 H.2 阅读全文
posted @ 2025-03-04 21:53
磁石空杯
阅读(69)
评论(0)
推荐(0)
摘要:
简介 粤港澳大湾区国家技术创新中心工业软件产业发展中心,是粤港澳大湾区国家技术创新中心直属创新平台之一。该中心致力于聚焦工业软件基础创新,构建工业软件全过程创新生态链,为推动我国工业软件产业发展做出重要贡献。 主要目标 攻克核心技术: 突破工业软件核心关键技术,提升我国工业软件的自主创新能力。 构建 阅读全文
posted @ 2025-03-03 19:50
磁石空杯
阅读(142)
评论(0)
推荐(0)