11 2019 档案
摘要:视频来源:新竹清华大学:并行计算与并行编程课程 一:SpeedUp Factor(加速比例): S(p)=Ts / Tp Ts :最好的串行算法所需的执行时间 Tp: 使用并行p个处理器所需的执行时间。 线性提速: S(p) = p 二:System efficiency: E(p) = Ts /
阅读全文
摘要:视频来源:新竹清华大学:并行计算与并行编程课程 上图结论:随着年限,计算力的增长很快,而I/O近于平缓,二者之间的差距增大,带来不利的影响。需要一些方法来处理这较大的差距。 解决方案: 1:I/O 内存等级:寻找新的硬件存储 2: 并行I/O:资源是分散式的,每一层最好是平行,可以发挥出最好性能。O
阅读全文
摘要:视频来源:新竹清华大学:并行计算与并行编程课程 概念: 相比常规计算机 超级计算机 具有高层次的计算能力。 计算能力性能的评估标准 FLOPS, 每秒处理的浮点操作数。 快的原因:(1)最新的硬件技术 (2)软件库的优化 (3) 定制系统的配置 (4)资源及金钱的消耗 通信主要用 infiniban
阅读全文
摘要:视频来源:新竹清华大学:并行计算与并行编程课程 分类:1.Flynn's classic taxonomy: 从哈佛结构 CPU的处理器做的分类,基于两个维度:指令及数据(GPU:属于SIMD) SISD:单指令,单数据 ,单指令是指在CPU的一个时钟周期 只有一条指令发生动作,单数据是指在CPU的
阅读全文
摘要:课程来源:新竹清华大学:并行计算与并行编程课程 (1)问:什么是并行计算? 答:用 很多 处理器(如 core)一起工作 来 解决同一个问题。 传统方法: 一个问题 -> 单个指令 -> 处理器 并行计算: 一个问题-> 多个指令 -> 分别对应的多处理器(更多的计算资源处理相同的计算量) (2)问
阅读全文
摘要:原文链接:https://www.cnblogs.com/qiang-upc/p/11407364.html (1)C/C++防止头文件被include多次的方法:#ifnde.. 及 #pragma once (2)二者都是宏实现 (3)#ifndef 不仅可以保证同一个文件不会被包含多次,而且可
阅读全文
摘要:原文链接:https://www.cnblogs.com/fengfengqingqingyangyang/p/3270432.html (1)typedef是用来定义关键字/标识符的别名,并未分配内存空间,发生在“编译”的过程中。(为标识符起别名) (2)#define 为宏定义,用于定义常量及宏
阅读全文