上一页 1 ··· 9 10 11 12 13 14 15 下一页
摘要: Turing 架构 2018 年 Turing 图灵架构发布,采用 TSMC 12 nm 工艺,总共 18.6 亿个晶体管。在 PC 游戏、专业图形应用程序和深度学习推理方面,效率和性能都取得了重大进步。相比上一代 Volta 架构主要更新了 Tensor Core(专门为执行张量/矩阵操作而设计的 阅读全文
posted @ 2024-12-13 18:28 Khronos6 阅读(61) 评论(0) 推荐(0) 编辑
摘要: 1999 年,英伟达发明了 GPU(graphics processing unit),本文将介绍英伟达 GPU 从 Fermi 到 Blackwell 共 9 代架构,时间跨度从 2010 年至 2024 年,具体包括费米(Feimi)、开普勒(Kepler)、麦克斯韦(Maxwell)、帕斯卡( 阅读全文
posted @ 2024-12-13 18:27 Khronos6 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 本文会讲解英伟达 GPU 硬件的基础概念,其次会讲解 CUDA(Compute Unified Device Architecture)并行计算平台和编程模型,详细讲解 CUDA 线程层次结构,最后将讲解 GPU 的算力是如何计算的,这将有助于计算大模型的算力峰值和算力利用率。 GPU 硬件基础概念 阅读全文
posted @ 2024-12-13 18:27 Khronos6 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 为什么 GPU 适用于 AI 计算或者为什么 AI 训练需要使用 GPU,而不是使用 CPU 呢?本文内容主要探究 GPU AI 编程的本质,首先回顾卷积计算是如何实现的,然后探究 GPU 的线程分级,分析 AI 的计算模式和线程之间的关系,最后讨论矩阵乘计算如何使用 GPU 编程去提升算力利用率或 阅读全文
posted @ 2024-12-13 18:26 Khronos6 阅读(6) 评论(0) 推荐(0) 编辑
摘要: 前面的文章对 AI 计算体系和 AI 芯片基础进行讲解,在 AI 芯片基础中关于通用图形处理器 GPU 只是简单地讲解了主要概念,将从 GPU 硬件基础和英伟达 GPU 架构两个方面讲解 GPU 的工作原理。英伟达 GPU 有着很长的发展历史,整体架构从 Fermi 到 Blankwell 架构演变 阅读全文
posted @ 2024-12-13 18:26 Khronos6 阅读(7) 评论(0) 推荐(0) 编辑
摘要: 在本文中我们要从更远的视角来看看计算机架构发展的黄金 10 年,主要将围绕异构计算和超异构来展开。在开始具体内容前,我们非常推荐您观看以下两个视频: 计算机架构的新黄金时代:A New Golden Age for Computer Architecture 编译器的黄金时代:The Golden 阅读全文
posted @ 2024-12-13 18:24 Khronos6 阅读(15) 评论(0) 推荐(0) 编辑
摘要: 近年来,随着 AI 技术的飞速发展,AI 专用处理器如 NPU(Neural Processing Unit)和 TPU(Tensor Processing Unit)也应运而生。这些处理器旨在加速深度学习和机器学习任务,相比传统的 CPU 和 GPU,它们在处理 AI 任务时表现出更高的效率和性能 阅读全文
posted @ 2024-12-13 18:23 Khronos6 阅读(11) 评论(0) 推荐(0) 编辑
摘要: GPU 是 Graphics Processing Unit(图形处理器)的简称,它是计算机系统中负责处理图形和图像相关任务的核心组件。GPU 的发展历史可以追溯到对计算机图形处理需求的不断增长,以及对图像渲染速度和质量的不断追求。从最初的简单图形处理功能到如今的高性能计算和深度学习加速器,GPU 阅读全文
posted @ 2024-12-13 18:23 Khronos6 阅读(13) 评论(0) 推荐(0) 编辑
摘要: CPU(中央处理器)是计算机的核心组件,其性能对计算机系统的整体性能有着重要影响。CPU 计算时延是指从指令发出到完成整个指令操作所需的时间。理解 CPU 的计算时延对于优化计算性能和设计高效的计算系统至关重要。在本文中我们将要探讨 CPU 的计算时延组成和影响时延产生的因素,并深入讨论 CPU 计 阅读全文
posted @ 2024-12-13 18:22 Khronos6 阅读(14) 评论(0) 推荐(0) 编辑
摘要: 本文将深入探讨 CPU 的计算性能,从算力的敏感度和不同技术趋势中分析影响 CPU 性能的关键因素。我们将通过数据和实例,详细解释 CPU 算力的计算方法、算力与数据加载之间的平衡点,以及如何通过算力敏感度分析来识别和优化计算系统中的性能瓶颈。此外,我们还将观察服务器、GPU 和超级计算机等不同计算 阅读全文
posted @ 2024-12-13 18:22 Khronos6 阅读(10) 评论(0) 推荐(0) 编辑
上一页 1 ··· 9 10 11 12 13 14 15 下一页