随笔分类 - 高性能计算MKL
摘要:cuSOLVER是NVIDIA提供基于cuBLAS和cuSPARSE库的GPU加速的线性代数操作算子库,其专注于稠密和稀疏矩阵的高级线性代数运算
阅读全文
摘要:cuDNN,全称为NIVIDIA CUDA Deep Neural Network Library,是深度神经网络算子层级GPU加速库集合,提供了深度学习算法中常见算子的高效实现,
阅读全文
摘要:cuFFT是NVIDIA提供的GPU加速的Fourier变换FFT库,能极大提升涉及FFT计算的科学计算、信号处理和深度学习等任务的速度。本笔记就cufft进行简单介绍并给出一个一维信号的fft变换示例
阅读全文
摘要:cuBLAS 是NIVIDIA提供的GPU加速线性代数库,基于CUDA实现BLAS(基本线性代数子程序),广泛应用于科学计算、机器学习、工程仿真等领域。本笔记调研cuBLAS库的基本情况,将详细介绍产品的功能、算子列表及API列表,以及cublas实现矩阵乘法的案例。
阅读全文
摘要:CUDA (Compute Unified Device Architecture)是NIVIDIA 推出的通用并行计算平台,支持C,C++,Python等语言,实现CPU和GPU协同计算。其架构采用Grid-Blocks-Threads线程层次结构和SIMT并行模式,在给出CUDA的编程实例之前,需要给出模型的基础知识做个简单的介绍。
阅读全文
摘要:Intel MKL库提供了大量优化程度高、效率快的稀疏矩阵算法,使用MKL库的将大型矩阵进行稀疏表示后,利用稀疏矩阵运算可大量节省计算时间和空间,但由于MKL中的原生API接口繁杂,因此将常用函数封装,便于后续使用,最后在实际例子中调用接口执行想要的矩阵运算。 0 稀疏矩阵 稀疏矩阵是指矩阵中大部分
阅读全文
摘要:本示例将介绍MKL中的矩阵乘法和求逆,使用MKL进行此类大型矩阵运算可大量节省计算时间和空间,但由于MKL中的原生API接口繁杂,因此将常用函数封装,便于后续使用,最后在实际例子中调用接口执行想要的矩阵运算。 1 MKL矩阵乘法案例 所用示例如下,矩阵A、B分别为 $$ A = {\left[ {\
阅读全文
摘要:英特尔数学核心函数库(Intel Math Kernel Library,MKL)是一套经过高度优化和广泛线程化的数学例程,专为需要极致性能的科学、工程及金融等领域的应用而设计。核心数学函数包括BLAS、LAPACK、ScaLAPACK1、稀疏矩阵解算器、快速傅立叶转换、矢量数学及其它函数。其可以为
阅读全文
摘要:对任意一个$m\times n$的实矩阵,总可以按照SVD算法对其进行分解。即: \[ A = U\Sigma V^T \] 其中$U、V$分别为$m\times m、n\times n$的方阵,由$A$的左奇异向量和右奇异向量组成,且$U$与$V$均为正交阵。$\Sigma$为$m\times n
阅读全文
摘要:LAPACK(Linear Algebra PACKage)库,是用Fortran语言编写的线性代数计算库,包含线性方程组求解(\(AX=B\))、矩阵分解、矩阵求逆、求矩阵特征值、奇异值等。该库用BLAS库做底层运算。 本示例将重点介绍使用LAPACK库求解非对称矩阵与对称矩阵的特征值、特征向量过
阅读全文
摘要:LAPACK(Linear Algebra PACKage)库,是用Fortran语言编写的线性代数计算库,包含线性方程组求解(AX=B)、矩阵分解、矩阵求逆、求矩阵特征值、奇异值等。该库用BLAS库做底层运算。 本示例将使用MKL中的LAPACK库计算线性最小二乘问题的解,首先简单介绍最小二乘法原
阅读全文
摘要:LAPACK(Linear Algebra PACKage)库,是用Fortran语言编写的线性代数计算库,包含线性方程组求解($AX=B$)、矩阵分解、矩阵求逆、求矩阵特征值、奇异值等。该库用BLAS库做底层运算。 本示例将使用MKL中的LAPACK库计算线性方程组$AX=B$的解,并扩展使用此思
阅读全文
摘要:MKL库中基本线性代数子程序,BLAS(Basic Linear Algebra Subprograms)库,是一个API标淮,用以规范发布基础线性代数操作的数值库(如向量或矩阵乘法)。其中CBLAS是BLAS的C语言接口。 库中前缀用来区分所支持处理的数据类型。 | 前缀 | 描述 | 函数名系列
阅读全文
摘要:VS2019配置oneAPI并调用MKL库 oneAPI oneAPI是一个跨架构的编程工具,旨在简化跨GPU、CPU、FPGA和AI加速器之间的编程,可以与英特尔自身设备,或其他厂商的芯片配合使用,以优化工作负载。支持多种语言,支持跨架构性能加速,以提高程序员的生产力。 其中的oneMKL(数学内
阅读全文

浙公网安备 33010602011771号