摘要:
GPU上稀疏矩阵的基本线性代数 cuSPARSE库为稀疏矩阵提供了GPU加速的基本线性代数子例程,这些子例程的执行速度明显快于仅CPU替代方法。提供了可用于构建GPU加速求解器的功能。cuSPARSE被从事机器学习,计算流体力学,地震勘探和计算科学等应用的工程师和科学家广泛使用。使用cuSPARSE 阅读全文
摘要:
GPU上的基本线性代数 cuBLAS库提供了基本线性代数子例程(BLAS)的GPU加速实现。cuBLAS通过针对NVIDIA GPU进行了高度优化的嵌入式行业标准BLAS API来加速AI和HPC应用程序。cuBLAS库包含用于批处理操作,跨多个GPU的执行以及混合和低精度执行的扩展。使用cuBLA 阅读全文
摘要:
NVIDIA数据中心深度学习产品性能 在现实世界的应用程序中部署AI,需要训练网络以指定的精度融合。这是测试AI系统的最佳方法-准备将其部署在现场,因为网络随后可以提供有意义的结果(例如,对视频流正确执行图像识别)。不收敛的训练是对指定AI网络上硬件吞吐能力的衡量,但不能代表实际应用。 NVIDIA 阅读全文
摘要:
GeforceRTX系列参数对比 阅读全文
摘要:
NVIDIA CUDA-X AI 面向数据科学和 AI 的 NVIDIA GPU 加速库 数据科学是推动 AI 发展的关键力量之一,而 AI 能够改变各行各业。 但是,驾驭 AI 的力量是一个复杂挑战。 开发基于 AI 的应用程序涉及许多个步骤(包括数据处理、特征工程、机器学习、验证和部署),而且每 阅读全文
摘要:
NVIDIA 认证系统 AI 是这个时代最强大的技术,需要新一代经过调整和测试的计算机来推动其发展。 自 1 月 27 日开始,可从 NVIDIA 合作伙伴处获取用于数据中心的新型加速服务器,推动 AI 和数据分析的发展。顶尖的系统制造商正在交付首批 NVIDIA 认证系统,目前业内唯一通过现代工作 阅读全文