上一页 1 ··· 172 173 174 175 176 177 178 179 180 ··· 272 下一页
摘要: nvGRAPH API参考分析(一) 本文通过描述nvGRAPH库函数的输入/输出参数,数据类型和错误代码来指定其行为。 1. 返回值nvgraphStatus_t 除以下内容外,所有nvGRAPH库返回值 NVGRAPH_STATUS_SUCCESS表示当前的API调用失败,用户应重新配置以更正该 阅读全文
posted @ 2020-12-25 08:34 吴建明wujianming 阅读(119) 评论(0) 推荐(0) 编辑
摘要: nvGRAPH原理概述 nvGRAPH的API参考分析。 简介 数据分析是高性能计算的不断增长的应用。许多高级数据分析问题可以称为图形问题。反过来,当今许多常见的图形问题也可以称为稀疏线性代数。这是NVIDIA®CUDA™8.0中新增的nvGRAPH的动机,该功能利用GPU的线性代数功能来处理最大的 阅读全文
posted @ 2020-12-25 07:21 吴建明wujianming 阅读(276) 评论(0) 推荐(0) 编辑
摘要: 代码生成codegen 该模块提供了从SymPy表达式生成直接可编译代码的功能。该codegen功能是SymPy中代码生成功能的用户界面。下面为可能希望直接使用框架的高级用户提供了一些实现细节。 注意 该codegen调用是不是自动在sympy命名空间,必须首先执行才能使用 Run code blo 阅读全文
posted @ 2020-12-25 07:09 吴建明wujianming 阅读(420) 评论(0) 推荐(0) 编辑
摘要: 使用Tensorize评估硬件内部特性 这是有关如何在TVM中执行张量的入门文档。 通过使用调度原语tensorize,人们可以用相应的内部函数代替计算单元,从而轻松利用handcrafted micro-kernels,扩展TVM以支持新的硬件体系结构。 本文的目的是展示张量的功能和用法,而不是提 阅读全文
posted @ 2020-12-24 21:07 吴建明wujianming 阅读(180) 评论(0) 推荐(0) 编辑
摘要: 使用元组输入进行计算和归约 在一个循环中计算出具有相同形状的多个输出,或者执行涉及多个值的归约,例如 argmax。这些问题可以通过元组输入解决。 本文将介绍TVM中元组输入的用法。 from __future__ import absolute_import, print_function imp 阅读全文
posted @ 2020-12-24 20:27 吴建明wujianming 阅读(174) 评论(0) 推荐(0) 编辑
摘要: 自动调试用于移动GPU的卷积网络 对特定设备进行自动调试对于获得最佳性能至关重要。这是有关如何调试整个卷积网络的说明文档。 TVM中Mobile GPU的算子实现以模板形式编写。模板具有许多可调旋钮(平铺因子,矢量化,展开等)。将调试神经网络中的所有卷积,深度卷积和密集算子。调试后,生成一个日志文件 阅读全文
posted @ 2020-12-24 20:07 吴建明wujianming 阅读(252) 评论(0) 推荐(0) 编辑
摘要: 编写可调模板并使用自动调谐器 这是TVM中自动调试模块的入门说明。 自动调试有两个步骤。第一步是定义搜索空间。第二步是运行搜索算法来探索这个空间。本文可以学习如何在TVM中执行这两个步骤。整个工作流程由矩阵乘法示例说明。 注意,本文无法在Windows或最新版本的macOS上运行。要使其运行,需要将 阅读全文
posted @ 2020-12-24 07:55 吴建明wujianming 阅读(105) 评论(0) 推荐(0) 编辑
摘要: NVIDIA GPU自动调度神经网络 对特定设备和工作负载进行自动调试对于获得最佳性能至关重要。这是有关如何使用自动调度器为NVIDIA GPU调试整个神经网络的说明文档。 为了自动调试神经网络,将网络划分为小的子图,并对其进行独立调试。每个子图被视为一个搜索任务。任务调度程序可以对时间进行分片,并 阅读全文
posted @ 2020-12-24 07:32 吴建明wujianming 阅读(293) 评论(0) 推荐(0) 编辑
摘要: CPU的自动调度矩阵乘法 这是一个有关如何对CPU使用自动调度程序的文档。 与依靠手动模板定义搜索空间的基于模板的autotvm不同,自动调度程序不需要任何模板。用户只需要编写计算声明,而无需任何调度命令或模板。自动调度程序可以自动生成较大的搜索空间,并在该空间中找到良好的调度。 本文以矩阵乘法为例 阅读全文
posted @ 2020-12-24 07:03 吴建明wujianming 阅读(321) 评论(0) 推荐(0) 编辑
摘要: 自动调度GPU的卷积层 这是有关如何对GPU使用自动调度程序的文档。 与依靠手动模板定义搜索空间的基于模板的autotvm不同,自动调度程序不需要任何模板。用户只需要编写计算声明,而无需任何调度命令或模板。自动调度程序可以自动生成较大的搜索空间,并在该空间中找到良好的调度。 本文以卷积层为例。 注意 阅读全文
posted @ 2020-12-24 06:35 吴建明wujianming 阅读(94) 评论(0) 推荐(0) 编辑
上一页 1 ··· 172 173 174 175 176 177 178 179 180 ··· 272 下一页