上一页 1 ··· 174 175 176 177 178 179 180 181 182 ··· 272 下一页
摘要: TVM设计与构架构建 本文档适用于希望了解TVM体系结构和/或在项目上进行积极开发的开发人员。该页面的组织如下: • 实例编译流程Example Compilation Flow,描述TVM把一个模型的高级描述到可部署模块的步骤。 • “逻辑体系结构组件” Logical Architecture 阅读全文
posted @ 2020-12-22 07:46 吴建明wujianming 阅读(853) 评论(0) 推荐(0) 编辑
摘要: Cuda Stream流分析 Stream 一般来说,cuda c并行性表现在下面两个层面上: Kernel level Grid level Stream和event简介 Cuda stream是指一堆异步的cuda操作,他们按照host代码调用的顺序执行在device上。 典型的cuda编程模式 阅读全文
posted @ 2020-12-22 06:30 吴建明wujianming 阅读(2590) 评论(0) 推荐(0) 编辑
摘要: 本文通过此脚本从def文件自动生成。不要直接修改,而是编辑算子定义。 对于算子输入/输出的可辩别的,它可以是可辩别的、不可辩别的或未定义的。如果未指定变量的可辩别的,则该变量具有未定义的可辩别的。 ai.onnx (default) OperatorSince version Abs 13, 6, 阅读全文
posted @ 2020-12-21 08:26 吴建明wujianming 阅读(7468) 评论(0) 推荐(2) 编辑
摘要: 从PyTorch到ONNX的端到端AlexNet 这是一个简单的脚本,可将Torchvision中定义的经过预训练的AlexNet导出到ONNX中。运行一轮推理Inference,然后将生成的跟踪模型保存到alexnet.onnx: import torch import torchvision d 阅读全文
posted @ 2020-12-21 07:44 吴建明wujianming 阅读(337) 评论(0) 推荐(0) 编辑
摘要: 使用TENSORRT和NVIDIA-DOCKER部署深部神经网络 当前部署工作流 阅读全文
posted @ 2020-12-21 07:07 吴建明wujianming 阅读(662) 评论(0) 推荐(0) 编辑
摘要: 用于ONNX的TensorRT后端 解析ONNX模型以使用TensorRT执行。 另请参阅TensorRT文档。 有关最近更改的列表,请参见changelog。 支持的TensorRT版本 Master分支上的开发适用于具有完整维度和动态架构shape支持的TensorRT 7.2.1的最新版本。 阅读全文
posted @ 2020-12-21 06:23 吴建明wujianming 阅读(1430) 评论(0) 推荐(0) 编辑
摘要: 循环IRNNv2Layer实现 IRNNv2Layer实现循环层,例如循环神经网络(RNN),门控循环单元(GRU)和长期短期记忆(LSTM)。支持的类型为RNN,GRU和LSTM。它执行循环操作,该操作由几个众所周知的循环神经网络(RNN)“单元”之一定义。 层描述 该层接受输入序列 X,初始隐藏 阅读全文
posted @ 2020-12-18 14:39 吴建明wujianming 阅读(142) 评论(0) 推荐(0) 编辑
摘要: 2D池化IPoolingLayer IPooling层在通道内实现池化。支持的池类型为最大, 平均 和 最大平均混合。 层描述:二维池化 使用张量上的2D滤波器计算池化a tensor A, of dimensions a, to produce a tensor B, of dimensions 阅读全文
posted @ 2020-12-18 13:56 吴建明wujianming 阅读(115) 评论(0) 推荐(0) 编辑
摘要: TensorRT 7.2.1开发初步 TensorRT 7.2.1开发人员指南演示了如何使用C ++和Python API来实现最常见的深度学习层。它显示了如何采用深度学习框架构建现有模型,并使用该模型通过提供的解析器构建TensorRT引擎。开发人员指南还提供了针对常见用户任务的分步说明,例如创建 阅读全文
posted @ 2020-12-18 09:07 吴建明wujianming 阅读(298) 评论(0) 推荐(0) 编辑
摘要: Turing渲染着色器网格技术分析 图灵体系结构通过使用 网格着色器 引入了一种新的可编程几何着色管道。新的着色器将计算编程模型引入到图形管道中,因为协同使用线程在芯片上直接生成紧凑网格( meshlets ),供光栅化器使用。处理高几何复杂度的应用程序和游戏得益于两阶段方法的灵活性,该方法允许有效 阅读全文
posted @ 2020-12-17 08:11 吴建明wujianming 阅读(329) 评论(0) 推荐(0) 编辑
上一页 1 ··· 174 175 176 177 178 179 180 181 182 ··· 272 下一页