上一页 1 ··· 163 164 165 166 167 168 169 170 171 ··· 272 下一页
摘要: C ++基本输入/输出 本文将学习如何使用cin对象从用户那里获取输入,并使用cout对象在示例的帮助下向用户显示输出。 C ++输出 在C ++中,cout将格式化的输出发送到标准输出设备,例如屏幕。将cout对象与<<运算符一起使用以显示输出。 示例1:字符串输出 #include <iostr 阅读全文
posted @ 2021-01-12 11:54 吴建明wujianming 阅读(596) 评论(0) 推荐(0) 编辑
摘要: C ++变量,文字和常量 本文将借助示例来学习C ++中的变量,文字和常量。 C ++变量 在编程中,变量是用于保存数据的容器(存储区)。 为了指示存储区域,应该为每个变量赋予唯一的名称(标识符)。例如, int age = 14; 这里, age是int数据类型的变量,为其分配了一个整数值14。 阅读全文
posted @ 2021-01-12 11:05 吴建明wujianming 阅读(500) 评论(0) 推荐(0) 编辑
摘要: nvGRAPH三角形计数和遍历示例 #include “ stdlib.h” #include“ inttypes.h” #include“ stdio.h” #include“ nvgraph.h” #define check( a )\ {\ nvgraphStatus_t status =(a 阅读全文
posted @ 2021-01-12 10:19 吴建明wujianming 阅读(101) 评论(0) 推荐(0) 编辑
摘要: TensorRT深度学习训练和部署 NVIDIA TensorRT是用于生产环境的高性能深度学习推理库。功率效率和响应速度是部署的深度学习应用程序的两个关键指标,因为它们直接影响用户体验和所提供服务的成本。Tensor RT自动优化训练好的神经网络,以提高运行时性能,与仅使用通用CPU的深度学习推理 阅读全文
posted @ 2021-01-08 07:32 吴建明wujianming 阅读(545) 评论(0) 推荐(0) 编辑
摘要: TensorRT 数据和表格示例 TensorRT 7.1在绑定索引方面比其前身更加严格。以前,允许错误配置文件的绑定索引。考虑一个网络,该网络具有四个输入,一个输出,以及在其中的三个优化配置文件 IBuilderConfig。该引擎有15个绑定,每个优化配置文件有5个绑定,概念上被组织为一个表: 阅读全文
posted @ 2021-01-08 07:12 吴建明wujianming 阅读(106) 评论(0) 推荐(0) 编辑
摘要: TensorRT原理图示 NVIDIA的核心® TensorRT™是有助于在NVIDIA图形处理单元(GPU)的高性能推理一个C ++库。它旨在与TensorFlow,Caffe,PyTorch,MXNet等训练框架以互补的方式工作。它专门致力于在GPU上快速有效地运行已经受过训练的网络,以生成结果 阅读全文
posted @ 2021-01-08 06:52 吴建明wujianming 阅读(360) 评论(0) 推荐(0) 编辑
摘要: TensorRT数据格式说明 NVIDIA ® TensorRT™支持不同的数据格式。需要考虑两个方面:数据类型和布局。 数据类型格式 数据类型是每个单独值的表示。它的大小决定了数值的范围和表示的精度;分别是FP32(32位浮点或单精度),FP16(16位浮点或半精度),INT32(32位整数表示) 阅读全文
posted @ 2021-01-08 06:41 吴建明wujianming 阅读(476) 评论(0) 推荐(0) 编辑
摘要: 6. 杂项说明 6.1. warp级原语 warp作为执行的原始单元(自然位于线程和块之间),重要性对CUDA程序员显而易见。从SM 1.x开始,NVIDIA开始添加专门针对thread的指令。 Vote CUDA体系结构是32位的,并且warp由32个线程组成,这些线程与评估条件,向warp中的每 阅读全文
posted @ 2021-01-06 07:44 吴建明wujianming 阅读(414) 评论(0) 推荐(0) 编辑
摘要: GPU编程和流式多处理器(六) 5. 纹理和表面 读取和写入纹理和表面的指令,所引用的隐式状态,比其他指令要多得多。header中包含诸如基地址,尺寸,格式和纹理内容的解释之类的参数,该header是一种中间数据结构,其软件抽象称为纹理参考或表面参考。当开发人员操纵纹理或表面引用时,CUDA运行时r 阅读全文
posted @ 2021-01-06 06:32 吴建明wujianming 阅读(95) 评论(0) 推荐(0) 编辑
摘要: GPU编程和流式多处理器(五) 4. 条件代码 硬件实现了“条件代码”或CC寄存器,其中包含用于整数比较的常用4位状态向量(符号,进位,零,溢出)。可以使用比较指令(例如ISET)来设置这些CC寄存器,并且它们可以通过谓词或发散来指导执行流程。预测允许(或禁止)在warp内基于每个线程执行指令,而分 阅读全文
posted @ 2021-01-06 06:20 吴建明wujianming 阅读(205) 评论(0) 推荐(0) 编辑
上一页 1 ··· 163 164 165 166 167 168 169 170 171 ··· 272 下一页