上一页 1 ··· 164 165 166 167 168 169 170 171 172 ··· 272 下一页
摘要: GPU编程和流式多处理器(四) 3.2. 单精度(32位) 单精度浮点支持是GPU计算的主力军。GPU已经过优化,可以在此数据类型上原生提供高性能,不仅适用于核心标准IEEE操作(例如加法和乘法),还适用于非标准操作(例如对先验的近似(例如sin()和log()))。32位值与整数保存在同一寄存器文 阅读全文
posted @ 2021-01-05 09:09 吴建明wujianming 阅读(355) 评论(0) 推荐(0) 编辑
摘要: GPU编程和流式多处理器(三) 3. Floating-Point Support 快速的本机浮点硬件是GPU的存在理由,并且在许多方面,它们在浮点实现方面都等于或优于CPU。全速支持异常可以根据每条指令指定直接舍入,特殊功能单元可为六种流行的单精度先验函数,提供高性能的近似函数。相比之下,x86 阅读全文
posted @ 2021-01-05 08:52 吴建明wujianming 阅读(537) 评论(0) 推荐(0) 编辑
摘要: GPU编程和流式多处理器(二) 2. 整数支持 SM具有32位整数运算的完整补充。 加法运算符的可选否定加法 乘法与乘法加法 整数除法 逻辑运算 条件码操作 to/from浮点转换 其它操作(例如,SIMD指令用于narrow整数,population人口计数,查找第一个零) CUDA通过标准C运算 阅读全文
posted @ 2021-01-05 07:34 吴建明wujianming 阅读(246) 评论(0) 推荐(0) 编辑
摘要: GPU编程和流式多处理器 流式多处理器(SM)是运行CUDA内核的GPU的一部分。本章重点介绍SM的指令集功能。 流式多处理器(SM)是运行我们的CUDA内核的GPU的一部分。每个SM包含以下内容。 可以在执行线程之间划分的数千个寄存器 几个缓存: –共享内存,用于线程之间的快速数据交换 –恒定高速 阅读全文
posted @ 2021-01-05 07:14 吴建明wujianming 阅读(911) 评论(0) 推荐(0) 编辑
摘要: CloudHub概述 CloudHub CloudHub是cloudcore的一个模块,是Controller和Edge端之间的中转。它同时支持基于websocket的连接以及QUIC协议访问。Edgehub可以选择一种协议来访问cloudhub。CloudHub的功能是启用边端与控制器之间的通信。 阅读全文
posted @ 2021-01-05 06:20 吴建明wujianming 阅读(452) 评论(0) 推荐(0) 编辑
摘要: Kubeedge Edged概述 Overview EdgeD是管理节点生命周期的边缘节点模块。它可以帮助用户在边缘节点上部署容器化的工作负载或应用程序。这些工作负载可以执行任何操作,从简单的远程遥测数据操作到分析或ML推理等等。使用kubectl云端的命令行界面,用户可以发出命令来启动工作负载。 阅读全文
posted @ 2021-01-05 06:13 吴建明wujianming 阅读(377) 评论(0) 推荐(0) 编辑
摘要: 3D MinkowskiEngine稀疏模式重建 本文看一个简单的演示示例,该示例训练一个3D卷积神经网络,该网络用一个热点向量one-hot vector重构3D稀疏模式。这类似于Octree生成网络ICCV'17。输入的one-hot vector一热向量,来自ModelNet40数据集的3D计 阅读全文
posted @ 2021-01-04 08:21 吴建明wujianming 阅读(551) 评论(0) 推荐(0) 编辑
摘要: MinkowskiEngine多GPU训练 目前,MinkowskiEngine通过数据并行化支持Multi-GPU训练。在数据并行化中,有一组微型批处理,这些微型批处理将被送到到网络的一组副本中。 首先定义一个网络。 import MinkowskiEngine as ME from exampl 阅读全文
posted @ 2021-01-04 08:05 吴建明wujianming 阅读(234) 评论(0) 推荐(0) 编辑
摘要: MinkowskiEngine语义分割 要运行示例,请安装Open3D与PIP安装open3d-python。 cd /path/to/MinkowskiEngine python -m examples.indoor 细分酒店房间 运行示例时,将看到一个旅馆房间和房间的语义分割。运行示例时,以交互 阅读全文
posted @ 2021-01-04 07:51 吴建明wujianming 阅读(873) 评论(0) 推荐(0) 编辑
摘要: MinkowskiEngine demo ModelNet40分类 本文将看一个简单的演示示例,该示例训练用于分类的3D卷积神经网络。输入是稀疏张量,卷积也定义在稀疏张量上。该网络是以下体系结构的扩展,但具有剩余的块和更多的层。 创建ModelNet40数据加载器 首先,需要创建一个数据加载器,以返 阅读全文
posted @ 2021-01-04 07:30 吴建明wujianming 阅读(299) 评论(0) 推荐(0) 编辑
上一页 1 ··· 164 165 166 167 168 169 170 171 172 ··· 272 下一页