上一页 1 ··· 166 167 168 169 170 171 172 173 174 ··· 272 下一页
摘要: MinkowskiPooling池化(下) MinkowskiPoolingTranspose class MinkowskiEngine.MinkowskiPoolingTranspose(kernel_size, stride, dilation=1, kernel_generator=None 阅读全文
posted @ 2021-01-03 20:31 吴建明wujianming 阅读(141) 评论(0) 推荐(0) 编辑
摘要: MinkowskiPooling池化(上) 如果内核大小等于跨步大小(例如kernel_size = [2,1],跨步= [2,1]),则引擎将更快地生成与池化函数相对应的输入输出映射。 如果使用U网络架构,请使用相同功能的转置版本进行上采样。例如pool = MinkowskiSumPooling 阅读全文
posted @ 2021-01-03 20:20 吴建明wujianming 阅读(232) 评论(0) 推荐(0) 编辑
摘要: 稀疏张量基础 稀疏张量是稀疏矩阵的高维扩展,其中非零元素表示为一组索引和关联值。 Data Generation 可以通过提取非零元素直接生成数据。本文展示了一个简单的2D数组,其中心有5个非零元素。 data = [ [0, 0, 2.1, 0, 0], [0, 1, 1.4, 3, 0], [0 阅读全文
posted @ 2021-01-03 19:12 吴建明wujianming 阅读(985) 评论(0) 推荐(0) 编辑
摘要: 稀疏张量网络 稀疏张量 在传统语音,文本或图像数据中,特征是密集提取的。因此,用于这些数据的最常见表示形式是矢量,矩阵和张量。但是,对于3维扫描或什至更高维的空间,这样的密集表示效率不高,因为有效信息仅占空间的一小部分。取而代之,只能将信息保存在空间的非空区域上,这与将信息保存在稀疏矩阵上的方式类似 阅读全文
posted @ 2021-01-03 17:48 吴建明wujianming 阅读(680) 评论(0) 推荐(0) 编辑
摘要: 英伟达TRTTorch PyTorch JIT的提前(AOT)编译Ahead of Time (AOT) compiling for PyTorch JIT TRTorch是PyTorch / TorchScript的编译器,通过NVIDIA针对NVIDIA GPU的TensorRT深度学习优化器和 阅读全文
posted @ 2021-01-03 17:18 吴建明wujianming 阅读(824) 评论(0) 推荐(0) 编辑
摘要: 闵可夫斯基引擎Minkowski Engine Minkowski引擎是一个用于稀疏张量的自动微分库。它支持所有标准神经网络层,例如对稀疏张量的卷积,池化,解池和广播操作。有关更多信息,请访问文档页面。 pip install git+https://github.com/NVIDIA/Minkow 阅读全文
posted @ 2021-01-03 13:55 吴建明wujianming 阅读(2312) 评论(0) 推荐(0) 编辑
摘要: 双精度张量内核加快了高性能计算 通过NVIDIA Ampere架构,仿真和迭代求解器可将FP64数学提高多达2.5倍。 模拟可以帮助了解黑洞的奥秘,并了解冠状病毒上的蛋白质尖峰如何导致COVID-19。还可以让设计师创建从时尚汽车到喷气发动机的所有东西。 但是仿真也是地球上最苛刻的计算机应用程序之一 阅读全文
posted @ 2020-12-30 14:09 吴建明wujianming 阅读(296) 评论(0) 推荐(0) 编辑
摘要: A100计算能力 A100 GPU支持新的计算功能8.0。表1比较了NVIDIA GPU架构的不同计算功能的参数。 表1.计算能力:GP100 vs. GV100 vs. GA100。 MIG架构 尽管许多数据中心的工作量在规模和复杂性上都在继续扩展,但某些加速任务的要求却不高,例如早期开发或推断小 阅读全文
posted @ 2020-12-30 14:00 吴建明wujianming 阅读(870) 评论(0) 推荐(0) 编辑
摘要: A100 Tensor核心可加速HPC HPC应用程序的性能需求正在迅速增长。众多科学研究领域的许多应用程序都依赖于双精度(FP64)计算。 为了满足HPC计算快速增长的计算需求,A100 GPU支持Tensor操作,以加速符合IEEE的FP64计算,提供的FP64性能是NVIDIA Tesla V 阅读全文
posted @ 2020-12-30 13:49 吴建明wujianming 阅读(451) 评论(0) 推荐(0) 编辑
摘要: A100 GPU硬件架构 NVIDIA GA100 GPU由多个GPU处理群集(GPC),纹理处理群集(TPC),流式多处理器(SM)和HBM2内存控制器组成。 GA100 GPU的完整实现包括以下单元: 每个完整GPU 8个GPC,8个TPC / GPC,2个SM / TPC,16个SM / GP 阅读全文
posted @ 2020-12-30 13:36 吴建明wujianming 阅读(2114) 评论(0) 推荐(0) 编辑
上一页 1 ··· 166 167 168 169 170 171 172 173 174 ··· 272 下一页