上一页 1 ··· 123 124 125 126 127 128 129 130 131 ··· 273 下一页
摘要: TVM性能评估分析(七) Figure 1. Performance Improvement Figure 2. Depthwise convolution Figure 3. Data Fusion Figure 4. Data Fusion(2) Figure 5. Shared memory 阅读全文
posted @ 2021-05-30 08:52 吴建明wujianming 阅读(149) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(六) Figure 1. The workflow of development PC, compile, deploy to the device, test, then modify the codes again to see whether it accelerates. 阅读全文
posted @ 2021-05-30 07:55 吴建明wujianming 阅读(94) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(五) Figure 3. A futher speed up with operator fusion Table 1. Performance issue of cuBLAS’ batch matmul Table 2. Finding the best combination 阅读全文
posted @ 2021-05-30 07:29 吴建明wujianming 阅读(160) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(四) Figure 1. Efficient Privacy-Preserving ML Using TVM Figure 2. Motivation: Privacy-Preserving ML Figure 3. Backend Figure 4. Differential 阅读全文
posted @ 2021-05-30 07:05 吴建明wujianming 阅读(102) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(三) Figure 1. TVM’s WebGPU backend close to native GPU performance when deploying models to the web. Figure 2. WebGPU is to write shaders for 阅读全文
posted @ 2021-05-30 06:27 吴建明wujianming 阅读(90) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(二) Figure 1. A bird’s eye view of the µTVM + AutoTVM infrastructure Figure 2. A standard µTVM setup, where the host communicates with the de 阅读全文
posted @ 2021-05-30 06:00 吴建明wujianming 阅读(117) 评论(0) 推荐(0) 编辑
摘要: TVM性能评估分析(一) System Overview AutoTVM vs Auto-scheduler Table 1. Workflow Comparision Figure 1. Search Process Overview Figure 2. Code Performance Comp 阅读全文
posted @ 2021-05-30 05:41 吴建明wujianming 阅读(113) 评论(0) 推荐(0) 编辑
摘要: 飞腾上实体名单? 与华为麒麟一样,没有类似高通之光的基因 申威和飞腾两家CPU设计公司,与众多国家超算中心,同时上了实体名单。所谓实体名单大概已成为国产设计制造的一个光荣榜,上榜企业都应该是我们硬核力量的担当所在。 与申威不同的是,飞腾一直深耕商业应用领域,主攻桌面级、服务器和工业嵌入式CPU。 基 阅读全文
posted @ 2021-05-29 06:09 吴建明wujianming 阅读(1477) 评论(0) 推荐(0) 编辑
摘要: 华为不造车,广汽合作智能驾驶 2021年5月21日,华为再度发布声明重申华为不造车。华为公司表示,这一长期战略在2018年就已明确,没有任何改变。”华为表示,至今为止并未投资任何车企。未来也不会投资任何车企,更不会控股、参股。以后,凡是议论上说华为造车、或者参股汽车制造行业,均为谣言,勿轻信。 关于 阅读全文
posted @ 2021-05-29 05:36 吴建明wujianming 阅读(115) 评论(0) 推荐(0) 编辑
摘要: 异构计算编程 异构计算系统通常由通用处理器和许多特定于域的处理器组成:通用处理器作为控制设备(称为主机),用于复杂的控制和调度;特定于域的处理器作为子设备(称为MLU),用于大规模并行计算和特定于域的计算任务。主机和MLU合作完成计算任务。对于异构计算系统,原始的同构并行编程模型不再适用。因此,异构 阅读全文
posted @ 2021-05-28 17:49 吴建明wujianming 阅读(445) 评论(0) 推荐(0) 编辑
上一页 1 ··· 123 124 125 126 127 128 129 130 131 ··· 273 下一页