吴建明wujianming

2021年10月30日

摘要：如何在 GPU 上优化卷积将演示如何在 TVM 中编写高性能卷积实现。正方形大小的输入张量和过滤器为例，假设卷积的输入具有大batch批量。在这个例子中，使用不同的布局存储数据，实现更好的数据局部性。缓冲区布局是 HWCN，代表高度、宽度、通道、批次。准备和算法对具有 256 个通道和 14 阅读全文

posted @ 2021-10-30 04:52 吴建明wujianming 阅读(188) 评论(0) 推荐(0) 编辑

2021年10月29日

全文翻译（全文合集）：TVM: An Automated End-to-End Optimizing Compiler for Deep Learning

摘要：全文翻译（全文合集）：TVM: An Automated End-to-End Optimizing Compiler for Deep Learning 摘要人们越来越需要将机器学习应用到各种各样的硬件设备中。现在的框架依赖于特定于供应商的算子库，针对窄带的服务器级GPU进行优化。将工作负荷部署阅读全文

posted @ 2021-10-29 06:06 吴建明wujianming 阅读(743) 评论(0) 推荐(1) 编辑

全文翻译（四） TVM An Automated End-to-End Optimizing Compiler

摘要：全文翻译（四） TVM An Automated End-to-End Optimizing Compiler 6.3 嵌入式GPU评估对于移动GPU实验，在配备ARM Mali-T860MP4 GPU的Firefly-RK3399板上，运行端到端管道。基线是供应商提供的库，即ARM计算库（v18 阅读全文

posted @ 2021-10-29 05:35 吴建明wujianming 阅读(119) 评论(0) 推荐(0) 编辑

2021年10月28日

全文翻译（三） TVM An Automated End-to-End Optimizing Compiler

摘要：全文翻译（三） TVM An Automated End-to-End Optimizing Compiler 5. 自动化优化考虑到一组丰富的调度原语，剩下的问题是为DL模型的每一层，找到最佳的算子实现。在这里，TVM为与每个层关联的特定输入shape和布局，创建一个专门的算子。这种专门化提供了阅读全文

posted @ 2021-10-28 06:34 吴建明wujianming 阅读(156) 评论(0) 推荐(0) 编辑

2021年10月27日

全文翻译（二）: TVM: An Automated End-to-End Optimizing Compiler for Deep Learning

摘要：全文翻译（二）: TVM: An Automated End-to-End Optimizing Compiler for Deep Learning 3．优化计算图计算图是在DL框架中表示程序的常用方法。图3显示了两层卷积神经网络的计算图表示示例。这种高级表示与低级编译器中间表示（IR，如LLV 阅读全文

posted @ 2021-10-27 06:28 吴建明wujianming 阅读(205) 评论(0) 推荐(0) 编辑

2021年10月26日

全文翻译（一）：TVM: An Automated End-to-End Optimizing Compiler for Deep Learning

摘要：全文翻译（一）：TVM: An Automated End-to-End Optimizing Compiler for Deep Learning 摘要人们越来越需要将机器学习应用到各种各样的硬件设备中。现在的框架依赖于特定于供应商的算子库，针对窄带的服务器级GPU进行优化。将工作负荷部署到新平阅读全文

posted @ 2021-10-26 06:28 吴建明wujianming 阅读(218) 评论(0) 推荐(0) 编辑

2021年10月25日

Tesla Model汽车架构与FSD供应链

摘要： Tesla Model汽车架构与FSD供应链特斯拉Model 3和Model Y平台架构特斯拉model Y和Model 3 怎么做平台架构。通过特斯拉透露的信息，Model 3 和 model Y 将近有76%的零件共用，看看机械架构平台。车身以及底盘信息轴距：Model Y的轴距(下图阅读全文

posted @ 2021-10-25 06:24 吴建明wujianming 阅读(1663) 评论(0) 推荐(0) 编辑

2021年10月24日

华为自动驾驶产业链

摘要：华为自动驾驶产业链从执行路径看，华为入局智能电动车的思路清晰，不直接参与整车制造，而是聚焦ICT技术，以提供软硬件解决方案为核心，帮助车企造好车。同时，华为将联合产业链企业为车企提供「全栈式供应」，因此预计与华为绑定较深部分Tier2供应商未来将迎来业务高增长，值得重点关注。一、华为入局，打开阅读全文

posted @ 2021-10-24 06:34 吴建明wujianming 阅读(1207) 评论(0) 推荐(0) 编辑

2021年10月23日

特斯拉fsd全自动驾驶与华为自动驾驶

摘要：特斯拉fsd全自动驾驶与华为自动驾驶华为自动驾驶能力很强。不认为这会对特斯拉造成威胁或者压力。因为特斯拉的核心竞争力并不是自动驾驶… 起码身边的车主来说，100个车主里能有一个买fsd的就不错了…甚至有30%的人根本没开过ap。自动驾驶、辅助驾驶这东西现在还是个很小众的需求，锦上添花的东西，阅读全文

posted @ 2021-10-23 06:19 吴建明wujianming 阅读(1158) 评论(0) 推荐(0) 编辑

2021年10月22日

DPU（Data Processing Unit）数据处理器

摘要： DPU（Data Processing Unit）数据处理器 DPU：5G边缘云 5G时代带来通信带宽的巨大提升，更多的带宽使能更多的应用。数据量的迅猛增多，服务器网络带宽的快速增长，都已经远超计算能力的增长，有线速I/O处理需求的应用程序，受到CPU和内存的限制，现有系统因为CPU资源占用，致延迟阅读全文

posted @ 2021-10-22 05:39 吴建明wujianming 阅读(3200) 评论(0) 推荐(0) 编辑

吴建明

公告