吴建明wujianming

2021年5月26日

摘要：使用Apache TVM将机器学习编译为WASM和WebGPU TLDR 在Apache TVM深度学习编译器中引入了对WASM和WebGPU的支持。实验表明，在将模型部署到Web时，TVM的WebGPU后端可以接近本机 GPU的性能。概述计算是现代机器学习应用程序的支柱之一。GPU的引入加快了阅读全文

posted @ 2021-05-26 05:15 吴建明wujianming 阅读(463) 评论(0) 推荐(1) 编辑

2021年5月25日

华为+长安研发芯片？长安蔚来更名“阿维塔科技”

摘要：华为+长安研发芯片？长安蔚来更名“阿维塔科技” 5月20日长安、华为和宁德时代合作造车的重要进展，阿维塔科技公司正式披露。而在整车制造之外，合作方（长安、华为）其实还瞄准了汽车用半导体的设计和开发。路透社报道，知情人士透露，华为正在扩大与重庆长安汽车的智能汽车合作伙伴关系，包括汽车用半导体的设计和阅读全文

posted @ 2021-05-25 06:20 吴建明wujianming 阅读(1105) 评论(0) 推荐(0) 编辑

华为托起小康股份、北汽蓝谷、长安汽车股价

摘要：华为托起小康股份、北汽蓝谷、长安汽车股价 2021年5月24日上午，华为一再重申的"华为不造车"言论，再度"重创"相关上市车企。受此消息影响，北汽蓝谷、长安汽车先后跌停，小康股份跌幅逾6%，而广汽、东风则下滑接近5%，瞬间"蒸发"掉不少市值。事实上，去年11月在华为内部发布的一则《关于智能汽车部阅读全文

posted @ 2021-05-25 05:58 吴建明wujianming 阅读(213) 评论(0) 推荐(0) 编辑

2021年5月24日

TVM如何训练TinyML

摘要： TVM如何训练TinyML 机器学习研究人员和从业人员对“裸机”（低功耗，通常没有操作系统）设备产生了广泛的兴趣。尽管专家已经有可能在某些裸机设备上运行某些模型，但是为各种设备优化模型的挑战非常艰巨，通常需要手动优化设备特定的库。对于那些没有Linux支持的平台，不存在用于部署模型的可扩展解决方案。阅读全文

posted @ 2021-05-24 06:19 吴建明wujianming 阅读(688) 评论(0) 推荐(0) 编辑

TVM代码生成codegen

摘要： TVM代码生成codegen 硬件后端提供程序（例如Intel，NVIDIA，ARM等），提供诸如cuBLAS或cuDNN之类的内核库以及许多常用的深度学习内核，或者提供框架例，如带有图形引擎的DNNL或TensorRT，使用户以某种方式描述模型，实现高性能。此外，新兴的深度学习加速器还具有自己的编阅读全文

posted @ 2021-05-24 05:50 吴建明wujianming 阅读(992) 评论(0) 推荐(0) 编辑

2021年5月23日

TVM量化小结手册

摘要： TVM量化小结手册文章目录 Offical References TVM quantization roadmap INT8 quantization proposal Quantization Story - 2019-09 Quantization Development Quantizati 阅读全文

posted @ 2021-05-23 20:11 吴建明wujianming 阅读(745) 评论(0) 推荐(0) 编辑

TVM图优化与算子融合

摘要： TVM图优化与算子融合计算图的定义 Computational graphs: a common way to represent programs in deep learning frameworks 对于图优化来说，有很多种图优化手段： Operator Fusion Constant Pa 阅读全文

posted @ 2021-05-23 15:08 吴建明wujianming 阅读(1019) 评论(0) 推荐(0) 编辑

桥接PyTorch和TVM

摘要：桥接PyTorch和TVM 人工智能最引人入胜的一些应用是自然语言处理。像BERT或GPT-2之类的模型及其变体，可以获住足够多的文本信息。这些模型属于称为Transformers的神经网络类体系结构。 HuggingFace transformers library是实现最受欢迎的库之一。与已阅读全文

posted @ 2021-05-23 09:51 吴建明wujianming 阅读(688) 评论(0) 推荐(0) 编辑

2021年5月22日

cmodel模拟器开发

摘要： cmodel模拟器开发对于一个公司来说，产品的设计周期就是生命线，一般来说都会在设计功能级仿真的c-model后直接转向RTL设计。在目前的技术下，做cycle-by-cycle的设计和直接RTL设计的时间，感觉是差不太多的。nVidia同时维护functional and timing 的si 阅读全文

posted @ 2021-05-22 06:18 吴建明wujianming 阅读(3798) 评论(0) 推荐(0) 编辑

2021年5月21日

MXNet 图优化与算子融合

摘要： MXNet 图优化与算子融合Graph Optimization and Quantization based on subgraph and MKL-DNN Purpose MKL-DNN引入了两个高级特性：融合计算和降精度核。这些特性可以显著地提高各种深度学习拓扑在CPU上的推理性能。然而，M 阅读全文

posted @ 2021-05-21 06:35 吴建明wujianming 阅读(637) 评论(0) 推荐(0) 编辑

吴建明

公告