2021 年 11月随笔档案 - 吴建明wujianming

日本半导体材料

摘要：日本半导体材料近两年日本限制含氟聚酰亚胺、光刻胶，以及高纯度氟化氢这三种材料的对韩出口，引起了整个半导体领域的震动。毕竟韩国目前是全球半导体强国之一，尤其在液晶面板、OLED屏、内存上处于世界领先地位，这三种材料被限后，或影响产能，甚至导致整个世界产业格局的变化。针对此事，很多人认为，日本实在阅读全文

posted @ 2021-11-30 05:40 吴建明wujianming 阅读(986) 评论(0) 推荐(0) 编辑

14纳米芯片制造

摘要：14纳米芯片制造中芯国际第一代14纳米FinFET技术取得了突破性进展，并于2019年第四季度进入量产，代表了中国大陆自主研发集成电路的最先进水平。特点应用产品公司研发的FinFET技术将主要应用于5G、人工智能、物联网、消费电子及汽车电子等新兴领域，仍在进一步扩大公司产品和服务的应用范围。阅读全文

posted @ 2021-11-29 05:33 吴建明wujianming 阅读(2027) 评论(0) 推荐(0) 编辑

用动态实现扩展TVM

摘要：用动态实现扩展TVM Extending TVM with Dynamic Execution Outline ● Motivation for Dynamism ● Representing Dynamism ● Executing Dynamism ● Evaluation Dynamic Ne 阅读全文

posted @ 2021-11-28 16:32 吴建明wujianming 阅读(365) 评论(0) 推荐(0) 编辑

三段式LLVM编译器

摘要：三段式LLVM编译器目录概述 LLVM技术生态之编译器一、传统编译器的设计二、传统编译器模式的实现三、LLVM的三段式实现四、LLVM's Code Representation：LLVM IR 1、IR的表现形式 2、IR的格式文件类型 3、IR文件的编译处理流程 4、简单的IR布局阅读全文

posted @ 2021-11-28 05:29 吴建明wujianming 阅读(1129) 评论(0) 推荐(0) 编辑

JIT Code Generation代码生成

摘要：JIT Code Generation代码生成一．表达式编译代码生成（Code Generation）技术广泛应用于现代的数据系统中。代码生成是将用户输入的表达式、查询、存储过程等现场编译成二进制代码再执行，相比解释执行的方式，运行效率要高得多。尤其是对于计算密集型查询、或频繁重复使用的计算过程，运阅读全文

posted @ 2021-11-27 06:33 吴建明wujianming 阅读(324) 评论(0) 推荐(0) 编辑

linux C++打包程序总结

摘要：linux C++打包程序总结 linux c++ 动态库打包应用程序打包动态库搜索路径 1. 问题 linux环境下打包C++应用程序，包括依赖的动态库，以便解决程序发布后程序运行动态库缺失问题 2. 解决 l 动态库编译时添加-fPIC编译选项（一般动态库都会有此选项，自己写的库记得添加）阅读全文

posted @ 2021-11-26 06:02 吴建明wujianming 阅读(3298) 评论(0) 推荐(0) 编辑

深度学习编译器Data Flow和Control Flow

摘要：深度学习编译器Data Flow和Control Flow 本文介绍了一下深度学习框架的Data Flow和Control Flow，基于TensorFlow解释了TensorFlow是如何在静态图中实现Control Flow的。支持在Python层直接写Control Flow的动态图，最后基于阅读全文

posted @ 2021-11-25 06:33 吴建明wujianming 阅读(861) 评论(0) 推荐(0) 编辑

深度学习编译器综述The Deep Learning Compiler

摘要：深度学习编译器综述The Deep Learning Compiler The Deep Learning Compiler: A Comprehensive Survey 参考文献： https://arxiv.org/pdf/2002.03794v4.pdf 在不同的DL硬件上部署各种深度学习（阅读全文

posted @ 2021-11-24 06:12 吴建明wujianming 阅读(776) 评论(0) 推荐(0) 编辑

华为八爪鱼自动驾驶云

摘要：华为八爪鱼自动驾驶云 2019年10月世界智能网联汽车大会上，华为轮值董事长徐直军做了主题演讲，阐述了华为智能汽车业务战略，描绘了智能汽车解决方案的五大业务板块：智能网联、智能驾驶、智能座舱、智能电动、云服务，而华为自动驾驶云服务就位于金字塔的塔尖。本文参考链接： https://baijiaha 阅读全文

posted @ 2021-11-23 06:07 吴建明wujianming 阅读(1749) 评论(0) 推荐(0) 编辑

TVM apps extension示例扩展库

摘要：TVM apps extension示例扩展库此文件夹包含TVM的示例扩展库。演示了其它库如何在C++和Python API中扩展TVM。该库扩展了TVM的功能。 python模块加载新的共享库，可以使用TVM的python API进行插值。 https://github.com/apache/ 阅读全文

posted @ 2021-11-22 06:11 吴建明wujianming 阅读(94) 评论(0) 推荐(0) 编辑

TVM yolov3优化代码修改（编译运行OK）

摘要：TVM yolov3优化代码修改（编译运行OK）yolov3_quantize_sample.py 附https://github.com/makihiro/tvm_yolov3_sample代码： yolov3_quantize_sample.pyimport nnvm import nnvm.f 阅读全文

posted @ 2021-11-21 08:46 吴建明wujianming 阅读(293) 评论(0) 推荐(0) 编辑

TVM示例展示 README.md，Makefile，CMakeLists.txt

摘要：TVM示例展示 README.md，Makefile，CMakeLists.txt TVM/README.md <img src=https://raw.githubusercontent.com/apache/tvm-site/main/images/logo/tvm-logo-small.png 阅读全文

posted @ 2021-11-21 08:08 吴建明wujianming 阅读(107) 评论(0) 推荐(0) 编辑

TVM cmake示例展示

摘要：TVM cmake示例展示本文展示tvm/cmake中config.cmake，tvm/cmake/module/LLVM.cmake，tvm/cmake/module/CUDA.cmake，tvm/cmake/module/OpenCL.cmake 看TVM工程 tvm/cmake tvm/cm 阅读全文

posted @ 2021-11-21 06:07 吴建明wujianming 阅读(81) 评论(0) 推荐(0) 编辑

将编译器pass添加到Relay

摘要：将编译器pass添加到Relay 编译器pass是扩展Relay功能集和对Relay程序执行优化的主要接口。通过编写编译器pass，可以修改AST或收集有关AST的信息，具体取决于目标。事实上，Relay的一些最重要的内置功能（如autodiff和类型推断），只不过是“标准”编译器pass。在高层阅读全文

posted @ 2021-11-20 06:05 吴建明wujianming 阅读(183) 评论(0) 推荐(0) 编辑

如何将算子添加到Relay

摘要：如何将算子添加到Relay 本文将介绍在Relay中注册新TVM算子所需的步骤。将PR添加累积产品运算示例。PR本身建立在另一个PR的基础上，该PR添加了一个累积和运算。注册新算子需要几个步骤：添加一个属性节点，声明编译时已知的固定参数为算子编写一个类型关系，集成到Relay的类型系统中。使阅读全文

posted @ 2021-11-19 06:27 吴建明wujianming 阅读(151) 评论(0) 推荐(0) 编辑

Linux输入输出I/O

摘要：Linux输入输出I/O 本文主要以一张图介绍Linux在I/O上做了哪些事情，即Linux中直接I/O原理。引言先看一张图：这张图大体上描述了Linux系统上，应用程序对磁盘上的文件进行读写时，从上到下经历了哪些事情。这篇文章就以这张图为基础，介绍Linux在I/O上做了哪些事情。一、文件阅读全文

posted @ 2021-11-18 06:21 吴建明wujianming 阅读(316) 评论(0) 推荐(0) 编辑

c++ Factor泛型编程示例

摘要：c++ Factor泛型编程示例 c++ 泛型编程之Factor （c++ 设计新思维）一．概述泛化仿函数是将“请求（函数）封装起来”，存储与对象中，该对象是具有“value语义”的，因此支持拷贝，赋值和作为函数参数来传值（pass by value）。通过该对象可间接的处理封装的请求，类似于b 阅读全文

posted @ 2021-11-17 06:21 吴建明wujianming 阅读(231) 评论(0) 推荐(0) 编辑

自研GPU之火（续）

摘要：自研GPU之火（续）沐曦自研5nm GPU 近些年由于技术封锁，芯片产业发展受阻，自主研发的中国芯突破技术封锁一直是希望看到的。华为也因此走上了自主研发的道路，从最基础的工艺做起，虽然速度不快，但这是为打下技术基础所必须要做的，这一决定也受到我国众多企业以及全网网友的支持。前段时间有一家新的G 阅读全文

posted @ 2021-11-16 17:58 吴建明wujianming 阅读(501) 评论(0) 推荐(0) 编辑

Dorado用法与示例

摘要：Dorado用法与示例 dorado用后总结一.dorado概念 dorado的产品全名是“dorado展现中间件”。从产品形态上dorado由两部分组成，第一部分是一个具有AJAX特征的Web应用表现层的快速开发框架，第二部分配套的IDE开发工具。开发工具又可分为独立的dorado studio 阅读全文

posted @ 2021-11-16 15:51 吴建明wujianming 阅读(1088) 评论(0) 推荐(0) 编辑

如何在CPU上优化GEMM矩阵乘法

摘要：如何在CPU上优化GEMM矩阵乘法 How to optimize GEMM on CPU (TL;DR) TVM 提供抽象接口，允许用户分别描述算法和算法的实现组织（所谓的调度）。通常，在高性能调度中编写算法会破坏算法的可读性和模块化。此外，尝试各种看似有希望的调度也很耗时。在 TVM 的帮助下，阅读全文

posted @ 2021-11-16 14:37 吴建明wujianming 阅读(503) 评论(0) 推荐(0) 编辑

GPU创业之火

摘要：GPU创业之火壁仞，燧原，沐曦，天数，希姆，翰博，摩尔线程壁仞科技首款7nm芯片尚未流片，为何又获前AMD全球副总裁加盟？观察者网梳理发现，GPU（Graphics processing unit）被称作显示芯片，是擅长做图像图形相关运算工作的微处理器。GPGPU全称是通用图形处理器（Gene 阅读全文

posted @ 2021-11-16 06:20 吴建明wujianming 阅读(2793) 评论(0) 推荐(0) 编辑

Yolo v4, v3 and v2 性能极简图示

摘要：Yolo v4, v3 and v2 性能图示 https://github.com/AlexeyAB/darknet 参考链接： https://github.com/AlexeyAB/darknet 阅读全文

posted @ 2021-11-15 19:04 吴建明wujianming 阅读(124) 评论(0) 推荐(0) 编辑

英伟达TensorRT 8-bit Inference推理

摘要：英伟达TensorRT 8-bit Inference推理引论 ● 目标：将FP32 CNN转换为INT8，不会造成显著的精度损失。 ● 原因：Int8 Math具有更高的吞吐量和更低的内存需求。 ● 挑战：INT8的精度和动态范围，明显低于FP32。 ● 解决方案：在将训练模型权权重化为INT8 阅读全文

posted @ 2021-11-15 06:01 吴建明wujianming 阅读(515) 评论(0) 推荐(0) 编辑

如何将自定义代码生成TVM

摘要：如何将自定义代码生成TVM 如何将自定义代码生成TVM 本文参考链接： https://tvm.apache.org/docs/dev/how_to/relay_bring_your_own_codegen.html https://blog.csdn.net/weixin_42164269/art 阅读全文

posted @ 2021-11-14 07:09 吴建明wujianming 阅读(206) 评论(0) 推荐(0) 编辑

TVM代码流程分析

摘要：TVM代码流程分析 TVM - 代码生成流程本节主要介绍TVM的代码生成流程，即调用relay.build或tvm.build之后发生了什么，将深入到TVM的源代码进行剖析。（这里采用的依然是TVM v0.6）首先区分两个build的区别：tvm.build主要针对单一算子（参照Tensor E 阅读全文

posted @ 2021-11-13 18:00 吴建明wujianming 阅读(708) 评论(1) 推荐(0) 编辑

TVM实现hardware backend

摘要：TVM实现hardware backend官方的矩阵相加的示例如下：2个矩阵相加的实现for (int i = 0; i < n; ++i) { C[i] = A[i] + B[i];}怎么优化？可以并行相加，如下for (int bx = 0; bx < ceil(n / 64); ++bx) 阅读全文

posted @ 2021-11-13 06:10 吴建明wujianming 阅读(655) 评论(0) 推荐(0) 编辑

TVM自定义修改代码示例

摘要：TVM自定义修改代码示例一．TVM设备添加代码因为要添加的设备是一种类似于GPU的加速卡，TVM中提供了对GPU编译器的各种支持，有openCl，OpenGL和CUDA等，这里选取比较熟悉的CUDA进行模仿生成。总体上看，TVM是一个多层的结构。 TVM在python这一层提供了相关的设备接口，阅读全文

posted @ 2021-11-12 06:22 吴建明wujianming 阅读(313) 评论(0) 推荐(0) 编辑

tvm模型部署c++ 分析

摘要：tvm模型部署c++ 分析 tvm c++部署官方教程 https://github.com/apache/tvm/tree/main/apps/howto_deploy https://tvm.apache.org/docs/how_to/deploy/cpp_deploy.html 官方说执行r 阅读全文

posted @ 2021-11-11 06:10 吴建明wujianming 阅读(689) 评论(0) 推荐(0) 编辑

使用Tensor Expression张量表达式处理算子

摘要：使用Tensor Expression张量表达式处理算子这是TVM中Tensor表达语言的入门教程。TVM使用特定于域的张量表达式来进行有效的内核构造。本文将演示使用张量表达式语言的基本工作流程。 from __future__ import absolute_import, print_fun 阅读全文

posted @ 2021-11-10 16:58 吴建明wujianming 阅读(147) 评论(0) 推荐(0) 编辑

TVM优化c++部署实践

摘要：TVM优化c++部署实践使用TVM导入神经网络模型：模型支持pytorch , tensorflow , onnx, caffe 等。平时pytorch用的多，这里给一种pytorch的导入方式。 github代码仓：https://github.com/leoluopy/autotvm_tut 阅读全文

posted @ 2021-11-10 06:09 吴建明wujianming 阅读(1157) 评论(0) 推荐(0) 编辑

华为与大众合作

摘要：华为与大众合作重磅！华为大众合资？据36氪消息，36氪从多位知情人士处获悉，华为计划与全球汽车巨头大众集团组建合资公司，研发自动驾驶技术。目前，该项目正快速推进中。 36氪从消息人士处了解到，华为和大众组建的合资公司旨在作为供应商，向大众集团提供方案，双方讨论的合作方式之一是“大众出钱，成为合资阅读全文

posted @ 2021-11-09 06:07 吴建明wujianming 阅读(847) 评论(0) 推荐(0) 编辑

TVM开发三个示例分析

摘要：TVM开发三个示例分析把自主生成的代码生成TVM 把自主生成的代码生成TVM 目录简介 1. 要生成C代码。 2. 要生成任何其它图形表示。实现一个C代码生成器实现【CodegenC】运算符代码生成输入变量的代码生成代码发送实现【CSourceCodegen 】实现【GenCFun 阅读全文

posted @ 2021-11-08 06:14 吴建明wujianming 阅读(557) 评论(0) 推荐(0) 编辑

TVM基础编程示例分析

摘要：TVM基础编程示例分析一．TVM编程基础示例前言继前图灵奖获得者Hennessy和Patterson在ISCA 2018提出“A New Golden Age for Computer Architecture”，编译器界大神Chris Lattner在ASPLOS 2021提出了“The G 阅读全文

posted @ 2021-11-07 07:19 吴建明wujianming 阅读(1386) 评论(0) 推荐(0) 编辑

TVM中Python/C++接口调用关系

摘要：TVM中Python/C++接口调用关系 TVM已经是一个很庞大的系统，包含了很多的功能模块，python和c++的互相调用这个功能模块，没有使用第三方的开源库（boost.python、pybind11等），自主实现了一套复杂但精致高效强大的机制。这部分内容很多，本文分成三部分，分析实现原理：最阅读全文

posted @ 2021-11-06 06:24 吴建明wujianming 阅读(771) 评论(0) 推荐(0) 编辑

封装技术与加密技术

摘要：封装技术与加密技术一．4大主流封装技术半导体封装是指将通过测试的晶圆按照产品型号及功能需求加工得到独立芯片的过程。封装技术是一种将集成电路用绝缘的塑料或陶瓷材料打包的技术。以CPU为例，实际看到的体积和外观并不是真正的CPU内核的大小和面貌，而是CPU内核等元件经过封装后的产品。封装技术对于阅读全文

posted @ 2021-11-05 06:22 吴建明wujianming 阅读(1300) 评论(0) 推荐(0) 编辑

synopsys PCIE IP协议解析

摘要：synopsys PCIE IP协议解析 1．Overview Core支持单个Pcie内核的Loopback功能，该功能主要为了做芯片验证，以及在没有远程接收器件的情况下完成自己的回环。同时，Core也支持有远程接收器件的loopback，在该中情况下，远程接收器件称为loopback slave 阅读全文

posted @ 2021-11-04 06:21 吴建明wujianming 阅读(2486) 评论(0) 推荐(0) 编辑

JIT Compiler编译器及指令集

摘要：JIT Compiler编译器及指令集 LLVM一些编程语法语义特性 High Level Structure Module Structure LLVM 程序由Module's组成，每个 's 是输入程序的一个翻译单元。每个模块由函数，全局变量和符号表条目组成。模块可与 LLVM 链接器组合在一起阅读全文

posted @ 2021-11-03 06:24 吴建明wujianming 阅读(250) 评论(0) 推荐(0) 编辑

在Cuda上部署量化模型

摘要：在Cuda上部署量化模型介绍TVM自动量化。自动量化是TVM中的一种量化方式。将在ImageNet上导入一个GluonCV预先训练的模型到Relay，量化Relay模型，然后执行推理。 import tvm from tvm import te from tvm import relay impo 阅读全文

posted @ 2021-11-02 05:16 吴建明wujianming 阅读(149) 评论(0) 推荐(0) 编辑

Lambda 表达式基础理论与示例

摘要：Lambda 表达式基础理论与示例 Lambda 表达式，也可称为闭包，推动 Java 8 发布的最重要新特性。 Lambda 允许把函数作为一个方法的参数（函数作为参数传递进方法中）。使用 Lambda 表达式可以使代码变的更加简洁紧凑。语法 lambda 表达式的语法格式如下： (param 阅读全文

posted @ 2021-11-01 05:46 吴建明wujianming 阅读(108) 评论(0) 推荐(0) 编辑

吴建明

11 2021 档案

公告

搜索

常用链接

我的标签

随笔档案

阅读排行榜

评论排行榜

推荐排行榜

最新评论