上一页 1 ··· 101 102 103 104 105 106 107 108 109 ··· 273 下一页
摘要: TVM yolov3优化代码修改(编译运行OK)yolov3_quantize_sample.py 附https://github.com/makihiro/tvm_yolov3_sample代码: yolov3_quantize_sample.pyimport nnvm import nnvm.f 阅读全文
posted @ 2021-11-21 08:46 吴建明wujianming 阅读(283) 评论(0) 推荐(0) 编辑
摘要: TVM示例展示 README.md,Makefile,CMakeLists.txt TVM/README.md <img src=https://raw.githubusercontent.com/apache/tvm-site/main/images/logo/tvm-logo-small.png 阅读全文
posted @ 2021-11-21 08:08 吴建明wujianming 阅读(106) 评论(0) 推荐(0) 编辑
摘要: TVM cmake示例展示 本文展示tvm/cmake中config.cmake,tvm/cmake/module/LLVM.cmake,tvm/cmake/module/CUDA.cmake,tvm/cmake/module/OpenCL.cmake 看TVM工程 tvm/cmake tvm/cm 阅读全文
posted @ 2021-11-21 06:07 吴建明wujianming 阅读(81) 评论(0) 推荐(0) 编辑
摘要: 将编译器pass添加到Relay 编译器pass是扩展Relay功能集和对Relay程序执行优化的主要接口。通过编写编译器pass,可以修改AST或收集有关AST的信息,具体取决于目标。事实上,Relay的一些最重要的内置功能(如autodiff和类型推断),只不过是“标准”编译器pass。 在高层 阅读全文
posted @ 2021-11-20 06:05 吴建明wujianming 阅读(179) 评论(0) 推荐(0) 编辑
摘要: 如何将算子添加到Relay 本文将介绍在Relay中注册新TVM算子所需的步骤。将PR添加累积产品运算示例。PR本身建立在另一个PR的基础上,该PR添加了一个累积和运算。 注册新算子需要几个步骤: 添加一个属性节点,声明编译时已知的固定参数 为算子编写一个类型关系,集成到Relay的类型系统中。 使 阅读全文
posted @ 2021-11-19 06:27 吴建明wujianming 阅读(148) 评论(0) 推荐(0) 编辑
摘要: Linux输入输出I/O 本文主要以一张图介绍Linux在I/O上做了哪些事情,即Linux中直接I/O原理。 引言 先看一张图: 这张图大体上描述了Linux系统上,应用程序对磁盘上的文件进行读写时,从上到下经历了哪些事情。这篇文章就以这张图为基础,介绍Linux在I/O上做了哪些事情。 一、文件 阅读全文
posted @ 2021-11-18 06:21 吴建明wujianming 阅读(308) 评论(0) 推荐(0) 编辑
摘要: c++ Factor泛型编程示例 c++ 泛型编程 之Factor (c++ 设计新思维)一.概述 泛化仿函数是将“请求(函数)封装起来”,存储与对象中,该对象是具有“value语义”的,因此支持拷贝,赋值和作为函数参数来传值(pass by value)。通过该对象可间接的处理封装的请求,类似于b 阅读全文
posted @ 2021-11-17 06:21 吴建明wujianming 阅读(223) 评论(0) 推荐(0) 编辑
摘要: 自研GPU之火(续) 沐曦自研5nm GPU 近些年由于技术封锁,芯片产业发展受阻,自主研发的中国芯突破技术封锁一直是希望看到的。 华为也因此走上了自主研发的道路,从最基础的工艺做起,虽然速度不快,但这是为打下技术基础所必须要做的,这一决定也受到我国众多企业以及全网网友的支持。 前段时间有一家新的G 阅读全文
posted @ 2021-11-16 17:58 吴建明wujianming 阅读(474) 评论(0) 推荐(0) 编辑
摘要: Dorado用法与示例 dorado用后总结 一.dorado概念 dorado的产品全名是“dorado展现中间件”。从产品形态上dorado由两部分组成,第一部分是一个具有AJAX特征的Web应用表现层的快速开发框架,第二部分配套的IDE开发工具。开发工具又可分为独立的dorado studio 阅读全文
posted @ 2021-11-16 15:51 吴建明wujianming 阅读(1055) 评论(0) 推荐(0) 编辑
摘要: 如何在CPU上优化GEMM矩阵乘法 How to optimize GEMM on CPU (TL;DR) TVM 提供抽象接口,允许用户分别描述算法和算法的实现组织(所谓的调度)。通常,在高性能调度中编写算法会破坏算法的可读性和模块化。此外,尝试各种看似有希望的调度也很耗时。在 TVM 的帮助下, 阅读全文
posted @ 2021-11-16 14:37 吴建明wujianming 阅读(475) 评论(0) 推荐(0) 编辑
上一页 1 ··· 101 102 103 104 105 106 107 108 109 ··· 273 下一页