摘要:
Swift与LLVM-Clang原理与示例 LLVM 学习 从 简单汇编基础 到 Swift 不简单的 a + 1 作为iOS开发,程序崩溃犹如家常便饭,秉着没有崩溃也要制造崩溃的原则 每天都吃的很饱 但学艺不精的经常有这样的困扰,每次崩溃都定位到一堆。类似 movq $0x0, 0xc7a(%ri 阅读全文
摘要:
Imagination 的神经网络加速器和 Visidon 的去噪算法被证明是完美的搭档 本文是总部位于芬兰的Visidon和总部位于英国的 Imagination合作的结果。Visidon 是公认的相机图像增强和分析算法专家,Imagination 拥有一系列世界一流的神经网络加速器(NNA),每 阅读全文
摘要:
IP 公司与GPU IP 1.IP公司及其处理器IP系列(DSP, GPU, AI) Synopsys 来源:https://www.synopsys.com/zh-cn/designware-ip.html ARC处理器 Embedded Vision Processors EV5x EV6x C 阅读全文
摘要:
Computer OS系统基本原理 第一章 绪论(考概念) 什么是OS? o 操作系统是一组控制和管理计算机软硬件资源、合理地对各类作业进行调度以及方便用户使用的程序集合。 o 操作系统是位于硬件层(HAL)之上,所有其它系统软件层之下的一个系统软件,使得管理系统中的各种软件和硬件资源得以充分利用, 阅读全文
摘要:
OpenCL编程详细解析与实例 C语言与OpenCL的编程示例比较 参考链接: https://www.zhihu.com/people/wujianming_110117/posts 先以图像旋转的实例,具体介绍OpenCL编程的步骤。 首先给出实现流程,然后给出实现图像旋转的C循环实现和Open 阅读全文
摘要:
C语言与OpenCL的编程示例比较 OpenCL支持数据并行,任务并行编程,同时支持两种模式的混合。对于同步 OpenCL支持同一工作组内工作项的同步和命令队列中处于同一个上下文中的 命令的同步。 在本文中以图像旋转的实例,具体介绍OpenCL编程的步骤。 首先给出实现流程,然后给出实现图像旋转的C 阅读全文
摘要:
自动微分延迟计算 BP(反向传播),为什么BP不好呢?每一步都会保存了上一步中,计算出来的缓冲数据,这样在每次进行反向传播时,占用的内存比较高。 自动微分的核心概念,延迟计算。 先选取一个目标函数,求输出两个权重参数(W_1,W_2W1,W2)的导数。 先求出1/x的导数-1/x_2−1/x2 阅读全文
摘要:
TensorRT优化方案图例 图 12. TensorRT 循环由循环边界层设置。数据流只能通过下方式离开循环环输出层. 唯一允许的后边缘是第二个输入递归层。 图 13. 一个 if 条件构造抽象模型 图 14. 使用控制条件执行 IIf条件输入层 放置 图 15. 层执行和在 CPU 端启动的内核 阅读全文
摘要:
Tensorrt一些优化技术介绍 Figure 1. A quantizable AveragePool layer (in blue) is fused with a DQ layer and a Q layer. All three layers are replaced by a quanti 阅读全文
摘要:
LLVM与Clang编译图例 参考链接: https://blog.csdn.net/u012874859/article/details/108530256 阅读全文