12 2021 档案

摘要:Cache Memory技术示例 为什么需要cache?如何判断一个数据在cache中是否命中?cache的种类有哪些,区别是什么? 为什么需要cache memory 先思考第一个问题:程序是如何运行起来的?应该知道程序是运行在 RAM之中,RAM 就是常说的DDR(例如 DDR3、DDR4等)。 阅读全文
posted @ 2021-12-31 06:06 吴建明wujianming 阅读(159) 评论(0) 推荐(0) 编辑
摘要:新一代图像AI ISP技术 2021年12月29日消息,近日,华为海思发布了新一代的越影AI ISP,这是用于物联网智能终端的新一代智能图像处理引擎,突破传统 ISP 图像处理的极限,将业界画质标杆推向新的高度。在近日开幕的2021安博会上,华为海思也展示了新一代越影AI ISP的性能。 现在上海海 阅读全文
posted @ 2021-12-30 06:05 吴建明wujianming 阅读(2106) 评论(0) 推荐(0) 编辑
摘要:芯片倒爷赚钱术 囤芯片现货有人创收几千万上亿。想了48个小时,理了个思路,从长期看应该留哪几颗芯片: 一、电脑游戏级显卡,手机高清显卡。 二、高速存储器芯片或存储器本身。 三、物联网高速通讯芯片。 四、人工智能设备终端芯片,本地计算芯片那种。 2021年12月17日,早上8点17分。 站在华强北步行 阅读全文
posted @ 2021-12-29 05:13 吴建明wujianming 阅读(2516) 评论(0) 推荐(0) 编辑
摘要:一站式智能芯片定制技术 从55nm到5nm先进工艺,拥有创纪录(> 200次流片)和年10万片FinFET晶圆授权量产的骄人业绩,并且成功率高达100%。15年以来,先进工艺产品交付纪录持续行业领先。 提供全球六大晶圆厂一站式ASIC定制解决方案,包括TURNKEY ASIC设计、从FPGA到ASI 阅读全文
posted @ 2021-12-28 06:19 吴建明wujianming 阅读(733) 评论(0) 推荐(0) 编辑
摘要:视频会议系统方案 硬件 SKY D510i是科达一款一体化高清触控视频会议终端,内置双摄像机、数字麦克风、高保真音箱,内置大尺寸高清触控屏可提供宽广的视野。SKY D510i支持H.265协议,具备超强的视频处理性能和卓越的低带宽适应性,具备语音助手、人脸解锁的智能特性,采用全新的外观及UI设计,操 阅读全文
posted @ 2021-12-26 05:37 吴建明wujianming 阅读(1803) 评论(0) 推荐(0) 编辑
摘要:CPU 内部结构解析为什么计算机能运行编写的代码(比如c语言,计算机为什么会运行这个东西,原理是什么)? 就目前理解,编辑的c语言最终加载到计算机的是二进制的数据,然后cpu 根据这些数据去进行相关的运算,那cpu 是为什么能看懂这些二级制的数呢? 还有就是编写c语言的时候,不是有全局变量,局部变量 阅读全文
posted @ 2021-12-25 06:22 吴建明wujianming 阅读(1836) 评论(0) 推荐(0) 编辑
摘要:企业如何选择音视频会议系统分析腾讯会议和钉钉,哪个费用更划算?市面上的两大视频会议软件,腾讯会议和钉钉,收费标准和付费功能哪个性价比更高,适合长期使用腾讯会议和钉钉我都用过,个人认为性价比高一点的是腾讯会议。具体说说为什么腾讯会议比钉钉更划算,更适合长期使用。首先,先来分别说下腾讯会议和钉钉的需要付 阅读全文
posted @ 2021-12-24 06:04 吴建明wujianming 阅读(1504) 评论(0) 推荐(0) 编辑
摘要:SECTIONS bss段初始化分析 都知道bss段需要初始化,但是这是为什么呢? 通过浏览资料,都会发现,bss段是不会出现在程序下载文件(*.bin *.hex)中的,因为全都是0。如果把出现在程序下载文件中,会增加程序下载文件的大小。实际应用中,通常只需要把bss段的起始地址和结束地址保存起来 阅读全文
posted @ 2021-12-23 05:28 吴建明wujianming 阅读(155) 评论(0) 推荐(0) 编辑
摘要:自动驾驶参数分析 实现更高级别的自动驾驶能力,主要取决于智能驾驶模块的三个重要环节:环境感知—计算决策—控制执行,分别对应于人的“眼睛-大脑-神经”。后两者暂且按下不表,只单论市面上几种主流的视觉识别方案,行业的分歧在于——摄像头,毫米波雷达,超声波雷达,激光雷达。 摄像头,毫米波雷达,超声波雷达, 阅读全文
posted @ 2021-12-22 05:43 吴建明wujianming 阅读(789) 评论(0) 推荐(0) 编辑
摘要:堆栈,数据,文本,heap,bss,text data,stack text data bss stack heap 段 根据APUE,程序分为下面的段:.text, data (initialized), bss, stack, heap。 data/bss/text: text段在内存中被映射为 阅读全文
posted @ 2021-12-21 06:09 吴建明wujianming 阅读(408) 评论(0) 推荐(0) 编辑
摘要:Swift与LLVM-Clang原理与示例 LLVM 学习 从 简单汇编基础 到 Swift 不简单的 a + 1 作为iOS开发,程序崩溃犹如家常便饭,秉着没有崩溃也要制造崩溃的原则 每天都吃的很饱 但学艺不精的经常有这样的困扰,每次崩溃都定位到一堆。类似 movq $0x0, 0xc7a(%ri 阅读全文
posted @ 2021-12-20 06:01 吴建明wujianming 阅读(538) 评论(0) 推荐(0) 编辑
摘要:Imagination 的神经网络加速器和 Visidon 的去噪算法被证明是完美的搭档 本文是总部位于芬兰的Visidon和总部位于英国的 Imagination合作的结果。Visidon 是公认的相机图像增强和分析算法专家,Imagination 拥有一系列世界一流的神经网络加速器(NNA),每 阅读全文
posted @ 2021-12-19 05:52 吴建明wujianming 阅读(368) 评论(0) 推荐(0) 编辑
摘要:IP 公司与GPU IP 1.IP公司及其处理器IP系列(DSP, GPU, AI) Synopsys 来源:https://www.synopsys.com/zh-cn/designware-ip.html ARC处理器 Embedded Vision Processors EV5x EV6x C 阅读全文
posted @ 2021-12-18 06:21 吴建明wujianming 阅读(1161) 评论(0) 推荐(0) 编辑
摘要:Computer OS系统基本原理 第一章 绪论(考概念) 什么是OS? o 操作系统是一组控制和管理计算机软硬件资源、合理地对各类作业进行调度以及方便用户使用的程序集合。 o 操作系统是位于硬件层(HAL)之上,所有其它系统软件层之下的一个系统软件,使得管理系统中的各种软件和硬件资源得以充分利用, 阅读全文
posted @ 2021-12-17 06:34 吴建明wujianming 阅读(209) 评论(0) 推荐(0) 编辑
摘要:OpenCL编程详细解析与实例 C语言与OpenCL的编程示例比较 参考链接: https://www.zhihu.com/people/wujianming_110117/posts 先以图像旋转的实例,具体介绍OpenCL编程的步骤。 首先给出实现流程,然后给出实现图像旋转的C循环实现和Open 阅读全文
posted @ 2021-12-16 05:58 吴建明wujianming 阅读(966) 评论(0) 推荐(0) 编辑
摘要:C语言与OpenCL的编程示例比较 OpenCL支持数据并行,任务并行编程,同时支持两种模式的混合。对于同步 OpenCL支持同一工作组内工作项的同步和命令队列中处于同一个上下文中的 命令的同步。 在本文中以图像旋转的实例,具体介绍OpenCL编程的步骤。 首先给出实现流程,然后给出实现图像旋转的C 阅读全文
posted @ 2021-12-15 10:20 吴建明wujianming 阅读(211) 评论(0) 推荐(0) 编辑
摘要:自动微分延迟计算 BP(反向传播),为什么BP不好呢?每一步都会保存了上一步中,计算出来的缓冲数据,这样在每次进行反向传播时,占用的内存比较高。 自动微分的核心概念,延迟计算。 先选取一个目标函数,求输出两个权重参数(W_1,W_2W1​,W2​)的导数。 先求出1/x的导数-1/x_2−1/x2​ 阅读全文
posted @ 2021-12-15 06:14 吴建明wujianming 阅读(196) 评论(0) 推荐(0) 编辑
摘要:TensorRT优化方案图例 图 12. TensorRT 循环由循环边界层设置。数据流只能通过下方式离开循环环输出层. 唯一允许的后边缘是第二个输入递归层。 图 13. 一个 if 条件构造抽象模型 图 14. 使用控制条件执行 IIf条件输入层 放置 图 15. 层执行和在 CPU 端启动的内核 阅读全文
posted @ 2021-12-14 05:51 吴建明wujianming 阅读(147) 评论(0) 推荐(0) 编辑
摘要:Tensorrt一些优化技术介绍 Figure 1. A quantizable AveragePool layer (in blue) is fused with a DQ layer and a Q layer. All three layers are replaced by a quanti 阅读全文
posted @ 2021-12-13 05:48 吴建明wujianming 阅读(181) 评论(0) 推荐(0) 编辑
摘要:LLVM与Clang编译图例 参考链接: https://blog.csdn.net/u012874859/article/details/108530256 阅读全文
posted @ 2021-12-12 06:24 吴建明wujianming 阅读(45) 评论(0) 推荐(0) 编辑
摘要:OpenCL产业开发链 OPEN STANDARD FOR PARALLEL PROGRAMMING OF HETEROGENEOUS SYSTEMS OpenCL™ (Open Computing Language,开放计算语言)是一种开放、免版税的标准,适用于超级计算机、云服务器、个人计算机、移 阅读全文
posted @ 2021-12-11 06:31 吴建明wujianming 阅读(147) 评论(0) 推荐(0) 编辑
摘要:OpenCL框架与示例下面的图简单说明了OpenCL的编程框架,图是用的GPU,其他类似; 名词的概念: Platform (平台):主机加上OpenCL框架管理下的若干设备构成了这个平台,通过这个平台,应用程序可以与设备共享资源并在设备上执行kernel。实际使用中基本上一个厂商对应一个Platf 阅读全文
posted @ 2021-12-10 06:17 吴建明wujianming 阅读(482) 评论(0) 推荐(0) 编辑
摘要:pass基础架构分析 Relay 和 TVM IR,包含一系列优化passes,可提高模型的性能指标,如平均推理,内存占用,或特定设备的功耗。有一套标准优化,及特定机器学习的优化,包括常量折叠,死代码消除,算子布局更改,算子融合,缓冲区处理和循环转换等。这些passes中的每一个,构造为一个 ir- 阅读全文
posted @ 2021-12-09 06:21 吴建明wujianming 阅读(825) 评论(0) 推荐(0) 编辑
摘要:TensorFlow XLA优化与Memory XLA概述 XLA(加速线性代数)是用于优化TensorFlow计算的线性代数的域特定编译器。结果是在服务器与移动平台上的速度,内存使用率与可移植性得到了改善。最初,大多数用户不会从XLA中看到很大的好处,通过使用即时(JIT)编译或提前编译(AOT) 阅读全文
posted @ 2021-12-08 05:56 吴建明wujianming 阅读(351) 评论(0) 推荐(0) 编辑
摘要:CUDA编程图例 CUDA C++ Programming Guide Figure 7. Matrix Multiplication without Shared Memory Figure 8. Matrix Multiplication with Shared Memory Figure 20 阅读全文
posted @ 2021-12-07 06:12 吴建明wujianming 阅读(76) 评论(0) 推荐(0) 编辑
摘要:写算子单元测试Writing Unit Tests! 一些单元测试示例,可在tests/python/relay/test_op_level3.py中找到,用于累积总和与乘积算子。 梯度算子 梯度算子对于编写Relay中的可微程序非常重要。虽然Relay的autodiff算法可区分一流的语言结构,但 阅读全文
posted @ 2021-12-06 05:45 吴建明wujianming 阅读(131) 评论(0) 推荐(0) 编辑
摘要:ADAS产业链分析自动驾驶汽车(AutonomousVehicles,AV)指通过搭载先进传感器等装置,运用人工智能、视觉计算、雷达和全球定位及车路协同等技术,使汽车具有环境感知、路径规划和自主控制的能力,从而可让计算机自动操作的机动车辆。自动驾驶车辆最大特点是人工智能技术的主导,其驾驶过程是机器不 阅读全文
posted @ 2021-12-05 06:35 吴建明wujianming 阅读(1690) 评论(0) 推荐(0) 编辑
摘要:ONNX MLIR应用示例(含源码链接) 开放式神经网络交换在MLIR中的实现 (http://onnx.ai/onnx-mlir/)。 Prebuilt Containers 开始使用ONNX-MLIR的一个简单方法是使用预构建的docker映像。这些映像是在主干上成功合并生成的结果。最新的图像代 阅读全文
posted @ 2021-12-04 06:44 吴建明wujianming 阅读(888) 评论(0) 推荐(0) 编辑
摘要:App性能分析数据监控 APP的性能监控包括: CPU 占用率、内存使用情况、网络状况监控、启动时闪退、卡顿、FPS、使用时崩溃、耗电量监控、流量监控等等。 文中所有代码都已同步到github中,有兴趣的可以clone 下来一起探讨下。 环境 Xcode 10.0+ Swift 4.2 1 . CP 阅读全文
posted @ 2021-12-03 06:16 吴建明wujianming 阅读(805) 评论(0) 推荐(0) 编辑
摘要:2021年8-10月AI融资方向分析 3个月近百家AI创企猛吸金,机器人和自动驾驶占最多。 智东西11月29日消息,据智东西不完全统计,2021年8-10月,国内AI企业融资超过200起,其中单笔金额超1亿元人民币的AI企业融资超过90起,融资总金额超356亿元,涉及自动驾驶、机器人、工业互联网、智 阅读全文
posted @ 2021-12-01 06:12 吴建明wujianming 阅读(270) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示