06 2023 档案

摘要:GPU计算性能与渲染分析 GPU计算性能 单核CPU无论在PC端,还是服务器上,基本上已经退出历史舞台,目前主流的计算平台是使用多核(multiple cores)的CPU,以及众核(many cores)的GPU。另外处理器与内存访问速度差距也不断增大,为克服访存瓶颈,主要采用两种方法。其中多核C 阅读全文
posted @ 2023-06-28 04:59 吴建明wujianming 阅读(252) 评论(0) 推荐(0) 编辑
摘要:谈谈台积电2023年上海技术论坛 台积电上海技术论坛到底讲了些什么? 台积电介绍 台积电成立于1987年,是全球首创专业积体电路制造服务的公司。作为全球最大的晶圆代工企业的龙头,2015年营收成长10.6%,达266亿美元,市场总规模继续蝉联第一。身为专业积体电路制造服务业的创始者与领导者,台积电在 阅读全文
posted @ 2023-06-27 04:30 吴建明wujianming 阅读(596) 评论(0) 推荐(0) 编辑
摘要:分析一下光学卷积处理芯片 光学卷积处理芯片是一种利用光波作为信息处理载体的超高集成度处理器。由中国科学院半导体研究团队最近成功研制出,该芯片具有大带宽、低延迟和低功耗等优点,为人工智能应用带来了新的可能性。 光学卷积处理芯片是一种利用光波作为信息处理载体的超高集成度处理器。由中国科学院半导体研究团队 阅读全文
posted @ 2023-06-26 04:26 吴建明wujianming 阅读(951) 评论(0) 推荐(0) 编辑
摘要:Cpu0算术运算指令和逻辑运算指令 算术和逻辑指令 7.3.1 算术和逻辑指令 首先增加了更多的Cpu0算术运算指令和逻辑运算指令,这些在各个优化步骤中存在的 DAG 转换过程,可以使用 Graphviz 来图形化显示,展示出更多的有效信息。应该专注于 C 代码的操作和LLVM IR之间的映射,以及 阅读全文
posted @ 2023-06-25 05:14 吴建明wujianming 阅读(176) 评论(0) 推荐(0) 编辑
摘要:流片与晶圆代工产业 关于“流片” 流片是什么? 流片(tape-out)是指通过一系列工艺步骤在流水线上制造芯片,是集成电路设计的最后环节,也就是送交制造。 流片即为"试生产",是把电路设计变成ASIC芯片的过程。即Fabless厂商设计完电路后,在所有检查和验证都正确无误的情况下,将最后的GDSI 阅读全文
posted @ 2023-06-24 04:51 吴建明wujianming 阅读(461) 评论(0) 推荐(0) 编辑
摘要:LLVM IR类型系统杂谈 6.5.1 类型系统 如图6.4所示,类型系统是LLVM IR最重要的特性之一,强类型有利于在LLVM IR上开启大量优化。 图6.4 LLVM的基础数据类型 1. void类型 void类型代表无类型,与C/C++中的void同义,例如下面这段IR中定义了一个名为nop 阅读全文
posted @ 2023-06-23 04:56 吴建明wujianming 阅读(248) 评论(0) 推荐(0) 编辑
摘要:获取LLVM IR方法示例 LLVM IR三种形式 LLVM IR有三种形式,分别是内存中的编译中间表示、磁盘上的二进制码和可读汇编文本,后两种形式可以通过以下命令获取 # 二进制码形式 clang -emit-llvm -c main.c -o main.bc # 可读汇编文本形式 clang - 阅读全文
posted @ 2023-06-22 05:08 吴建明wujianming 阅读(116) 评论(0) 推荐(0) 编辑
摘要:OpenCL(Open Computing Language,开放计算语言)杂谈 参考文献链接 https://zhuanlan.zhihu.com/p/602844623 Linux内核库:一文细说OpenCL框架 OpenCL编程指南-1.2OpenCL基本概念_阳光开朗男孩的博客-CSDN博客 阅读全文
posted @ 2023-06-21 04:39 吴建明wujianming 阅读(273) 评论(0) 推荐(0) 编辑
摘要:Cache 与Memory架构及数据交互 Memory杂谈(DRAM,SRAM) 一个正常的40nm工艺,一个6T(6 transistors)的SRAM面积是150*0.04*0.04= 0.24um2/SRAM。如果需要一个1Mb的SRAM,面积是1M*0.24um2= 0.24mm2,大概0. 阅读全文
posted @ 2023-06-20 04:36 吴建明wujianming 阅读(273) 评论(0) 推荐(0) 编辑
摘要:GPGPU几个开发工具包 独家访问数百种免费软件和性能分析工具,这些工具涵盖从 AI 和 HPC 到自动驾驶汽车、机器人、仿真等不同行业和用例。 英伟达 cuDNN NVIDIA® CUDA® 深度神经网络库 (cuDNN) 是一个用于深度神经网络的 GPU 加速原语库。cuDNN 为标准例程提供了 阅读全文
posted @ 2023-06-19 04:26 吴建明wujianming 阅读(154) 评论(0) 推荐(0) 编辑
摘要:NVIDIA Nsight Compute 的用户手册 NVIDIA Nsight Compute User Interface (UI) 手冊。 有关工具 UI 中所有视图、控件和工作流的信息。 可视探查器的过渡指南。 1. 简介 对于从 Visual Profiler 迁移到 NVIDIA Ns 阅读全文
posted @ 2023-06-18 05:14 吴建明wujianming 阅读(2540) 评论(0) 推荐(0) 编辑
摘要:计算机视觉中小目标检测分析 小目标检测是计算机视觉领域中的一个极具挑战性的问题。随着深度学习和计算机视觉领域的不断发展,越来越多的应用场景需要对小目标进行准确的检测和识别。 小目标是指目标占图像面积小于1%的目标,由于目标携带信息少、定位精度要求高、易被环境噪声淹没,目前仍是目标检测的一大难点。 其 阅读全文
posted @ 2023-06-17 04:52 吴建明wujianming 阅读(372) 评论(0) 推荐(0) 编辑
摘要:clang前端基础系统概要 4.1编译器Clang会代替GCC吗? Clang是一个C语言、C++、Objective-C语言的轻量级编译器,遵循BSD协议。 Clang编译速度快、内存占用小、兼容GCC等一些优秀的特点使得很多工具都在使用它。 现在Clang和GCC的异同。 4.1.1 GCC概念 阅读全文
posted @ 2023-06-13 04:41 吴建明wujianming 阅读(348) 评论(0) 推荐(0) 编辑
摘要:LLVM外部项目清单介绍 核心LLVM和Clang代码库之外的项目是外部项目,需要单独下载。本章会介绍几种官方LLVM的外部项目,并解释如何编译安装它们。 将介绍以下项目,包括如何安装它们: 1)LLDB 2)Libc++ 3)Compiler-RT 4)DragonEgg 5)LLVM test 阅读全文
posted @ 2023-06-13 04:02 吴建明wujianming 阅读(234) 评论(0) 推荐(0) 编辑
摘要:编译和安装LLVM整个流程 1.1 LLVM系统入门 LLVM项目包括多个组件。该项目的核心本身被称为LLVM。其中包含所需的所有工具、库和头文件,以便处理中间表达式并将其转换为目标对象文件。LLVM工具包括汇编程序、反汇编程序、位代码分析器和位代码优化器。另外,LLVM还包含基本的回归测试。 类C 阅读全文
posted @ 2023-06-13 03:52 吴建明wujianming 阅读(3657) 评论(0) 推荐(0) 编辑
摘要:参考文献链接 https://mp.weixin.qq.com/s/PZGGwqhyRjGDSl0tuH5EUw 半导体下游应用广泛, 与经济发展密切相关。 半导体( semiconductor) 指常温下导电性能介于导体与绝缘体之间的材料, 其电阻率随着温度的升高而升高, 可用来制作集成电路与半导 阅读全文
posted @ 2023-06-12 05:09 吴建明wujianming 阅读(461) 评论(0) 推荐(0) 编辑
摘要:Nvidia与联发科联手造芯,PK高通 英伟达、联发科携手造芯,高通危矣? 智能座舱领域一直是高通领跑,自2022年开始,中国市场推出的主流新车的座舱域控制器几乎由高通平台垄断,目前高通已经是上车规模最大的单一座舱域控计算平台之一。联发科与英伟达在AI智能座舱领域的合作,能否将打破高通一家独大的格局 阅读全文
posted @ 2023-06-11 04:23 吴建明wujianming 阅读(74) 评论(0) 推荐(0) 编辑
摘要:编译器中的类、元类、根源类1. 源码main.m #import <Foundation/Foundation.h> @interface YCFather : NSObject @property (nonatomic, copy) NSString *name; + (void)clsSayHe 阅读全文
posted @ 2023-06-10 04:43 吴建明wujianming 阅读(27) 评论(0) 推荐(0) 编辑
摘要:2023年中国创业独角兽分析报告 参考文献链接 https://mp.weixin.qq.com/s/yOb-KVTd2kqmbM4wrfl6pA 核心观点 1、 2023年,我国独角兽整体规模突破13万亿,去年9.4万亿,继续增长。独角兽数量超过500家,同比大幅增长42%以上。 2、 北京、上海 阅读全文
posted @ 2023-06-09 05:08 吴建明wujianming 阅读(245) 评论(0) 推荐(0) 编辑
摘要:DragonEgg示例分析 以下是使用gcc-4.5编译一个简单的“hello-world”程序的结果: $ gcc hello.c -S -O1 -o - .file "hello.c" .section .rodata.str1.1,"aMS",@progbits,1 .LC0: .string 阅读全文
posted @ 2023-06-08 04:17 吴建明wujianming 阅读(32) 评论(0) 推荐(0) 编辑
摘要:大模型与LLM语言分析 如何利用LLM做多模态任务? 大型语言模型LLM(Large Language Model)具有很强的通用知识理解以及较强的逻辑推理能力,但其只能处理文本数据。虽然已经发布的GPT4具备图片理解能力,但目前还未开放多模态输入接口并且不会透露任何模型上技术细节。因此,现阶段,如 阅读全文
posted @ 2023-06-07 04:53 吴建明wujianming 阅读(739) 评论(0) 推荐(0) 编辑
摘要:基于Transformer的模型和硬件自动驾驶中的加速度分析:调查 近年来,Transformer架构在各种自动驾驶应用中表现出了良好的性能。另一方面,其在便携式计算平台上的专用硬件加速已成为在真正的自动驾驶汽车中实际部署的下一个关键步骤。这篇综述对基于Transformer的模型进行了全面的概述、 阅读全文
posted @ 2023-06-06 05:14 吴建明wujianming 阅读(310) 评论(0) 推荐(0) 编辑
摘要:主要介绍的是LLVM IR中的异常处理的方法。主要的参考文献是Exception Handling in LLVM。 1. 异常处理的要求 异常处理在许多高级语言中都是很常见的,在诸多语言的异常处理的方法中,try .. catch块的方法是最多的。对于用返回值来做异常处理的语言(如C、Rust、G 阅读全文
posted @ 2023-06-05 04:32 吴建明wujianming 阅读(104) 评论(0) 推荐(0) 编辑
摘要:控制流语句与消除无用的 JMP 指令 1. 简要说明 从机器层面上来看,所有的跳转只分为无条件跳转和有条件跳转,从跳转方式上来分,又分为直接跳转(绝对地址)和间接跳转(相对偏移),所以只需要将 LLVM IR 的跳转 node 成功下降到机器跳转指令,并维护好跳转的范围、跳转的重定位信息即可。 Cp 阅读全文
posted @ 2023-06-04 05:16 吴建明wujianming 阅读(121) 评论(0) 推荐(0) 编辑
摘要:Nutshell中的LLVM LTO(Link Time Optimizer) 链接时优化 生成了.o文件,但它们实际上是原始位代码文件main.o test1.o test2.o LLVM LTO:在Nutshell静态存档中将包含这些位代码文件。 高度并行的前端处理+初始优化。 将所有位代码链接 阅读全文
posted @ 2023-06-03 04:23 吴建明wujianming 阅读(67) 评论(0) 推荐(0) 编辑
摘要:2023年前4个月中国汽车市场行情 2023年1-4月中国占世界汽车份额30% 图表:2023年1至4月我国汽车产销量同比稳步增长 2023年4月的世界汽车销量达到664万台,同比增22%。2023年1-4月的世界汽车销量达到2709万台,同比增长8%,但距离近几年的高点水平差距达14%,差距水平较 阅读全文
posted @ 2023-06-02 04:10 吴建明wujianming 阅读(250) 评论(0) 推荐(0) 编辑
摘要:LLVM Link Time Optimizer 链接时优化图例 参考文献链接 https://blog.csdn.net/dashuniuniu/article/details/122769486?spm=1001.2014.3001.5502 阅读全文
posted @ 2023-06-01 04:38 吴建明wujianming 阅读(20) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示