06 2024 档案

摘要:Openvx & Tiovx技术杂谈 Openvx & Tiovx (六) Host & Target https://zhuanlan.zhihu.com/p/474701695 https://dev.ti.com/tirex/explore/node?node=ANd.gAKGXC97Fbol 阅读全文
posted @ 2024-06-30 06:43 吴建明wujianming 阅读(110) 评论(0) 推荐(0) 编辑
摘要:嵌入式计算和视觉加速的开放标准 https://www.khronos.org/assets/uploads/developers/presentations/Khronos_Embedded_Compute_and_Vision_Overview_Jun24.pdf Khronos将软件连接到硅 阅读全文
posted @ 2024-06-29 16:46 吴建明wujianming 阅读(27) 评论(0) 推荐(0) 编辑
摘要:OpenVX™图形管道化、流式处理和批处理扩展到OpenVX 1.1和1.2 https://registry.khronos.org/OpenVX/extensions/vx_khr_pipelining/1.0.1/vx_khr_pipelining_1_0_1.html 1.简介 1.1. 意 阅读全文
posted @ 2024-06-28 04:39 吴建明wujianming 阅读(85) 评论(0) 推荐(0) 编辑
摘要:AI不同技术方向杂谈 语言≠思维,大模型学不了推理:一篇Nature让AI社区炸锅了 https://mp.weixin.qq.com/s/BgMNITn5e1RGUOHQLKv7yg 大语言模型(LLM)为什么空间智能不足,GPT-4 为什么用语言以外的数据训练,就能变得更聪明?现在这些问题有 「 阅读全文
posted @ 2024-06-27 04:26 吴建明wujianming 阅读(94) 评论(0) 推荐(0) 编辑
摘要:智算实验室解决方案杂谈 https://support.huawei.com/enterprise/zh/doc/EDOC1100289379/9170fd69#ZH-CN_TOPIC_0000001268857688 构建智算实验室, 加速科研智能化 华为智算实验室方案包含智算中心、超算中心、实验 阅读全文
posted @ 2024-06-26 06:48 吴建明wujianming 阅读(152) 评论(0) 推荐(0) 编辑
摘要:OpenCL流程分析与示例 OpenCL示例 Vortex存储库的tests/OpenCL目录中有OpenCL测试程序。OpenCL程序分为主机代码和设备代码。[cc|cpp]和kernel.cl。 OpenCL通过在设备端并行执行内核来加快速度。来看看tests/opencl/sgemm中的代码作 阅读全文
posted @ 2024-06-25 04:53 吴建明wujianming 阅读(74) 评论(0) 推荐(0) 编辑
摘要:RSpromoter:基于视觉模型的遥感实例分割提示学习 摘要-利用来自SA-1B的大量训练数据,分段任意模型(SAM)展示了显著的泛化和零样本能力。然而,作为一种与类别无关的实例分割方法,SAM在很大程度上依赖于先前的手动指导,包括点、框和粗粒度掩码。此外,它在遥感图像分割任务中的性能在很大程度上 阅读全文
posted @ 2024-06-23 04:33 吴建明wujianming 阅读(82) 评论(0) 推荐(0) 编辑
摘要:OpenCL体系结构分析 OpenCL是一个开放的行业标准,用于对组织到单个平台中的CPU、GPU和其他离散计算设备的异构集合进行编程。它不仅仅是一种语言。OpenCL是一个用于并行编程的框架,包括一种语言、API、库和一个支持软件开发的运行时系统。例如,使用OpenCL,程序员可以编写在GPU上执 阅读全文
posted @ 2024-06-22 03:50 吴建明wujianming 阅读(59) 评论(0) 推荐(0) 编辑
摘要:图像传感器及其产业应用 智能汽车 业务简介 自2015年开始进军智能汽车领域,顺利成为国内整车厂商的Tier1供应商,目前已取得20余家国内汽车厂商的供货商资质,并积极进行国外汽车厂商的供应商资质认证。 2018年,进一步加强在车载镜头方面的布局,推动智能汽车业务发展。 依托在光学光电领域的技术优势 阅读全文
posted @ 2024-06-19 04:19 吴建明wujianming 阅读(33) 评论(0) 推荐(0) 编辑
摘要:OpenVX使用案例分析 用例 1 第一个用例涉及 2 个vx_reference,一个已经为vx_reference分配了内存缓冲区,另一个没有。 (注意:有关何时发生内存缓冲区分配的更多信息,请参阅 TIOVX 中的内存管理。这些用例图描述了如何成功地将内存缓冲区从一个vx_reference导 阅读全文
posted @ 2024-06-17 05:06 吴建明wujianming 阅读(40) 评论(0) 推荐(0) 编辑
摘要:OpenVX数据结构、 流水线和批处理 3.模块文档 3.1. 流水线和批处理 数据结构 vx_graph_parameter_queue_params_t 枚举 vx_graph_schedule_mode_enum_e vx_graph_schedule_mode_type_e vx_graph 阅读全文
posted @ 2024-06-16 04:12 吴建明wujianming 阅读(59) 评论(0) 推荐(0) 编辑
摘要:大型语言模型有效推理研究综述 https://arxiv.org/pdf/2404.14294v1 摘要——大型语言模型(LLM)由于其在各种任务中的卓越性能,而引起了广泛的关注。 然而,LLM推理的大量计算和内存需求,对资源受限场景中的部署提出了挑战。该领域内的努力,致力于开发提高LLM推理效率的 阅读全文
posted @ 2024-06-14 05:58 吴建明wujianming 阅读(70) 评论(0) 推荐(0) 编辑
摘要:使用pytorch实现HWC转CHW分析 import torch import numpy as np from torchvision.transforms import ToTensor t = torch.tensor(np.arange(24).reshape(2,4,3)) print( 阅读全文
posted @ 2024-06-13 04:14 吴建明wujianming 阅读(147) 评论(0) 推荐(0) 编辑
摘要:NPU与超异构计算杂谈 NPU 基础 近年来,随着人工智能技术的飞速发展,AI 专用处理器如 NPU(Neural Processing Unit)和 TPU(Tensor Processing Unit)也应运而生。这些处理器旨在加速深度学习和机器学习任务,相比传统的 CPU 和 GPU,它们在处 阅读全文
posted @ 2024-06-10 04:00 吴建明wujianming 阅读(560) 评论(1) 推荐(0) 编辑
摘要:OpenVX开源神器分析 探秘OpenVX:加速计算机视觉的开源神器 项目地址:https://gitcode.com/rgiduthuri/openvx_tutorial Khronos OpenVX材料 Khronos OpenVX是一个开放的、无版权的标准API,用于计算机视觉应用程序的跨平台 阅读全文
posted @ 2024-06-09 04:10 吴建明wujianming 阅读(167) 评论(0) 推荐(0) 编辑
摘要:Kernel 优化架构分析 推理引擎的 Kernel 层通常是推理引擎中用于执行底层数学运算的组件。在深度学习模型推理过程中,需要对大量数据进行高效的数学运算,如矩阵乘法、卷积、池化等。Kernel 层就是实现这些运算的核心部分,它直接影响着推理引擎的速度和效率。本章将从四个方面对推理引擎的 Ker 阅读全文
posted @ 2024-06-08 05:31 吴建明wujianming 阅读(130) 评论(0) 推荐(0) 编辑
摘要:NPU技术基础杂谈 NPU 基础 近年来,随着人工智能技术的飞速发展,AI 专用处理器如 NPU(Neural Processing Unit)和 TPU(Tensor Processing Unit)也应运而生。这些处理器旨在加速深度学习和机器学习任务,相比传统的 CPU 和 GPU,它们在处理 阅读全文
posted @ 2024-06-07 03:49 吴建明wujianming 阅读(1004) 评论(0) 推荐(0) 编辑
摘要:GPU与DSA架构分析GPU、GPGPU、DSA、FPGA、ASIC等AI芯片特性及对比GPUGPU(Graphics Processing Unit,图形处理器)是一种专门用于处理图形和图像的处理器。它是计算机的重要组成部分,主要用于加速图形和图像的处理和渲染。与传统的中央处理器(CPU)相比,G 阅读全文
posted @ 2024-06-06 04:06 吴建明wujianming 阅读(2776) 评论(0) 推荐(1) 编辑
摘要:FPGA计算技术杂谈 阅读全文
posted @ 2024-06-04 03:50 吴建明wujianming 阅读(25) 评论(0) 推荐(0) 编辑
摘要:芯片算力计算方案分析 芯片算力公式主要有两个: 1. 计算=(单芯片)性能*规模(即数量)*利用率 2. CPU算力计算公式:Flops=[CPU核数][单核主频][CPU单个周期浮点计算能力] 注意,这两个公式只适用于特定情况,根据实际情况选择合适的公式。 1. 硬件算力计算公式 以上公式为硬件上 阅读全文
posted @ 2024-06-03 04:57 吴建明wujianming 阅读(1157) 评论(0) 推荐(0) 编辑
摘要:OpenVX™规范构建说明和注释 https://github.com/KhronosGroup/OpenVX-api-docs 目录 介绍 构建规范 更新规范中的标记ID 构建扩建 样式表 嵌入方程式 Asciidoc定位点和外部参照 软件相关性 修订历史记录 笔记 这是基于Vulkan描述文件, 阅读全文
posted @ 2024-06-02 04:42 吴建明wujianming 阅读(34) 评论(0) 推荐(0) 编辑
摘要:OpenVX™双向参数扩展 1.OpenVX V1.3.1中支持双向参数的扩展 1.1. 意图 双向参数最初在OpenVX中指定,但由于在指定节点调度时存在困难和不明确,因此被删除。这个扩展是针对OpenVX V1.3.1的,并试图将它们添加回来,同时对它们的使用规则和图形形式进行修订。 在本文件中 阅读全文
posted @ 2024-06-01 05:05 吴建明wujianming 阅读(23) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示