12 2024 档案

摘要:OpenCL设备端并行执行内核 Vortex存储库的tests/OpenCL目录中有OpenCL测试程序。OpenCL程序分为主机代码[cc|cpp]和设备代码kernel.cl。 OpenCL通过在设备端并行执行内核来加快速度。在tests/opencl/sgemm中的代码作为一个具体的例子。代码 阅读全文
posted @ 2024-12-31 05:11 吴建明wujianming 阅读(7) 评论(0) 推荐(0) 编辑
摘要:OpenCL流程分析与示例 OpenCL兼容RISC-V的GPGPU示例,如图1-38所示。 图1-38 OpenCL兼容RISC-V的GPGPU示例 OpenCL流程分析与示例,如图1-39所示。 图1-39 OpenCL流程分析与示例 阅读全文
posted @ 2024-12-31 05:08 吴建明wujianming 阅读(5) 评论(0) 推荐(0) 编辑
摘要:4本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技 阅读全文
posted @ 2024-12-31 05:03 吴建明wujianming 阅读(7) 评论(0) 推荐(0) 编辑
摘要:OpenCL工作组织结构 OpenCL工作组织结构,如图1-35所示。 图1-35 OpenCL工作组织结构 Khronos工作组织结构与注册 Khronos工作组织结构与注册,如图1-36所示。 图1-36 Khronos工作组织结构与注册 OpenCL使用C++开发 1)开源编译器前端 替代Op 阅读全文
posted @ 2024-12-30 03:50 吴建明wujianming 阅读(22) 评论(0) 推荐(0) 编辑
摘要:执行OpenCL程序流程 1)内核程序是可执行代码的基本单元(类似于C函数)。 2)OpenCL程序是内核和函数的集合。 3)主机应用程序使用OpenCL命令队列,向设备发送内核和数据传输功能。 4)通过将命令排入队列,内核和数据传输功能可以与主机代码,进行异步并行执行。 5)作为一种开放标准,Op 阅读全文
posted @ 2024-12-30 03:45 吴建明wujianming 阅读(24) 评论(0) 推荐(0) 编辑
摘要:《智能汽车传感器:原理·设计·应用》《AI芯片开发核心技术详解》《TVM编译器原理与实践》《LLVM编译器原理与实践》4本专著书推荐 3本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心 阅读全文
posted @ 2024-12-30 03:38 吴建明wujianming 阅读(26) 评论(0) 推荐(0) 编辑
摘要:Intel oneAPI DPC++和UXL基础 1)Intel oneAPI DPC++符合SYCL 2020规范 ①统一共享内存、并行约简、工作组算法、类模板。 ②论证推理、访问优化、扩展互操作性等。 2)UXL统一加速基础 ①加速计算开放生态系统。 ②工具和库。 ③编译器和开发工具。 ④API 阅读全文
posted @ 2024-12-29 03:41 吴建明wujianming 阅读(17) 评论(0) 推荐(0) 编辑
摘要:Kamaros便携式应用程序结构 Kamaros便携式应用程序结构,如图1-11所示。 图1-11Kamaros便携式应用程序结构 Khronos和EMVA合作 Khronos和EMVA合作,如图1-12所示。 图1-12 Khronos和EMVA合作 阅读全文
posted @ 2024-12-29 03:37 吴建明wujianming 阅读(3) 评论(0) 推荐(0) 编辑
摘要:4本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技 阅读全文
posted @ 2024-12-29 03:31 吴建明wujianming 阅读(19) 评论(0) 推荐(0) 编辑
摘要:分层OpenCL实现 OpenCL接口分层实现,如图1-31所示。 图1-31 OpenCL接口分层实现 阅读全文
posted @ 2024-12-28 03:54 吴建明wujianming 阅读(6) 评论(0) 推荐(0) 编辑
摘要:API分层 SPIR-V的开源编译器生态系统越来越强大。 1.行分层 无需额外的内核级驱动程序即可实现内容,从而使平台受益。 OpenCL接口分层,如图1-30所示。 图1-30 OpenCL接口分层 2.列分层 即使没有本机驱动程序,也可以跨多个平台提供API,以便提供应用程序部署灵活性并消除碎片 阅读全文
posted @ 2024-12-28 03:51 吴建明wujianming 阅读(13) 评论(0) 推荐(0) 编辑
摘要:4本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技 阅读全文
posted @ 2024-12-28 03:47 吴建明wujianming 阅读(17) 评论(0) 推荐(0) 编辑
摘要:3DGStream:3D飞行训练实现照片级逼真自由视点视频的高效流式传输 5.13.1 3DGStream:3D飞行训练实现照片级逼真自由视点视频的高效流式传输概述 从多视图视频构建动态场景的逼真自由视点视频(FVV)仍然是一项具有挑战性的工作。尽管当前的神经渲染技术取得了显著进步,但这些方法通常需 阅读全文
posted @ 2024-12-22 03:52 吴建明wujianming 阅读(30) 评论(0) 推荐(0) 编辑
摘要:利用协同嵌入模型超越多任务密集预测 5.7.1 利用协同嵌入模型超越多任务密集预测概述 多任务视觉场景理解旨在利用一组相关任务之间的关系,通过将它们嵌入到一个统一的网络中来同时解决这些问题。然而,从任务层面的角度来看,大多数现有方法都引起了两个主要问题:①不同任务缺乏独立于任务的对应关系;②忽视了各 阅读全文
posted @ 2024-12-22 03:45 吴建明wujianming 阅读(31) 评论(0) 推荐(0) 编辑
摘要:事件流超分辨率的双边事件挖掘与互补 5.6.1事件流超分辨率的双边事件挖掘与互补概述 事件流超分辨率(ESR)旨在解决事件流中空间分辨率不足的挑战,这对事件相机在复杂场景中的应用具有重要意义。以前的ESR工作通常以混合范式处理积极和消极事件。这种范式限制了他们有效地模拟每个事件的独特特征并通过考虑它 阅读全文
posted @ 2024-12-22 03:37 吴建明wujianming 阅读(27) 评论(0) 推荐(0) 编辑
摘要:4本书推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》、《TVM编译器原理与实践》、《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技 阅读全文
posted @ 2024-12-22 03:28 吴建明wujianming 阅读(32) 评论(0) 推荐(0) 编辑
摘要:广义少镜头分割的视觉提示:一种多尺度方法 5.5.1 多尺度方法概述 基于注意力的变换器模型的出现,由于其优越的泛化和传递特性,在各种任务中得到了广泛的应用。最近的研究表明,当得到适当的提示时,这些模型对于少镜头推理来说是极好的。然而,对于语义分割等密集预测任务,这些技术的探索不足。在这项工作中,研 阅读全文
posted @ 2024-12-21 03:44 吴建明wujianming 阅读(22) 评论(0) 推荐(0) 编辑
摘要:三重时空变化模式的视频协调 5.4.1 三重时空变化模式的视频协调概述 视频协调是一项重要而具有挑战性的任务,旨在通过自动调整前景的外观以与背景协调,从而获得视觉上逼真的合成视频。受手动协调的短期和长期逐步调整过程的启发,提出了一个视频三重变换器框架,用于模拟视频中的三种时空变化模式,即短期空间以及 阅读全文
posted @ 2024-12-21 03:36 吴建明wujianming 阅读(22) 评论(0) 推荐(0) 编辑
摘要:4本专著推荐《AI芯片开发核心技术详解》、《智能汽车传感器:原理·设计·应用》《TVM原理与实践》《LLVM编译器原理与实践》 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发, 阅读全文
posted @ 2024-12-21 03:21 吴建明wujianming 阅读(32) 评论(0) 推荐(0) 编辑
摘要:任意尺度图像超分辨率的基准技术分析 在计算机视觉领域,超分辨率(SR)一直是一个突出的研究领域。它的目的是从低分辨率(LR)图像重建高分辨率(HR)图像。最近,主要基于学习图像的连续表示的任意尺度图像SR取得了重大进展。 这些方法通常需要在特定范围内(即×1.0-×4.0)使用连续的细粒度尺度变化L 阅读全文
posted @ 2024-12-20 03:24 吴建明wujianming 阅读(36) 评论(0) 推荐(0) 编辑
摘要:用于端到端场景图生成的密集关系变换器 场景图生成旨在捕捉图像中对象之间的详细空间和语义关系,由于标签不完整、长尾关系类别和关系语义重叠,这具有挑战性。现有的基于Transformer的方法要么对对象和谓词采用不同的查询,要么对关系三元组采用整体查询,因此学习低频关系的能力往往有限。提出了一种新的基于 阅读全文
posted @ 2024-12-20 03:17 吴建明wujianming 阅读(17) 评论(0) 推荐(0) 编辑
摘要:由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发,内容翔实、知识点新颖、实践性很强、图文并茂。 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出 阅读全文
posted @ 2024-12-20 03:12 吴建明wujianming 阅读(38) 评论(0) 推荐(0) 编辑
摘要:AWQ:激活-软件权重量化 大型语言模型(LLM)已经改变了许多人工智能应用程序。设备上的LLM变得越来越重要:在边缘设备上本地运行LLM,可以降低云计算成本并保护用户隐私。然而,天文模型的大小和有限的硬件资源带来了巨大的部署挑战。提出了激活感知权重量化(AWQ),这是一种硬件友好的LLM低比特权重 阅读全文
posted @ 2024-12-19 03:49 吴建明wujianming 阅读(29) 评论(0) 推荐(0) 编辑
摘要:用于显微镜的掩模自编码器是细胞生物学的可扩展学习 将显微镜图像特征化用于生物研究仍然是一个重大挑战,特别是对于跨越数百万张图像的大规模实验。这项工作探讨了弱监督分类器和自监督掩码自编码器(MAE),在使用越来越大的模型骨干和显微镜数据集进行训练时的缩放特性。结果表明,基于ViT的MAE在各种任务上的 阅读全文
posted @ 2024-12-19 03:40 吴建明wujianming 阅读(15) 评论(0) 推荐(0) 编辑
摘要:由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发,内容翔实、知识点新颖、实践性很强、图文并茂。 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出 阅读全文
posted @ 2024-12-19 03:34 吴建明wujianming 阅读(11) 评论(0) 推荐(0) 编辑
摘要:TiNO-Edit:基于扩散的稳健图像编辑的时间步长和噪声优化 尽管有许多尝试利用预训练的文本到图像模型(T2I)(如稳定扩散(SD)),进行可控图像编辑,但产生良好的可预测结果仍然是一个挑战。以前的方法要么侧重于在特定数据集上,对预训练的T2I模型进行精细调优,以生成特定类型的图像(例如,使用特定 阅读全文
posted @ 2024-12-18 04:18 吴建明wujianming 阅读(12) 评论(0) 推荐(0) 编辑
摘要:并非所有体素都是相等的:具有自蒸馏的硬度感知语义场景完成 语义场景完成,也称为语义占用预测,可以为自动驾驶汽车提供密集的几何和语义信息,这引起了学术界和工业界越来越多的关注。不幸的是,现有的方法通常将此任务表述为体素分类问题,并在训练过程中在3D空间中平等对待每个体素。由于硬体素没有得到足够的重视, 阅读全文
posted @ 2024-12-18 04:16 吴建明wujianming 阅读(7) 评论(0) 推荐(0) 编辑
摘要:《AI芯片开发核心技术详解》新书推荐 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发,内容翔实、知识点新颖、实践性很强、图文并茂。 由清华大学出版社资深编辑赵佳霓老师策划编辑的 阅读全文
posted @ 2024-12-18 04:10 吴建明wujianming 阅读(49) 评论(0) 推荐(0) 编辑
摘要:用于视频稳定的3D多帧融合 介绍了一种新的视频稳定框架RStab,它通过体绘制集成了3D多帧融合。与传统方法不同,引入了一种3D多帧视角来生成稳定的图像,解决了在保持结构的同时生成全帧的挑战。改进的RStab框架的核心在于稳定渲染(SR),这是一个体绘制模块,融合了3D空间中的多帧信息。具体来说,S 阅读全文
posted @ 2024-12-17 04:25 吴建明wujianming 阅读(25) 评论(0) 推荐(0) 编辑
摘要:CDFormer:当退化预测包含盲图像超分辨率的扩散模型时 现有的盲图像超分辨率(BSR)方法侧重于估计核或退化信息,但长期以来忽视了基本的内容细节。提出了一种新的BSR方法,即内容感知退化驱动变换器(CDFormer),用于捕获退化和内容表示。然而,低分辨率图像无法提供足够的内容细节,因此引入了一 阅读全文
posted @ 2024-12-17 04:07 吴建明wujianming 阅读(27) 评论(0) 推荐(0) 编辑
摘要:由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出版,京东、淘宝天猫、当当等网上,相应陆陆续续可以购买。该书强力解析AI芯片的核心技术开发,内容翔实、知识点新颖、实践性很强、图文并茂。 由清华大学出版社资深编辑赵佳霓老师策划编辑的新书《AI芯片开发核心技术详解》已经出 阅读全文
posted @ 2024-12-17 04:00 吴建明wujianming 阅读(74) 评论(0) 推荐(0) 编辑
摘要:用新数据重建旧类,实现无样本的持续学习 用新数据重建旧类,实现无样本的持续学习 众所周知,持续学习方法会遭受灾难性遗忘,对于不存储先前任务示例的方法来说,这种现象尤其难以应对。因此,为了减少特征提取器中的潜在漂移,通常在第一个任务明显大于后续任务的情况下评估现有的无样本方法。从较小的第一个任务开始, 阅读全文
posted @ 2024-12-16 07:21 吴建明wujianming 阅读(12) 评论(0) 推荐(0) 编辑
摘要:《智能汽车传感器:原理·设计·应用》新书推荐 《智能汽车传感器:原理·设计·应用》新书推荐 由化学工业出版社资深编辑张海丽老师负责策划编辑。 本书在京东、淘宝天猫、当当网上均有销售 京东:https://search.jd.com/Search?keyword=%E6%99%BA%E8%83%BD% 阅读全文
posted @ 2024-12-16 07:20 吴建明wujianming 阅读(15) 评论(0) 推荐(0) 编辑
摘要:通过知识提炼增强单视图场景的自监督方法 通过运动结构从图像中推断场景几何是计算机视觉中一个长期存在的基本问题。虽然经典方法和最近的深度图预测只关注场景的可见部分,但场景完成的任务旨在推理即使在遮挡区域中的几何形状。随着神经辐射效应(NeRF)的普及,隐式表示也通过预测所谓的密度效应在场景完成中流行起 阅读全文
posted @ 2024-12-16 03:47 吴建明wujianming 阅读(14) 评论(0) 推荐(0) 编辑
摘要:Large Transformer Model Inference Optimization 阅读全文
posted @ 2024-12-15 04:20 吴建明wujianming 阅读(18) 评论(0) 推荐(0) 编辑
摘要:遥感全景锐化的内容自适应非局部卷积 目前,基于机器学习的遥感泛变方法发展迅速。然而,现有的pansharpening方法往往没有充分利用非局部空间中的区分区域信息,从而限制了方法的有效性,并导致冗余的学习参数。介绍了一种所谓的内容自适应非局部卷积(CANConv),这是一种专为遥感图像泛变而设计的新 阅读全文
posted @ 2024-12-15 03:38 吴建明wujianming 阅读(28) 评论(0) 推荐(0) 编辑
摘要:基于中间畸变流估计的滚动快门校正 提出通过直接估计从全局快门(GS)到滚动快门(RS)的失真,来校正滚动快门(SS)失真的图像。现有的方法通常使用从RS到GS的未失真流进行校正。它们最初从连续的RS帧预测流,随后使用时间相关的缩放因子将其重新缩放为从RS帧到底层GS图像的位移效应。在此之后,采用RS 阅读全文
posted @ 2024-12-14 05:03 吴建明wujianming 阅读(22) 评论(0) 推荐(0) 编辑
摘要:用于大规模单像素成像的双尺度变换器 单像素成像(SPI)是一种潜在的计算成像技术,通过解决单像素探测器捕获的少量测量值中的病态重建问题来产生图像。深度学习在SPI重构方面取得了令人瞩目的成功。然而,之前较差的重建性能和不切实际的成像模型,限制了其在现实世界中的应用。提出了一种基于Kronecker 阅读全文
posted @ 2024-12-14 04:13 吴建明wujianming 阅读(30) 评论(0) 推荐(0) 编辑
摘要:CycleINR:任意尺度医学数据三维超分辨率的循环隐式神经表示 在医学3D数据领域,如CT和MRI图像,普遍的各向异性分辨率的特点是层内分辨率高,但层间分辨率低。相邻切片之间的分辨率降低带来了挑战,阻碍了最佳的观看体验,并阻碍了稳健的下游分析算法的发展。各种体积超分辨率算法旨在克服这些挑战,提高切 阅读全文
posted @ 2024-12-14 04:10 吴建明wujianming 阅读(32) 评论(0) 推荐(0) 编辑
摘要:深度视频压缩的任务感知编码器控制 先前对机器任务的深度视频压缩(DVC)的研究,通常需要为每个特定任务训练一个唯一的编解码器,并要求每个任务都有一个专用的解码器。相比之下,传统的视频编解码器采用灵活的编码器控制器,通过模式预测等机制使单个编解码器能够适应不同的任务。从中汲取灵感,介绍了一种用于机器深 阅读全文
posted @ 2024-12-01 18:40 吴建明wujianming 阅读(18) 评论(0) 推荐(0) 编辑
摘要:MonoCD:具有互补深度的单眼3D物体检测 单眼3D对象检测因其能够以低成本,从单个图像中准确获得对象3D定位,而引起了广泛关注。由于2D到3D映射的不适定性,深度估计是单目3D对象检测的一个重要,但具有挑战性的子任务。许多方法探索多个局部深度线索,如物体高度和关键点,然后将物体深度估计公式化为多 阅读全文
posted @ 2024-12-01 18:39 吴建明wujianming 阅读(30) 评论(0) 推荐(0) 编辑
摘要:超越图像超分辨率的任务驱动感知损失图像识别 在实际场景中,由于低分辨率(LR)内容中缺乏可用信息,图像识别任务(如语义分割和对象检测)通常会带来更大的挑战。图像超分辨率(SR)是解决这些挑战的有前景的解决方案之一。然而,由于SR的病态特性,典型的SR方法很难恢复与任务相关的高频内容,这可能会削弱使用 阅读全文
posted @ 2024-12-01 18:38 吴建明wujianming 阅读(23) 评论(0) 推荐(0) 编辑
摘要:ECLIPSE:通过视觉提示调整进行泛视分割的有效连续学习 泛视分割结合了语义分割和实例分割,是一项前沿的计算机视觉任务。尽管最近在深度学习模型方面取得了进展,但现实世界应用程序的动态特性需要持续学习,其中模型随着时间的推移适应新类(可塑性),而不会忘记旧类(灾难性遗忘)。当前的连续分割方法通常依赖 阅读全文
posted @ 2024-12-01 18:14 吴建明wujianming 阅读(15) 评论(0) 推荐(0) 编辑
摘要:《智能汽车传感器:原理·设计·应用》新书推荐 由化学工业出版社资深编辑张海丽老师负责策划编辑。 本书在京东、淘宝天猫、当当网上均有销售 京东:https://search.jd.com/Search?keyword=%E6%99%BA%E8%83%BD%E6%B1%BD%E8%BD%A6%E4%BC 阅读全文
posted @ 2024-12-01 18:04 吴建明wujianming 阅读(80) 评论(0) 推荐(0) 编辑
摘要:UniDepth:通用单目度量深度估计 精确的单目度量深度估计(MMDE)对于解决3D感知和建模中的下游任务至关重要。然而,最近MMDE方法的显著准确性与其训练领域不符。即使存在适度的域间隙,这些方法也无法推广到看不见的域,这阻碍了它们的实际应用。提出了一种新的模型UniDepth,能够从单个图像跨 阅读全文
posted @ 2024-12-01 04:58 吴建明wujianming 阅读(124) 评论(0) 推荐(0) 编辑

点击右上角即可分享
微信分享提示