随笔分类 - 论文分析和复现
ConvReLU++@MobiSys'23
摘要:ConvReLU++ Reference-based Lossless Acceleration of Conv-ReLU Operations on Mobile CPU 1 核心问题 为了优化边缘设备上的 CNN 推理,我们寻求一个机会来节省 ReLU 的计算和延迟。ReLU 是一种广泛使用的
NN-Stretch@MobiSys'23
摘要:原文地址 Abstract (key idea) 现在的Mobile Devices配备了很多的CPU+GPU+DSP的设备。但是现在的大多数NN model因为自己的顺序结构导致无法充分地利用这些异构处理器。本文提出了一种新的模型适应(model adaption)策略NN-Stretch,它针对
Jestson Nano上基于openvino推理
摘要:intel NCS2计算棒是由openvino支持的,但是目前openvino只有2022.3.1版本支持NCS2了,之后的版本都不支持计算棒了。 本文记录一下再NVIDIA Jetson Nano上用openvino实现NCS2的调用。 通过交叉编译openvino samples,通过bench
zTT@MobiSys '21
摘要:这篇工作还是做的是一个DVFS技术,来动态调整CPU/GPU的电压和频率,达到节能、控温。 1. introduction 传统的DVFS技术主要停留在操作系统内核层面,与应用程序无关。但是不同的应用的需求决定了它们的最佳的CPU,GPU的功耗分布。 一些DVFS无法摆脱过热的问题。这里举例(图1)
GearDVFS@Mobicom '23
摘要:1.1 introduction 传统的DVFS的解决方案现在变成了次优解,因为没考虑到工作负载的特性。zTT提到了。 最近的面向应用的(application-oriented)的研究,通过给定应用的工作负载的上下文来学习和预测合适处理器频率。很难广泛应用开来。 现在手机的多任务情况越来越多,面向
为Mobile而生的Backbone
摘要:## 1 [MobileOne](https://arxiv.org/pdf/2206.04040.pdf) ### 1.1 重要分析(Insight) 1. 作者为了找到**端侧推理时模型架构中的瓶颈部分**,它基于CoreML在iPhone上进行了延迟测试。 2. 经过测试,作者认为对于移动设备