摘要:
问题与思路 使用按键控制蜂鸣器发声。 初始状态为蜂鸣器鸣叫,按下开关后蜂鸣器停止鸣叫,再次按下开关,蜂鸣器重新鸣叫 按键抖动: 按键消抖: 系统框图: 消抖方式 输入key的按键信号,输出一个value表示按键状态,以及一个flag表示状态是否稳定有效 设置一个计数器,表示按键在同一状态稳定的时间, 阅读全文
摘要:
在嵌入式FPGA平台上加速CNNs,为Image-Net大型图像分类开发了CNN加速器。
对CNN模型有一些深度分析,表明了卷积层是以计算为中心的,全连接是以存储为中心的。
开发了动态精度数据量化方法和对所有层有效的卷积器用以提高带宽和资源的利用率。
数据放置策略进一步提高了额外的存储带宽利用。 阅读全文
摘要:
根据Caffe脚本生成RTL加速器代码 on-line控制流实现空间和时间的折叠 优化输入数据与权重的存储布局,利用存储的局部性实现地址生成单元 阅读全文
摘要:
TABLA: A Unified Template-based Framework for Accelerating Statistical Machine Learning 2016 IEEE International Symposium on High Performance Computer 阅读全文
摘要:
From High-Level Deep Neural Models to FPGAs 2016 49th Annual IEEE/ACM International Symposium on Microarchitecture (MICRO) 根据Caffe对DNN模型的高级描述,自动生成可综合的 阅读全文
摘要:
Lifetime improvement through adaptive reconfiguration for nonvolatile FPGAs SRAM的FPGA有漏电和容量的限制,使用NVM替换SRAM是一个有效的方式,但是NVM有寿命问题。BRAM的磨损均衡问题依赖静态分析,但是静态分析 阅读全文
摘要:
FP-DNN: An Automated Framework for Mapping Deep Neural Networks onto FPGAs with RTL-HLS Hybrid Templates 2017 IEEE 25th Annual International Symposium 阅读全文
摘要:
HeteroCL paper:Yi-Hsiang Lai1, Yuze Chi, Yuwei Hu, Jie Wang, Cody Hao Yu, Yuan Zhou, Jason Cong, Zhiru Zhang. HeteroCL: A Multi-Paradigm Programming I 阅读全文
摘要:
文章的目的是:对于给定的CNN模型,通过作者自己设计的框架对设计空间进行探索,找到一个高效的FPGA设计。 这个框架包含三部分: LoopTree:在不写源代码的情况下,捕获CNN在FPGA上的硬件结构设计细节 coarse-grained model:评估LoopTree的设计水平,选择最高效的L 阅读全文
摘要:
Deep Learning FINN 深度神经网络(DNNs)的底层算法结构简单,但是计算量、对数据的访问和模型参数的存储对内存的需求很大。一种可行的方法是将输入、激活和模型参数量化,来降低数值精度,通过设计方案使得增加的吞吐量和降低的能耗来补偿精度上的降低。 FINN项目集中在,利用FPGA的可重 阅读全文
摘要:
对于一个全集 $U$ 来说,并查集就是将 $U$ 划分为几个不相交的子集,并对这些子集中的元素进行管理 阅读全文
摘要:
`KMP`算法用于模板串 $P$ 与模式串 $S$ 匹配过程中的算法优化 阅读全文