Latch timing analysis, ICG usage, Latch usage in DFT scan chain

Latch应用总结！附Time Borrowing，Lockup，Clock Gating Check概念解析

The following article is from RTL2GDS Author 老本 Benjamin

RTL2GDS

数字集成电路设计中从RTL到GDS Tapeout整个过程中的知识点系统性分享。包括：IC后端设计(物理设计), 综合, STA, PV, DFT等。也会发表些行业观察类文章！

同步数字电路中的Path主流还是用寄存器，但是锁存器(Latch)相关的Path也不容忽视，它既能用作数据存储单元，又能作为时钟控制单元。这一篇就讲讲Latch的功能，相关的Timing Path如何分析，其中也会涉及到time borrowing, lockup, clock gating check等概念。

Latch功能

Latch的电路结构如下图：

Latch电路结构

当 E = 1 时，latch直传（transparent），D端信号的变化会即时反应在Q端；

当 E = 0 时，latch关断（closed），Q端保持关断瞬间D端的值。

设计中使用Latch的好处是，相比寄存器的面积更小，功耗更低，可以从后级电路进行time borrowing，更容易满足setup time，然而坏处是STA分析不会那么直接，下面我们就看看引入了Latch的Timing Path如何分析。

Time Borrowing

在数字设计中，经常会碰到如下图所示的Path，两个寄存器（UFF0和UFF1）之间存在一个锁存器（ULAT1），这种情况工具会怎么分析path呢？不同STA工具的行为会有稍微的区别，我们先以PT传统的分析方法来解释。

加入Latch后的电路图

Time Borrowing示意图

根据Latch的特点，在CLKN为高电平时，ULAT1是transparent，ULAT1/D端的数据能即时地反映在ULAT1/Q端。上图中的情况是，UFF0->ULAT1/D的Path Delay使得ULAT1/D数据在CLKN的上升沿之后才到达，需要从后一级ULAT1->UFF1中借了1.81ns，使得原本违例的path满足了要求，而ULAT1->UFF1的timing path即使借出去1.81ns，也能够满足要求，具体的timing report如下：

UFF0->ULAT1的Timing Path

ULAT1->UFF1的Timing Path

这里需要指出的一点是，在计算setup timing的时候，在UFF0->ULAT1中，ULAT1的clock path是按照early/min模式计算的，而在ULAT1->UFF1中，ULAT1的clock path是按照late/max模式计算的，有一部分公共路径的CRPR是不会被排除掉的，所以现在的PT引入了一种新的latch timing分析的模式，它把latch当成一个组合逻辑，在分析UFF0->UFF1的path时可以穿过ULAT1，这里只提示一下可以通过下面这个选型来打开，从而可以减少悲观度：

set_app_var timing_enable_through_paths true

这种模式下，Latch的D Pin只能作为Endpoint，不能作为Startpoint，所以在report_timing的时候也要注意是用-to还是-through的区别：

report_timing -to $latch_d_pinreport_timing -through $latch_d_pin

需要注意的是，这种through模式只是针对setup，对hold分析还是保持不变。下面接着看一个用latch来解决跨时钟域hold timing问题的应用。

Lockup Latch in Scan Chain

(因为是scan chain, 所以不同与常规时序逻辑电路，中间没有组合逻辑)

为了芯片测试的需要，我们会用Scan Chain的方式将绝大部分的寄存器串链起来，在不影响功能的情况下，以简单的方式测试电路中寄存器的良率。但是存在一种情况，前后相邻的两级寄存器如果时钟不一样（跨时钟域），如下图所示：

加入Lockup latch之前的电路图

由于CLK1和CLK2为不同的时钟域，很难保证他们同步，假如CLK2相比CLK1有一段不确定的延迟Tskew，可大可小，那么很有可能FF1/CLK1->FF1/Q->FF2/SI这段延时Tdata会比Tskew小，造成hold timing违例。

加入Lockup latch之前的hold timing时序图

上一节提到Latch有time borrowing的功效，假如在两级寄存器之间加入一个latch，结构如下图所示：

加入Lockup latch之后的电路图

CLK1低电平的时候，Lockup Latch是transparent，CLK1高电平的时候Lockup Latch一直保持上一拍的数据，这样即使CLK2有延迟，只要不超过CLK1高电平持续时间，就能保证hold timing没有问题。

加入Lockup latch之后的hold timing时序图

在DC中可以很方便的实现这一功能，具体会在RTL2GDS微信公众号的综合/DFT教程中详细介绍。

Clock Gating Check

Latch的另一个应用是作为门控时钟单元(Clock Gating Cell)，通过避免部分寄存器不必要的时钟翻转，可以极大地节省电路的动态功耗。实际应用中，为了避免出现毛刺，会在Latch后面添加一个与门组成一个ICG（Integrated Clock Gating）。

ICG电路结构

由于ICG是用在clock path上，STA工具默认会要求做CLKI到EN端的clock gating check，目的是保证时钟使能的时序满足要求，所以会存在REG2ICG的path。因为ICG的clock会比REG的clock delay要短，所以天然存在一个skew对setup不利，特别是假如有多级的ICG级联，更加加重了这种情况。在设计上，需要保证REG2ICG的数据路径不能太复杂，否则物理实现会存在困难。

在CTS之前，由于clock tree是ideal的，考虑不到这种skew的不利影响，所以往往需要通过SDC命令"set_clock_gating_check"人为地设置，让综合或者布局工具提前认识到这一点并提前优化。

需要注意的是，不仅仅ICG需要clock gating check，如果clock path上存在与门、或门等逻辑也需要进行clock gating check。

posted @ 2020-05-25 03:30 John_K 阅读(2752) 评论(0) 收藏举报

刷新页面返回顶部

Latch timing analysis, ICG usage, Latch usage in DFT scan chain

Latch应用总结！附Time Borrowing，Lockup，Clock Gating Check概念解析

公告