Rocket - tilelink - Broadcast
https://mp.weixin.qq.com/s/-pjCLzzincJz0Z66orx8kg
介绍Broadcast的实现。
1. 基本介绍
TLBroadcast实现的是TL-C等级,支持Transfer操作。主要功能是根据输入的请求类型,广播Probe请求进行权限调整,维持缓存一致性(cache coherency)。
2. Tracker
跟踪为了实现缓存一致性而发出的Probe请求的过程。Tracker根据配置参数bufferless,决定是否保存上游节点下发的请求。
3. TLBroadcast
1) 类参数
a. lineBytes
每个Tracker支持的字节数:
限制条件:
i. 值大于0;
i. 值为2的幂;
i. 值大于数据带宽(beatBytes);
b. numTrackers
支持的Tracker的数量。
c. bufferless
是否保存上游节点下发的请求。
2) node
用于与其他diplomacy节点连接并协商传递参数的diplomacy节点。
A. clientFn
用于向下传递参数的方法:
因为要对source增加两位进行编码,所以这里乘以4。
B. managerFn
用于向上传递参数的方法:
a. endSinkId = numTrackers;
b. 限定下游节点不能支持Acquire操作,即下游节点不支持TL-C:
c. 只处理区域类型为UNCACHED的manager,把UNCACHED转换为TRACKED。即我们看到的下游节点的区间类型为UNCACHED,而上游节点看到的我们支持的这个区间的类型为TRACKED。因为我们做了TRACK的工作。
所谓UNCACHED区间类型,是指当前节点对该区间的支持不包含CACHE,但不妨碍上游节点为之添加缓存的功能。
这里not cached yet,不是指时间上,而是指结构上。
就时间上而言,一个区域是否缓存是一个动态的过程。而这里区域类型是一个静态的属性,不会随时间的变化而变化。即某个节点对某个区域的支持是否可缓存,不随时间的变化而变化。
但可以随结构的变化而变化。节点不是鼓励的节点,而是DAG中的一个节点。DAG中某个节点对某个区域的支持是不缓存,不代表其上游的节点不可以代为缓存。
所以可以理解几个区域类型的意义:
UNCACHED:当前节点没为之缓存,上游节点可为之缓存;
TRACKED:当前节点为下游节点增加了缓存的支持;
UNCACHEABLE:不可缓存,当前节点不缓存,上游节点也不可以缓存,因为内容会变(比如IO编址区间)。这样的区间每次使用都要重新读取;
CACHED:当前节点已为之缓存;
d. 支持的传输大小变化:
e. 响应不必FIFO顺序返回,也就是说先来的请求的响应可以后面才返回;
3) module
A. node.in & node.out
因为所有节点组成的是DAG,所以只有上游节点可以缓存下游节点的数据,兄弟节点不能缓存。所以当上游节点发起的请求触发权限相关的Probe操作时,只需要向上游节点(通过node.in)发出Probe请求即可。
B. clients/managers
取出这一条线上的clients/managers:
C. lineShift
用于处理地址,因为缓存的数据大小为lineBytes,所以地址相应的低位可以忽略:
D. caches
取出缓存数据的clients:
E. 创建Trackers
创建numTrackers个Trackers:
其中:log2Up(caches.size + 1)为记录probe个数所需要的比特数。
F. 处理channel e
channel e只有1种message,即GrantAck:
a. 一直接收channel e的输出;
b. 选择与in.e.bits.sink对应的tracker,输入e_last的值;
G. in.a:上游节点的请求
a. 请求类型
左侧列出了各种请求类型。
b. Acquire
Acquire操作请求提升权限:
i. NtoB:从None提升到Branch,Branch节点具有只读权限,所以向其他缓存了数据的节点发送Probe请求,把权限设定为Branch,即只读权限,超过的需要降权。
i. NtoT:从None提升到Trunk,Trunk节点可读,Trunk节点具有读权限,并且缓存了可能是脏数据的数据。所以如果一个节点要提升至Trunk节点,需要向其他节点发送Probe请求,把权限设定为None,以促使其把数据回写。
i. BtoT:同NtoT。
c. 其他操作
i. PutFullData:上游节点发来写数据请求,需要其他cache节点回写数据,若有需要之后再重新缓存。所以Probe其他cache节点的权限至None;
i. PutPartialData:同PutFullData;
i. ArithmeticData:需要先读、计算、再回写,同PutFullData;
i. LogicalData:同PutFullData;
i. Get:为了读取到最新数据,需要回写脏数据,如果没有脏数据则直接从缓存中返回即可。即如果是Trunk权限,则需要降权为Branch。如果是Branch权限,则无需再降权。
i. Hint:预读取和预写入与读取和写入同理;
d. selectTracker
其中:
i. freeTrackers:各个tracker是否空闲的标志;
i. freeTrack:是否存在空闲的Tracker;
i. matchTrackers:各个tracker跟踪的是否是当前访问的地址的标志;
i. matchTracker:是否有一个tracker跟踪者当前访问的地址;
i. allocTracker:从空闲的tracker中分配一个tracker用于跟踪当前访问的地址;
i. selectTracker:如果有tracker正在跟踪当前访问的地址,则仍然使用这个tracker。否则,使用重新分配的新tracker;
e. trackerReady
trackerReady是各个tracker是否可以接收输入的标志:
f. in.a.ready
是否接收channel a的请求,取决于如下条件:
i. 选中的tracker可以接收:(selectTracker & trackerReady).orR();
i. burst请求的后续beat(!a_first)或者已经全部probe完成;
g. 请求存入tracker
其中:t.probe表示要probe的client的个数。如果没有caches则为0。否则要看请求是否来自于某一个cache节点,如果是则为caches.size - 1,如果不是则为caches.size。
H. in.b
channel b用于向上游节点发送Probe请求:
其中:
i. probe_todo:待probe的cache节点;
i. probe_line:probe的address;
i. probe_perms:param中cap的权限;
i. probe_next:下一个要probe的对象;
i. probe_busy:是否probe完所有要probe的cache节点;
i. probe_target:当前要probe的对象;
i. in.b.fire()时切换下一个probe对象;
I. in.c
a. 消息类型
i. ProbeAck:我方发出Proe的响应消息,说明某client Probe完成。递减tracker中的Probe计数器。DROP是指收到ProbeAck无需其他动作。
i. ProbeAckData:除了递减计数器之外,还需要把返回的数据回写。即通过out.a发出PutFull消息。DROP是指无需再有其他动作。
i. ReleaseData:不同于ProbeAckData的地方在于,ReleaseData是上游节点发起,是一个请求消息,需要我方回复。回复的动作需要在PutFull完成之后,把PutFull的响应消息即AccessAck转换(transform)成为ReleaseAck返回给上游节点。
i. Release:直接使用in.d回复ReleaseAck即可。
b. 甄别消息类型
c. 消息与tracker的关系
d. releaseack
针对Release消息的回复ReleaseAck:
i. valid:channel c发送release时回复;
i. 使用in.c.bits组装releaseack;
通过in.d返回:
e. putfull
针对ProbeAckData和ReleaseData消息,需要把Data回写:
其中:
i. put_what:标识PutFull是为了ReleaseData还是为了ProbeAckData,如果是ReleaseData,就标识为TRANSFORM_B,如果是ProbeAckData就标识为DROP。
i. put_who:如果是ReleaseData消息,那么source在in.c.bits.source;如果是ProbeAckData,这里source使用的是tracker中存着的in.a中取的source,与ProbeAckData中的Source即Probe消息的目标不一样,后续并没有使用这个source,用意不做分析。
i. Cat(put_what, put_who):修改Put操作的source,以方便响应消息AccessAck返回时处理;因为put_what有四种可能(TRANS_B/TRANS_T/DROP/PASS)占两位,所以下游节点看到的client的endSourceId相比Broadcast节点看到的上游节点cliet的endSourceId,扩大了四倍。这就是diplomacy node的clientFn中cp.endSourceId乘以4的原因:
通过out.a发出:
f. probenack
如果in.c返回ProbeAck消息,则告诉tracker递减probe计数器:
J. out.d/in.d
如何根据out.d生成in.d要回复的消息。channel d支持的消息类型如下:
a. 取出编码在source中的信息:
b. 判断是否ProbeAckData消息衍生成出的Put消息的响应消息AccessAck:
有个assert限定:
如果是这个AccessAck消息,就允许发送:
然而这个消息不会被传往in.d:
c. d_hasData:是否包含数据:
d. d_normal:使用out.d生成的消息,发往in.d
a) 使用in.d克隆的Wire:
这意味着d_normal中各个域的位宽与in.d一致,而不是out.d。
实际上,out.d的source域比in.d的source域多两位,所以把out.d连接到d_normal时,会把这两位丢掉:
b) TRANSFORM
TRANSFORM的信息从out.d.bits.source中取出,即do_what。
这个信息从两处传入:
i. put_what:
- ReleaseData需要把Put的响应消息AccessAck变换为ReleaseAck;
- ProbeAckData需要把Put的响应消息AccessAck丢弃;
i. in.a的Acquire消息:
in.a发出的Acquire消息,会被转换为Get消息,从下游节点请求数据,然后返回给上游节点。
c) do_what(1):TRANSFORM_B/TRANSFORM_T
如果do_what(1)为真,那么编码在source中的信息是TRANSFORM_B/TRANSFORM_T:
进而表明tracker中跟踪的是一个Acquire消息或ReleaseData消息。
如果d_hasData为真,out.d返回的是Acquire变换成的Get消息的响应消息AccessAckData,应该被转换为GrantData消息返回;
如果d_hasData为假,out.d返回的是ReleaseData变换成的Put消息的响应消息AccessAck,应该被转换为ReleaseAck消息返回;
GrantData消息的param:
ReleaseAck消息的param为0:
d) probedack
标志着ProbeAckData处理完成:
如果ProbeAckData衍生的Put消息返回,则ProbeAckData消息处理完成。
e) d_last
响应消息是否发送完成:
d_normal.fire() && d_last代表d_normal发送完成。
d_response指除ProbeAckData的AccessAck消息和ReleaseData的ReleaseAck消息之外的其他消息。
为什么要排除这两个消息?
因为这两个消息的响应消息虽然都是从channel d返回,但他们都是从channel c发送的请求消息。而tracker跟踪的是channel a发出的请求消息。
4. TLBroadcastTracker
1) 参数
a. id:tracker的编号;
b. lineBytes:tracker缓存的字节数;
c. probeCountBites:需要probe的cache节点计数所需的比特位数;
d. bufferless:是否保存上游节点下发的请求;
2) io
其中:
a. in_a_first:是否in_a的第一个beat;
b. in_a:保存的channel a的输入;
c. out_a:向channel d输出的信号;
d. probe:要probe的cache节点的数目;
e. probenack:处理完成一个ProbeAck消息;
f. probedack:处理完成一个ProbeAckData消息;
g. d_last:是否channel d的最后一个beat;
h. e_last:是否channel e的最后一个beat;
i. source:提取in_a中的source域,输出用于比对;
j. line:提取in_a中的address域,处理后输出用于比对;
k. idle:表示该tracker是否空闲;
l. need_d:是否需要channel d;
3) 临时变量
其中:
a. idle = got_e && sent_d:表示已经完成全部消息交互:channel d已经发送完成,并收到了channel e的消息。
b. count:probe请求的计数器。
4) 存入channel a的请求消息
a. sent_d:假,刚收到in.a的消息,还没有返回响应消息;
b. got_e:只有Acquire/Grant/GrantAck交互需要用到channel e置为假,其他用不到的置为真。
c. count:值等于io.probe;
5) sent_d && need_d
当channel d的最后一个beat发出后,sent_d置为真:
channel d的响应消息已发出,则不再需要channel d:
6) e_last && got_e
当channel e的最后一个beat(实际上channel e有且只有一个beat)发出后,got_e置为真:
7) line
根据存的数据大小,地址的低若干位没有意义可以移除:
8) probe计数
a. 处理完一个ProbeAck减1;
b. 处理完一个ProbeAckData减1;
c. 同时处理完则减2;
9) probe_done:标志着probe已经完成:
10) Queue
创建一个队列用于输入、存储、输出数据:
11) 输入规则:
12) 输出规则:
其中:
a. Acquire消息被转换为Get消息,其余透传;
b. source进行编码,Acquire消息对应的source编入transform信息,其他的透传(PASS=0b00);
out_a输出到out.a:
5. Broadcast主动发出的消息
无。
6. Broadcast被动发出的消息
1) 向上游发出Probe请求消息;
2) 向上游直接回复ReleaseAck消息;
3) 向上游回复transform后的ReleaseAck消息;
4) 向下游发出transform后的Get消息;
5) 向下游发出transform后的Put消息;
7. Broadcast透传的消息
channel a支持的消息如下:
除Acquire需要transform外,其余的都会透传。