Verilog的奇淫技巧
奇技淫巧我不会,但我这有一些我工作后才学到的一些Verilog写法。
数字电路设计主要就是,选择器、全加器、比较器,几个常用逻辑门,再加个D触发器,电路基本都能实现了。
组合逻辑+时序逻辑
组合逻辑用assign或always@(*)实现,
时序逻辑用always@(posedge clk or negedge rst_n)
有人说掌握Verilog 20%的语法就可以描述 90%以上的电路,说的对。
casez
always @(*)begin
casez(code)
8'b1???_???? : data[2:0] = 3'd7;
8'b01??_???? : data[2:0] = 3'd6;
8'b001?_???? : data[2:0] = 3'd5;
8'b0001_???? : data[2:0] = 3'd4;
8'b0000_1??? : data[2:0] = 3'd3;
8'b0000_01?? : data[2:0] = 3'd2;
8'b0000_001? : data[2:0] = 3'd1;
8'b0000_0001 : data[2:0] = 3'd0;
default : data[2:0] = 3'd0;
endcase
end
这样的case有优先级选择,虽然可综合,但是不推荐使用,有优先用if-else,没有直接用case。
synopsys的EDA工具有关于full case与parallel case可以查看下面博客链接。
https://blog.csdn.net/li_hu/article/details/10336511
generate+for
合理使用generate+for循环可以提高编码效率,同样的赋值语句需要赋值多次。
generate
genvar i;
for(i=0;i<16;i=i+1)
begin: neg_data
assign neg_data_out[i*DATA_WIDTH +:DATA_WIDTH] =
-data_in[i*DATA_WIDTH +:DATA_WIDTH]
end
endgenerate
同一个模块需要实例化多次
generate
genvar i;
for(i=0;i<16;i=i+1)
begin: mult_12x12
DW02_mult #(
.A_WIDTH(12),
.B_WIDTH(12)
) u_DW02_mult0(
.A(mult_a[i*12 +:12]),
.B(mult_b[i*12 +:12]),
.TC(1'b0),
.PRODUCT(product[i*24 +:24])
);
end
endgenerate
当然这样写debug会有一些困扰,Verdi会显示每一个generate块,选中对应的块,加进去的波形就会是对应的bit信号。
generate if/case
做一些通用IP的方法,比如要做一个选择器通用IP,支持二选一,三选一,四选一。
generate if(MUX_NUM == 0)begin : mux4_1
always@(*)begin
case(sel[1:0])
2'b00:data_out = data_in0;
2'b01:data_out = data_in1;
2'b10:data_out = data_in2;
default:data_out = data_in3;
endcase
end
end else if(MUX_NUM = 1) begin : mux3_1
always@(*)begin
case(sel[1:0])
2'b00:data_out = data_in0;
2'b01:data_out = data_in1;
default:data_out = data_in2;
endcase
end
end else begin : mux2_1
always@(*)begin
case(sel[1:0])
2'b00:data_out = data_in0;
default:data_out = data_in1;
endcase
end
end endgenerate
generate case可以写更多的分支
generate
case(MUX_NUM)
0:begin:mux_2
end
1:begin: mux_3
end
2:begin: mux_4
end
default:begin
end
endcase
end endgenerate
调用的时候只需要
mux #(
.MUX_NUM(0)
)
u_mux(
...
);
参数化定义
模块化设计,功能模块的划分尽可能细, 差别不大的代码通过参数化达到重复使用的目的。
always @(*)begin
case(sel)
CASE0:data_out = data_in0;
CASE1:data_out = data_in1;
CASE2。。。
default:;
endcase
end
实例化
mux #(
.CASE0(8'd11),
.CASE1(8'd44)
...
)
u_mux(
...
);
移位操作
对于移位操作直接用位拼接,
assign data_shift[6:0] = data[4:0] << 2;
assign data_shift[7:0] = data[4:0] << shift[1:0];
写成
assign data_shift[6:0] = {data[4:0], 2'b0};
always @(*)begin
case(shift[1:0])
2'b00: data_shift[7:0] = {3'b0, data[4:0]};
2'b01: data_shift[7:0] = {2'b0, data[4:0], 1'b0};
2'b10: data_shift[7:0] = {1'b0, data[4:0], 2'b0};
default:data_shift[7:0] = {data[4:0], 3'b0};
endcase
end
如果是有符号数,高位要补符号位。也就是算术移位。
always @(*)begin
case(shift[1:0])
2'b00: data_shift[7:0] = {{3{data[4]}}, data[4:0]};
2'b01: data_shift[7:0] = {{2{data[4]}}, data[4:0], 1'b0};
2'b10: data_shift[7:0] = {data[4], data[4:0], 2'b0};
default:data_shift[7:0] = {data[4:0], 3'b0};
endcase
end
shift也可能是有符号数,正数左移,负数右移。右移方法同理。
$clog2系统函数
Verilog-2005引入了$clog2系统函数,为了方便计算数据位宽,避免位浪费。这个其实是来凑数的。
parameter DATA_WIDTH = 4,
parameter CNT_WIDTH = log2(DATA_WIDTH)
parameter CNT_WIDTH = clog2(DATA_WIDTH-1)
parameter CNT_WIDTH = $clog2(DATA_WIDTH)
reg [DATA_WIDTH-1:0] data_r0;
reg [CNT_WIDTH-1:0] cnt;
//-------------------------------------------------------
//以下两个函数任用一个
//求2的对数函数
function integer log2;
input integer value;
begin
value = value-1;
for (log2=0; value>0; log2=log2+1)
value = value>>1;
end
endfunction
//求2的对数函数
function integer clogb2 (input integer bit_depth);
begin
for(clogb2=0; bit_depth>0; clogb2=clogb2+1)
bit_depth = bit_depth>>1;
end
endfunction
对齐
tap键还是空格键?留言区说出你的故事。我把编辑器设置成tap自动替换成4个空格。
用空格对齐代码,提高代码观赏性。
assign signal_b = signal_a;
assign data_b = data_a;
assign cs_en = 1'b1;
assign signal_b = signal_a;
assign data_b = data_a;
assign cs_en = 1'b1;
第二种写法更美观,always块里面的语句也应该对齐。
命名
给模块起名字,给信号起名字,真的很难,但是不管怎样都不要用拼音,会遭人鄙视。
阶梯式assign
assign data_out[5:0] = data_vld0 ? data0[5:0] :
data_vld1 ? data1[5:0] :
data_vld2 ? data2[5:0] :
data_vld3 ? data3[5:0] : 6'b0;
由于if-else和case不能传播不定态,有的EDA工具有X态传播选项,可以强行传播,但是并不是所有的EDA工具都有这个功能,所以有些书上建议都用组合逻辑用assign。
这种写法没什么问题,但是有一点,覆盖率不好收,如果一些情况没跑到需要一个个分析。覆盖率会把数据当作一个情况列出来,比如数据data没出现过0 的情乱,实际上数据没出现0的情况是正常的,这就要你一个一个的exclude掉。
所以不要写很长的assign做选择器,有优先级用if-else,或根据具体情况用case。这样哪一行哪一种情况没跑到会一目了然。当然if中的条件太多,覆盖率也不好收,条件太多组合的情况多,分析起来繁琐。如果上述信号的vld不同时出现也可以采用这种写法,减少cell的使用数量。这样也是有覆盖率的问题,这只是一种特殊情况,很长的assign选择器尽量不要写。
assign data_out[5:0] = ({6{data_vld0}} & data0[5:0])
| ({6{data_vld1}} & data1[5:0])
| ({6{data_vld2}} & data2[5:0])
| ({6{data_vld3}} & data3[5:0]);
关于X态传播,一定要注意,带有reset的寄存器面积和时序会稍微差一些,控制通路的寄存器必须带有复位,数据通路的寄存器可以不带复位,但是要注意使用时如果使用数据通路的数据去做了控制条件,就必须要复位,否则如果X态没有查出来,事情就大了。
布线太密的原因
寄存器位宽太大。
reg [10000-1:0] data;
这样写在功能上没什么问题,但是如果你之后有对这个数据做了很多逻辑,可能会造成后端布线太密,从后端的角度看到其实cell数量并不多,就是线比较密,比如说这个数据后面再放个选择器,或者输出给其他模块,就相当于一万根线连到很多地方,布线很紧张,如果时序有问题需要又需要绕线,或者需要ECO,做成的可能性很小。
尽量不要这样做逻辑,除非对面积没限制,要么最后只能改架构。
第二个原因是负载太大。同一个信号在很多地方使用,布线也会变复杂,比如最常见的是参数信号,在很多模块都会有用到的情况,用寄存器复制的方法。
always @(posedge clk or negedge rst_n)begin
if(!rst_n)begin
data_para0 <= 4'b0;
data_para1 <= 4'b0;
data_para2 <= 4'b0;
end
else begin
data_para0 <= data_para;
data_para1 <= data_para;
data_para2 <= data_para;
end
end
画俩图大概意思一下。这样每个寄存器的驱动变少。
加比选
面积:加法器 > 比较器 > 选择器
乘法器本质上也是全加器。
所以就有先选后比,先选后加,先选后乘。
assign sum[4:0] = enable ? (data_a + data_b) : (data_c + data_d);
assign add_a[3:0] = enable ? data_a : data_c;
assign add_b[3:0] = enable ? data_b : data_d;
assign sum[4:0] = add_a + add_b;
画个图意思一下。
数据通路与控制通路
数据通路打拍可以不带复位,带着使能信号去打拍,减少信号翻转,减少功耗。保证数据用的时候不是X态,
组合逻辑路径是否需要插入pipeline,插入pipeline的位置需要注意。寄存器能少用就少用。
尽量不要用除法,首先除法器面积更大,除法也会有余数,余数是否需要保留就很麻烦。除以常数可以做成乘以定点常数的方法。
乘以常数用移位加,也可直接用*号。 例如a * 2‘d3,工具会帮你优化成 a << 2’d1 + a。甚至可能优化得更好。(杠:不要过度依赖工具)。关于用移位加还是*号的问题,博主做过综合后的面积对比,相对来说,工具还是优化那么一点点。直接用 * 号吧。
尽量不要用减法,减法要考虑到减翻的问题,尽量用加法。
方案设计
方案最重要,一个好的方案往往事半功倍。
状态机设计要状态明确,一个状态只做一件事情。状态机大法好。