【黑金原创教程】【FPGA那些事儿-驱动篇I 】实验十八:SDRAM模块① — 单字读写

实验十八:SDRAM模块① — 单字读写

笔者与SDRAM有段不短的孽缘,它作为冤魂日夜不断纠缠笔者。笔者尝试过许多方法将其退散,不过屡试屡败的笔者,最终心情像橘子一样橙。《整合篇》之际,笔者曾经大战几回儿,不过内容都是点到即止。最近它破蛊而出,日夜不停:“好~痛苦!好~痛苦!”地呻吟着,吓得笔者不敢半夜如厕。疯狂之下,誓要歪它不可 ... 可恶的东西,笔者要它血债血还!

clip_image002

图18.1 数据读取(理想时序左,物理时序右)。

首先,让我们来了解一下,什么才是数据读取的最佳状态?如图18.1所示,红色箭头是上升沿,绿色箭头是锁存沿。左图是理想时序读取数据的最佳状态,即T0发送数据,T1锁存数据。右图则是物理时序读取数据的最佳状态,即T0发送数据,然后数据经由 TDATA延迟,然后T1锁存数据。理想状态下,读取数据不用考虑任何物理因数,凡是过去值都会读取成功。

clip_image004

图18.2 读取数据(物理时序)。

然而物理状态下,读取数据则必须考虑物理因数,但是物理时序也有所谓的理想状态,即数据被TDATA推挤,然后恰好停留在锁存沿的正中间。该状态之所以称为理想,那是因为建立时间TSETUP与保持时间THOLD都被满足。

如图18.2所示,TSETUP从数据中间向左边覆盖,THOLD从数据中间向右边覆盖,如果两者不完全覆盖数据,那么数据的有效性就能得到保证。简言之,数据是否读取成功,建立时间还有保持时间都必须得到满足。但是我们也知道,Verilog不能描述理想以外的东西,即Verilog无力描述TDATA。话虽如此,我们可以改变时钟位移来达到同样的效果。

clip_image006

clip_image008

图18.3 CLOCK1位移 -180°(左图),没有位移(中图),CLOCK2 位移 +180°(右图),以及修正结果。

常见的理想时序,最多适用在FPGA的内部而已。当描述功活动涉及FPGA的外部,那么理想时序必须考虑对外的情况。如图18.3所示,中间的理想时序图可以经由 CLOCK1 位移 -180°,又或者 CLOCK2 位移 +180° 来得到同样的效果。虽说180° 的位移是理想效果,但是我们还要考虑物理路径所带来的影响。根据Alinix 301这只开发板,我们必须追加 -30° 位移才能达到修正的效果。(注意:追加-30° 的修正时序仅仅为适用Alinix 301这只板子而已)。理解完毕以后,我们便可进入正题。

驱动SDRAM而言,简单可以分为以下四项操作:

(一)初始化

(二)刷新操作

(三)读操作

(四)写操作

初始化令SDRAM就绪,刷新操作就是不失掉内容(数据),读操作就是从SDRAM哪里读取数据,写操作就是向SDRAM写数据。其中,读写操作又有单字读写,多字读写还有页读写。

首先,让我们来分析一下Alinx 开发板上HY57V2562GTR 这只SDRAM。根据手册,这只SDRAM有256Mb的容量,4个BANK(即一个BANK为64Mb),频率极限为200Mhz,数据保留周期为 8192 / 64ms。至于引脚定义如表18.1所示:

表18.1 SDRAM的引脚定义

分类

标示

信号

说明

时钟信号

CLK

S_CLK

时钟源

地址信号

BA0~1

S_BA[1:0]

BANK地址

A0~A12

S_A[12:0]

读写地址,行列共用,A0~A12为行地址,CA0~CA8为列地址

命令信号

CKE

S_CKE,

时钟选,拉高有效

CS

S_NCS,

片选,拉低有效

RAS

S_NRAS,

命令选,拉低有效

CAS

S_NCAS,

命令选,拉低有效

WE

S_NWE

命令选,拉低有效

数据信号

DQ0~DQ15

S_DQ[15:0]

读写数据的IO

LDQM,UDQM

S_DQM[1:0]

遮盖数据,一般拉低无视

如表18.1所示,CLK为SDRAM的时钟源。CKE,CS,RAS,CAS还有WE皆为命令信号,五者相互组合形成以下几个常用命令,结果如表18.2所示:

表18.2 常用命令。

命令

CKE

CS

RAS

CAS

WE

说明

NOP

1

0

1

1

1

空命令

ACT

1

0

0

1

1

激活命令,选择Bank地址与行地址

WR

1

0

1

0

0

写命令,开始写数据

RD

1

0

1

0

1

读命令,开始读数据

BSTP

1

0

1

1

0

停止命令,停止读写

PR

1

0

0

1

0

预充命令,释放选择

AR

1

0

0

0

1

刷新命令,刷新内容

LMR

1

0

0

0

0

设置命令,设置SDRAM

l NOP为No Operation,即空命令,除了给空时间以外没有任何意义。

l ACT为Active,即激活命令,用来选择某Bank某行。

l WR为Write,即写命令,通知设备开始写数据。

l RD为Read,即读命令,通知设备开始读数据。

l BSTP为Burst Stop,即停止命令,禁止设备继续读写。

l PR为 Precharge,即预充命令,用来释放某Bank与某行的选择。

l AR为Auto Refresh,即刷新命令,用来刷新或者更新数据内容。

l LMR为Load Mode Register,即设置命令,用来配置设备参数。

Verilog则可以这样描述这些命令,结果如代码18.1所示:

    parameter _INIT = 5'b01111, _NOP = 5'b10111, _ACT = 5'b10011, _RD = 5'b10101, _WR = 5'b10100,
              _BSTP = 5'b10110, _PR = 5'b10010, _AR = 5'b10001, _LMR = 5'b10000;

代码18.1

DQ0~DQ15为数据信号。BA0~1与A0~A12皆为地址信号,其中A0~A12行列共用,,然而地址信号可以指向的范围,如下计算:

2(2 Bank + 13 Row + 9 Column) × 16 bit = 224 × 16 bit

= 1.6777216e7 × 16 bit // 16M × 16 bit

= 2.68435456e8 bit

= 262144 kbit

= 256 Mbits

初始化:

初始化除了就绪SDRAM以外,我们还要设置SDRAM内部的 Mode Register,设置内容内容如表18.3所示:

表18.3 Mode Register的内容。

Mode Register

A12

A11

A10

A9

A8

A7

A6

A5

A4

A3

A2

A1

A0

0

0

OP Code

0

0

CAS Latency

BT

Burst Length

A3

Burst Type

0

Sequential

1

Interleave

 

Burst Length

A2

A1

A0

A3 = 0

A3 = 1

0

0

0

1

1

0

0

1

2

2

0

1

0

4

4

0

1

1

8

8

1

1

1

Full Page

Reserved

A9

Write Mode

0

Burst Read and Burst Write

1

Burst Read and Single Write

A6

A5

A4

CAS Latency

0

1

0

2

0

1

1

3

如表18.3所示,设置内容必须经由地址信号A12~A0。其中A2~A0表示字读写的长度,实验十八为单字读写,所以A2~A0设置为3’b000。A3表示读写次序,1’b0表示顺序读写。A6~A4表示 CAS 延迟(也可以视为读出延迟),设为 3’b011是为读出更稳定。A9表示读写模式,一般都是设置为1’b0。

clip_image010

图18.4 初始化的理想时序图。

图18.4是初始化的理想时序图,其中CLOCK1为 -210°的系统时钟,CLOCK2为SDRAM的时钟。rCMD为CKE,CS,RAS,CAS还有WE等命令。rA为A0~A12,rBA为BA0~BA1等地址信号。初始化过程如下所示:

l T0,满足100us;

l T1,发送PR命令,拉高所有rA与rBA。

l T1半周期,SDRAM读取。

l T2,满足TRP;

l T3,发送AR命令。

l T3半周期,SDRAM读取。

l T4,满足TRRC,

l T5,发送AR命令。

l T5半周期,SDRAM读取。

l T6,满足TRRC,

l T7,发送LMR命令与相关Code(设置内容)。

l T7半周期,SDRAM读取。

l T8,满足TMRD。

怎么样?读者是不是觉得很单纯呢?事后,Verilog则可以这样描述,结果如代码18.2所示:

1.    case( i )
2.                    
3.           0:  // delay 100us
4.           if( C1 == T100US -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
5.           else begin C1 <= C1 + 1'b1; end 
6.                   
7.           1: // Send Precharge Command
8.           begin rCMD <= _PR; { rBA, rA } <= 15'h3fff; i <= i + 1'b1; end
9.                        
10.           2: // wait TRP 20ns
11.          if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
12.           else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
13.                   
14.           3: // Send Auto Refresh Command
15.           begin rCMD <= _AR; i <= i + 1'b1; end
16.                   
17.           4: // wait TRRC 63ns
18.          if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
19.           else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
20.                        
21.           5: // Send Auto Refresh Command
22.           begin rCMD <= _AR; i <= i + 1'b1; end
23.                   
24.          6: // wait TRRC 63ns
25.    if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
26.          else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
27.                               
28.          7: // Send LMR Cmd. Burst Read & Write, 3'b011 mean CAS latecy = 3, Sequential, 1 burst length
29.          begin rCMD <= _LMR; rBA <= 2'b11; rA <= {3'd0,1'b0,2'd0,3'b011,1'b0, 3'b000}; i <= i + 1'b1; end
30.                        
31.         8: // Send 2 nop CLK for tMRD
32.         if( C1 == TMRD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
33.         else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
34.                                  
35.         9: // Generate done signal
36.         begin isDone <= 1'b1; i <= i + 1'b1; end
37.                        
38.        10:
39.        begin isDone <= 1'b0; i <= 4'd0; end
40.                   
41.    endcase

代码18.2

代码18.2完全按照图18.4去驱动,读者只要将i看为T就万事大吉,其中步骤7发送LMR命令还有设置Code内容。至于步骤8~9则用来产生完成信号。

刷新操作:

clip_image012

图18.5 刷新操作的理想时序图。

所谓定期刷新就是被宫掉的初始化,如图18.5所示,时序过程如下:

l T0,发送PR命令(拉高所有rA与rBA视喜好而定);

l T0半周期,SDRAM读取。

l T1,满足TRP;

l T2,发送AR命令。

l T2半周期,SDRAM读取。

l T3,满足TRRC,

l T4,发送AR命令。

l T4半周期,SDRAM读取。

l T5,满足TRRC,

Verilog 则可以这样表示,结果如表18.3所示:

1.    case( i )
2.                    
3.            0: // Send Precharge Command
4.            begin rCMD <= _PR; i <= i + 1'b1; end
5.                         
6.            1: // wait TRP 20ns
7.            if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
8.             else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
9.                         
10.             2: // Send Auto Refresh Command
11.             begin rCMD <= _AR; i <= i + 1'b1; end
12.                   
13.             3: // wait TRRC 63ns
14.            if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
15.             else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
16.                         
17.            4: // Send Auto Refresh Command
18.             begin rCMD <= _AR; i <= i + 1'b1; end
19.                   
20.             5: // wait TRRC 63ns
21.            if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
22.             else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
23.                    
24.             6: // Generate done signal
25.             begin isDone <= 1'b1; i <= i + 1'b1; end
26.                        
27.            7:
28.            begin isDone <= 1'b0; i <= 4'd0; end
29.    
30.    endcase

代码18.3

除了步骤6~7用来产生完成信号以外,代码18.3都是据图18.5描述。SDRAM储存的内容是非常脆弱的,如果我们不定期刷新内容,该内容有可能会蒸发掉。根据 HY57V2562GTR这只 SDRAM,它的内容储存周期为 8192 / 64ms,然而定期刷新的计算如下:

64ms / 8192 = 7.8125us

换言之,每隔7.8125微妙就要刷新一次所有内容。

写操作:

clip_image014

图18.6 写操作的理想时序图。

图18.6是写操作的理想时序图,过程如下:

l T1,发送ACT命令,BANK地址与行地址;

l T1半周期,SDRAM读取;

l T2,满足TRCD;

l T3,发送WR命令,BANK地址与列地址,还有写数据;

l T3半周期,SDRAM读取

l T4,满足TWR;

l T5,满足TRP。

正如前面说过,ACT命令式用来选择BANK地址与行地址,然而关键就在T3。T3除了发送WR命令,列地址,还有些数据以外,A10拉高是为了执行预充电。所谓预充电就是释放BANK地址,行地址与列地址等的选择。因此,满足TWR以后,我们还要满足TRP的释放时间,好让SDRAM有足够的时间自行释放选择。

Verilog则可以这样描述,结果如代码18.4所示:

1.    case( i )
2.                    
3.          0: // Set IO to output State
4.         begin isOut <= 1'b1; i <= i + 1'b1; end
5.                       
6.         1: // Send Active Command with Bank and Row address
7.         begin rCMD <= _ACT; rBA <= iAddr[23:22]; rA <= iAddr[21:9]; i <= i + 1'b1; end
8.                         
9.        2: // wait TRCD 20ns
10.        if( C1 == TRCD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
11.         else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end             
12.                     
13.         3: // Send Write cmd with row address, pull up A10 1 clk to PR
14.         begin rCMD <= _WR; rBA <= iAddr[23:22]; rA <= { 4'b0010, iAddr[8:0] }; i <= i + 1'b1; end
15.                    
16.         4: // wait TWR 2 clock
17.         if( C1 == TWR -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
18.          else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end  
19.                         
20.         5: // wait TRP 20ns
21.         if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
22.          else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end                
23.                    
24.          6: // Generate done signal
25.          begin isDone <= 1'b1; i <= i + 1'b1; end
26.                        
27.         7:
28.         begin isDone <= 1'b0; i <= 4'd0; end
29.                    
30.     endcase

代码18.4

根据前面的计算,BA1~BA0再加上 RA12~A0与 CA8~A0以后,一共有24位宽,详细的位分配如表18.4所示:

表18.4 Addr的位分配。

位分配

地址内容

Addr[23:22]

BANK地址

Addr[21:9]

行地址

Addr[8:0]

列地址

如代码18.4所示,步骤用来设置IO口为输出。步骤1为rA赋值行地址,步骤3则为rA赋值列地址,并且拉高A10以示自行预充电。步骤6~7用来产生完成信号。

读操作:

clip_image016

图18.7 读操作的理想时序。

图18.7为读操作的理想时序,大致过程如下:

l T1,发送ACT命令,BANK地址与行地址;

l T1半周期,SDRAM读取;

l T2,满足TRCD;

l T3,发送RD命令,BANK地址与列地址;

l T3半周期,SDRAM读取命令。

l T4,满足 CAS Latency。

l T5,读取数据。

l T6,满足TRP。

读操作与写操作的过程大同小异,除了WR命令变成RD命令以外,A10为1同样表示自行预充电,余下就是满足CAS Latency。好奇的同学一定会觉得疑惑,为何CL 为3呢?其实没什么,只是直感上觉得3这个数字比较顺眼一点。注意CL的计算方式是读取RD命令以后开始计算。

Verilog可以这样描述,结果如代码18.5所示:

1.    case( i )
2.                    
3.            0:
4.            begin isOut <= 1'b0; D1 <= 16'd0; i <= i + 1'b1; end
5.    
6.             1: // Send Active command with Bank and Row address
7.             begin rCMD <= _ACT; rBA <= iAddr[23:22]; rA <= iAddr[21:9]; i <= i + 1'b1; end
8.                         
9.            2: // wait TRCD 20ns
10.            if( C1 == TRCD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
11.            else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end 
12.                    
13.            3: // Send Read command and column address, pull up A10 to PR.
14.             begin rCMD <= _RD; rBA <= iAddr[23:22]; rA <= { 4'b0010, iAddr[8:0]}; i <= i + 1'b1; end
15.                         
16.            4: // wait CL 3 clock
17.            if( C1 == CL -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
18.            else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end 
19.                    
20.            5: // Read Data
21.            begin D1 <= S_DQ; i <= i + 1'b1; end
22.                                         
23.           6: // wait TRP 20ns
24.           if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
25.            else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end  
26.            
27.            7: // Generate done signal
28.            begin isDone <= 1'b1; i <= i + 1'b1; end
29.                        
30.           8:
31.           begin isDone <= 1'b0; i <= 4'd0; end
32.    
33.    endcase

代码18.5

代码18.5完全根据图18.7描述,除了步骤7~8用于产生完成信号以外。SDRAM的基本操作大致上就是这样而已,完后我们便可以开始建模了。

clip_image018

图18.8 SDRAM基础模块的建模图。

图18.8是SDRAM基础模块的建模图,SDRAM基础模块的内容包括SDRAM控制模块,还有SDRAM功能模块。外围的PLL模块应用频率为133Mhz向左位移210°的CLOCK1,还有133Mhz的CLOCK2。CLOCK1用作系统时钟,CLOCK用作SDRAM时钟。如果PLL模块硬要分类的话,它应该属于特殊性质的即时类吧!?

SDRAM控制模块主要负责一些操作的调度,左边2位Call/Done由外部调用,其中 [1]为写操作 [0]为读操作;右边4位Call/Done为调用SDRAM功能模块,其中 [3]为写操作 [2]为读操作 [1]为刷新 [0]为初始化。SDRAM功能模块的右边是驱动SDRAM硬件资源的顶层信号,左边的问答信号被控制模块调用以外,地址信号还有数据信号都直接连接外部。

sdram_funcmod.v

clip_image020

图18.9 SDRAM功能模块的建模图。

该说的东西笔者都已经说了,具体内容我们还是来看代码吧。

1.    module sdram_funcmod
2.    (
3.          input CLOCK,
4.         input RESET,
5.         
6.         output S_CKE, S_NCS, S_NRAS, S_NCAS, S_NWE,
7.         output [1:0]S_BA,  
8.         output [12:0]S_A,  
9.         output [1:0]S_DQM,
10.         inout [15:0]S_DQ,
11.         
12.         input [3:0]iCall,
13.         output oDone,
14.         input [23:0]iAddr,  // [23:22]BA,[21:9]Row,[8:0]Column
15.         input [15:0]iData,
16.         output [15:0]oData
17.    );

以上内容为相关的出入端声明。

18.        parameter T100US = 14'd13300;
19.        // tRP 20ns, tRRC 63ns, tRCD 20ns, tMRD 2CLK, tWR/tDPL 2CLK, CAS Latency 3CLK
20.        parameter  TRP = 14'd3, TRRC = 14'd9, TMRD = 14'd2, TRCD = 14'd3, TWR = 14'd2, CL = 14'd3;
21.        parameter  _INIT = 5'b01111, _NOP = 5'b10111, _ACT = 5'b10011, _RD = 5'b10101, _WR = 5'b10100,
22.                  _BSTP = 5'b10110, _PR = 5'b10010, _AR = 5'b10001, _LMR = 5'b10000;
23.    

以上内容为相关的常量声明,其中第18~20行的是将常量都是经由133Mhz量化。

24.        reg [4:0]i;
25.        reg [13:0]C1;
26.        reg [15:0]D1;
27.        reg [4:0]rCMD;
28.        reg [1:0]rBA;
29.        reg [12:0]rA;
30.        reg [1:0]rDQM;
31.        reg isOut;
32.        reg isDone;
33.    
34.        always @ ( posedge CLOCK or negedge RESET )
35.            if( !RESET )
36.                begin
37.                    i <= 4'd0;
38.                  C1 <= 14'd0;
39.                  D1 <= 16'd0;
40.                    rCMD <= _NOP;
41.                    rBA <= 2'b11;
42.                  rA <= 13'h1fff;
43.                    rDQM <= 2'b00;
44.                    isOut <= 1'b1;
45.                  isDone <= 1'b0;
46.                end

以上内容为相关的寄存器声明以及复位操作。

47.              else if( iCall[3] )
48.                case( i )
49.                    
50.                    0: // Set IO to output State
51.                    begin isOut <= 1'b1; i <= i + 1'b1; end
52.                       
53.                    1: // Send Active Command with Bank and Row address
54.                    begin rCMD <= _ACT; rBA <= iAddr[23:22]; rA <= iAddr[21:9]; i <= i + 1'b1; end
55.                         
56.                  2: // wait TRCD 20ns
57.                  if( C1 == TRCD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
58.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end             
59.                    
60.                    /*********************************************/
61.                    
62.                    3: // Send Write command with row address, pull up A10 1 clk to PR
63.                    begin rCMD <= _WR; rBA <= iAddr[23:22]; rA <= { 4'b0010, iAddr[8:0] }; i <= i + 1'b1; end
64.                    
65.                  4: // wait TWR 2 clock
66.                  if( C1 == TWR -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
67.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end  
68.                         
69.                  5: // wait TRP 20ns
70.                  if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
71.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end                
72.                    
73.                    /**********************************************/
74.                    
75.                    6: // Generate done signal
76.                    begin isDone <= 1'b1; i <= i + 1'b1; end
77.                        
78.                  7:
79.                  begin isDone <= 1'b0; i <= 4'd0; end
80.                    
81.                endcase

以上内容为部分核心操作。第47行的if( iCall[3] ) 表示余下内容为写操作。

82.            else if( iCall[2] )
83.                case( i )
84.                    
85.                  0:
86.                  begin isOut <= 1'b0; D1 <= 16'd0; i <= i + 1'b1; end
87.    
88.                    1: // Send Active command with Bank and Row address
89.                    begin rCMD <= _ACT; rBA <= iAddr[23:22]; rA <= iAddr[21:9]; i <= i + 1'b1; end
90.                         
91.                  2: // wait TRCD 20ns
92.                  if( C1 == TRCD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
93.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end 
94.                
95.                    /********************/
96.                    
97.                    3: // Send Read command and column address, pull up A10 to PR
98.                    begin rCMD <= _RD; rBA <= iAddr[23:22]; rA <= { 4'b0010, iAddr[8:0]}; i <= i + 1'b1; end
99.                         
100.                    4: // wait CL 3 clock
101.                    if( C1 == CL -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
102.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end 
103.                                       
104.                    /********************/ 
105.                    
106.                    5: // Read Data
107.                    begin D1 <= S_DQ; i <= i + 1'b1; end
108.                    
109.                    /********************/
110.                         
111.                   6: // wait TRP 20ns
112.                  if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
113.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end  
114.                    
115.                  /********************/
116.                         
117.                    7: // Generate done signal
118.                    begin isDone <= 1'b1; i <= i + 1'b1; end
119.                        
120.                  8:
121.                  begin isDone <= 1'b0; i <= 4'd0; end
122.    
123.                endcase

以上内容为部分核心操作。第82行的if( iCall[2] ) 表示余下内容为读操作。

124.              else if( iCall[1] )
125.                case( i )
126.                    
127.                  0: // Send Precharge Command
128.                  begin rCMD <= _PR; i <= i + 1'b1; end
129.                         
130.                  1: // wait TRP 20ns
131.                  if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
132.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
133.                         
134.                    2: // Send Auto Refresh Command
135.                    begin rCMD <= _AR; i <= i + 1'b1; end
136.                   
137.                    3: // wait TRRC 63ns
138.                  if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
139.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
140.                         
141.                  4: // Send Auto Refresh Command
142.                    begin rCMD <= _AR; i <= i + 1'b1; end
143.                   
144.                    5: // wait TRRC 63ns
145.                  if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
146.                    else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
147.                    
148.                    /********************/
149.                    
150.                    6: // Generate done signal
151.                    begin isDone <= 1'b1; i <= i + 1'b1; end
152.                        
153.                  7:
154.                  begin isDone <= 1'b0; i <= 4'd0; end
155.    
156.                endcase

以上内容为部分核心操作。第124行的if( iCall[1] ) 表示余下内容为刷新操作。

157.              else if( iCall[0] )
158.                case( i )
159.                    
160.                   0:  // delay 100us
161.                   if( C1 == T100US -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
162.                   else begin C1 <= C1 + 1'b1; end 
163.                   
164.                   /********************/
165.                   
166.                   1: // Send Precharge Command
167.                   begin rCMD <= _PR; { rBA, rA } <= 15'h3fff; i <= i + 1'b1; end
168.                        
169.                   2: // wait TRP 20ns
170.                 if( C1 == TRP -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
171.                   else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
172.                   
173.                   3: // Send Auto Refresh Command
174.                   begin rCMD <= _AR; i <= i + 1'b1; end
175.                   
176.                   4: // wait TRRC 63ns
177.                if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
178.                   else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
179.                        
180.                   5: // Send Auto Refresh Command
181.                   begin rCMD <= _AR; i <= i + 1'b1; end
182.                   
183.                   6: // wait TRRC 63ns
184.                 if( C1 == TRRC -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
185.                   else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
186.                
187.                   /********************/
188.                   
189.                   7: // Send LMR Cmd. Burst Read & Write,  3'b010 mean CAS latecy = 3, Sequential, 1 burst length
190.                   begin rCMD <= _LMR; rBA <= 2'b11; rA <= { 3'd0, 1'b0, 2'd0, 3'b011, 1'b0, 3'b000 }; i <= i + 1'b1; end
191.                        
192.                8: // Send 2 nop CLK for tMRD
193.                if( C1 == TMRD -1 ) begin C1 <= 14'd0; i <= i + 1'b1; end
194.                  else begin rCMD <= _NOP; C1 <= C1 + 1'b1; end
195.                   
196.                   /********************/
197.                   
198.                   9: // Generate done signal
199.                   begin isDone <= 1'b1; i <= i + 1'b1; end
200.                        
201.                10:
202.                begin isDone <= 1'b0; i <= 4'd0; end
203.                   
204.                endcase
205.                   

以上内容为部分核心操作。第157行的if( iCall[0] ) 表示余下内容为初始化。

206.         assign { S_CKE, S_NCS, S_NRAS, S_NCAS, S_NWE } = rCMD;
207.         assign { S_BA, S_A } = { rBA, rA };
208.         assign S_DQM = rDQM;
209.         assign S_DQ  = isOut ? iData : 16'hzzzz;
210.         assign oDone = isDone;
211.         assign oData = D1;
212.    
213.    endmodule

以上内容为相关的输出驱动声明,注意 iData直接驱动 S_DQ。

sdram_ctrlmod.v

clip_image022

图18.10 SDRAM控制模块的建模图。

前面说过该模块负责一些功能调用,此外该模块也负责定时刷新的计算,具体内容我们还是来看代码吧。

1.    module sdram_ctrlmod
2.    (
3.        input CLOCK,
4.        input RESET,
5.        input [1:0]iCall, // [1]Write, [0]Read
6.        output [1:0]oDone,
7.        output [3:0]oCall,
8.        input iDone
9.    );
10.        parameter WRITE = 4'd1, READ = 4'd4, REFRESH = 4'd7, INITIAL = 4'd8;
11.        parameter TREF = 11'd1040;
12.        

以上内容为相关的出入端声明。第10行是各个入口地址的常量声明,第11行则是定时刷新的周期——7.8125us。

13.        reg [3:0]i;
14.        reg [10:0]C1;
15.        reg [3:0]isCall; //[3]Write [2]Read [1]A.Refresh [0]Initial
16.        reg [1:0]isDone;
17.        
18.        always @ ( posedge CLOCK or negedge RESET )
19.            if( !RESET )
20.                 begin
21.                        i <= INITIAL;          // Initial SDRam at first 
22.                        C1 <= 11'd0;
23.                        isCall <= 4'b0000;
24.                        isDone <= 2'b00;
25.                  end

以上内容为相关的寄存器声明以及复位操作。第21行表示i首先会指向初始化。

26.             else 
27.                 case( i )
28.                  
29.                        0: // IDLE
30.                        if( C1 >= TREF ) begin C1 <= 11'd0;  i <= REFRESH; end
31.                        else if( iCall[1] ) begin C1 <= C1 + 1'b1; i <= WRITE; end 
32.                        else if( iCall[0] ) begin C1 <= C1 + 1'b1; i <= READ; end 
33.                        else begin C1 <= C1 + 1'b1; end
34.    
35.                        /***********************/
36.                        

以上内容为部分核心操作。步骤0为待机状态,期间第33行的C1会一直递增,如果期间没有任何读写操作,而且C1的计数内容也超过 TREF,那么C1会清零,i指向REFRESH(第30行)。反之,如果读写操作被使能,i指向相关的步骤入口,期间C1也会递增以示步骤翻转所用掉的时钟。

37.                        1: //Write 
38.                        if( iDone ) begin isCall[3] <= 1'b0; C1 <= C1 + 1'b1; i <= i + 1'b1; end
39.                        else begin isCall[3] <= 1'b1; C1 <= C1 + 1'b1; end
40.                        
41.                        2:
42.                        begin isDone[1] <= 1'b1; C1 <= C1 + 1'b1; i <= i + 1'b1; end
43.                        
44.                        3:
45.                        begin isDone[1] <= 1'b0; C1 <= C1 + 1'b1; i <= 4’d0; end
46.                        
47.                        /***********************/
48.                        

 

以上内容为部分核心操作。步骤1~3是写操作。步骤1表示,功能模块反馈完成信号之前,C1会不停递增。当完成信号接收到手,isCall[3]拉低,C1递增,i也递增。步骤2~3则是用来反馈写操作的完成信号,期间C1也会递增。

49.                         4: // Read
50.                        if( iDone ) begin isCall[2] <= 1'b0; C1 <= C1 + 1'b1; i <= i + 1'b1; end
51.                        else begin isCall[2] <= 1'b1; C1 <= C1 + 1'b1; end
52.                        
53.                        5:
54.                        begin isDone[0] <= 1'b1; C1 <= C1 + 1'b1; i <= i + 1'b1; end
55.                        
56.                        6:
57.                        begin isDone[0] <= 1'b0; C1 <= C1 + 1'b1; i <= 4'd0; end
58.                        
59.                        /***********************/
60.                        

以上内容为部分核心操作。步骤4~6是读操作。步骤4表示接收完成信号之前,isCall[2]会不停拉高,C1也会不停递增 ... 直至接收完成信号,isCall[2]才会拉低,然而C1也会递增。步骤5~6用反馈读操作的完成信号。

61.                        7: // Auto Refresh 
62.                        if( iDone ) begin isCall[1] <= 1'b0; i <= 4'd0; end
63.                        else begin isCall[1] <= 1'b1; end
64.                        
65.                        /***********************/
66.                        

以上内容为部分核心操作。步骤7是刷新操作,接收完成信号之前 isCall[1] 会不停拉高,直至接收完成信号为止,isCall[1]才会拉低,然后i指向步骤0。

67.                        8: // Initial 
68.                        if( iDone ) begin isCall[0] <= 1'b0; i <= 4'd0; end
69.                        else begin isCall[0] <= 1'b1; end
70.                        
71.                  endcase
72.        
73.        assign oDone = isDone;
74.        assign oCall = isCall;
75.        
76.    endmodule

以上内容为部分核心操作。步骤8用来执行初始化,接收完成信号之前,isCall[0]会不停拉高,直至接收完成信号为止,isCall[0]才会拉低,然后i指向步骤0。第73~74行则是相关的输出驱动。整体而言,除了读写操作必须反馈完成信号给上层以外,其余的定期刷新还有初始化都是该内部操作,所以不用反馈完成信号。

sdram_basemod.v

内容的连线部署完全依照图18.8。

1.    module sdram_basemod
2.    (
3.         input CLOCK,
4.         input RESET,
5.         
6.         output S_CKE, S_NCS, S_NRAS, S_NCAS, S_NWE,
7.         output [1:0]S_BA,
8.         output [12:0]S_A, 
9.         output [1:0]S_DQM,
10.         inout [15:0]S_DQ,
11.         
12.         input [1:0]iCall,
13.         output [1:0]oDone,
14.         input [23:0]iAddr,
15.         input [15:0]iData,
16.         output [15:0]oData
17.    ); 

以上内容为相关的出入端声明,第5~10行是顶层信号,第12~16行是模块左右两边的信号。

18.         wire [3:0]CallU1; // [3]Refresh, [2]Read, [1]Write, [0]Initial
19.    
20.        sdram_ctrlmod U1
21.         (
22.              .CLOCK( CLOCK ),
23.              .RESET( RESET ),
24.              .iCall( iCall ),       // < top ,[1]Write [0]Read
25.              .oDone( oDone ),     // > top ,[1]Write [0]Read
26.              .oCall( CallU1 ),    // > U2 
27.              .iDone( DoneU2 )    // < U2
28.         );
29.         

以上内容为控制模块的实例化。

30.         wire DoneU2;
31.         
32.         sdram_funcmod U2
33.         (
34.             .CLOCK( CLOCK ),
35.              .RESET( RESET ),
36.              .S_CKE( S_CKE ),     // > top
37.              .S_NCS( S_NCS ),     // > top
38.              .S_NRAS( S_NRAS ),  // > top
39.              .S_NCAS( S_NCAS ),  // > top
40.              .S_NWE( S_NWE ),      // > top
41.              .S_BA( S_BA ),        // > top
42.              .S_A( S_A ),           // > top
43.              .S_DQM( S_DQM ),    // > top
44.              .S_DQ( S_DQ ),       // <> top        
45.              .iCall( CallU1 ),         // < U1
46.              .oDone( DoneU2 ),      // > U1
47.              .iAddr( iAddr ),        // < top
48.              .iData( iData ),          // < top
49.              .oData( oData )       // > top
50.         );
51.         
52.    endmodule

以上内容为功能模块的实例化。

sdram_demo.v

clip_image024

图18.11 实验十八的建模图。

图18.11是实验十八的建模图,其中sdram_demo包含PLL模块,核心操作还有SDRAM基础模块。PLL模块将50Mhz的时钟倍频为133Mhz而且左移210° 的CLOCK1,还有133Mhz的CLOCK2,它直接驱动S_CLK顶层信号。核心操作负责调用SDRAM基础模块,并且将读写内容经由TXD发送出去。SDRAM基础模块左边的问答信号只有两位,其中[1]为写 [0]为读,具体内容我们还是来看代码吧。

1.    module sdram_demo
2.    (
3.         input CLOCK,
4.         input RESET,
5.         output S_CLK,
6.         output S_CKE, S_NCS, S_NRAS, S_NCAS, S_NWE,
7.         output [12:0]S_A, 
8.         output [1:0]S_BA,
9.         output [1:0]S_DQM,
10.         inout [15:0]S_DQ,
11.         output TXD
12.    ); 

以上内容为相关的出入端声明。

13.         wire CLOCK1,CLOCK2;
14.         
15.         pll_module U1
16.         (
17.                 .inclk0 ( CLOCK ), // 50Mhz
18.                .c0 ( CLOCK1 ),  // 133Mhz -210 degree phase
19.                .c1 ( CLOCK2 )   // 133Mhz 
20.         );
21.         

以上内容为PLL模块的实例化,CLOCK1为133Mhz频率并且左移210°,CLOCK2为133Mhz频率,并且直接驱动 S_CLK。

22.         wire [1:0]DoneU2;
23.         wire [15:0]DataU2;
24.         
25.         sdram_basemod U2
26.         (
27.             .CLOCK( CLOCK1 ),
28.             .RESET( RESET ),
29.              .S_CKE( S_CKE ),
30.              .S_NCS( S_NCS ),
31.              .S_NRAS( S_NRAS ),
32.              .S_NCAS( S_NCAS ),
33.              .S_NWE( S_NWE ),
34.              .S_A( S_A ),
35.              .S_BA( S_BA ),
36.              .S_DQM( S_DQM ),
37.              .S_DQ( S_DQ ),
38.              .iCall( isCall ),
39.              .oDone( DoneU2 ),
40.              .iAddr( D1 ),
41.              .iData( D2 ),
42.              .oData( DataU2 )
43.         );
44.

以上内容为SDRAM基础模块的实例化,第40~41行表示 iAddr为D1驱动,iData为D2驱动。

 
45.         parameter B115K2 = 11'd1157, TXFUNC = 6'd16;
46.         
47.         reg [5:0]i,Go;
48.         reg [10:0]C1;
49.         reg [23:0]D1;
50.         reg [15:0]D2,D3;
51.         reg [10:0]T;
52.         reg [1:0]isCall;
53.         reg rTXD;
54.         
55.         always @ ( posedge CLOCK1 or negedge RESET )
56.             if( !RESET )
57.                 begin
58.                           i <= 6'd0;
59.                          Go <= 6'd0;
60.                          C1 <= 11'd0;
61.                           D1 <= 24'd0;
62.                          D2 <= 16'd0;
63.                          D3 <= 16'd0;
64.                          T <= 11'd0;
65.                          isCall <= 2'b00;
66.                          rTXD <= 1'b1;
67.                 end

以上内容为相关的寄存器以及复位操作。第45行是波特率为115200还有伪函数入口的常量声明。

 
68.             else 
69.                 case( i )
70.                        
71.                         0:
72.                         if( DoneU2[1] ) begin isCall[1] <= 1'b0; i <= i + 1'b1; end
73.                         else begin isCall[1] <= 1'b1; D1 <= 24'd0; D2 <= 16'hABCD; end
74.                         
75.                         1:
76.                         if( DoneU2[0] ) begin D3 <= DataU2; isCall[0] <= 1'b0; i <= i + 1'b1; end
77.                         else begin D1 <= 24'd0; isCall[0] <= 1'b1; end
78.                         
79.                         2:
80.                         begin T <= { 2'b11, D3[15:8], 1'b0 }; i <= TXFUNC; Go <= i + 1'b1; end
81.                         
82.                         3:
83.                         begin T <= { 2'b11, D3[7:0], 1'b0 }; i <= TXFUNC; Go <= i + 1'b1; end
84.                         
85.                         4:
86.                         i <= i;
87.                         
88.                        /******************************/
89.                     

以上内容为部分核心操作。步骤0将数据16’hABCD写入地址0。步骤1从地址0读出数据 16’hABCD,并且暂存至D3。步骤2先发送D3的高8位,步骤3则发送D3的低8位。步骤4发呆。

90.                          16,17,18,19,20,21,22,23,24,25,26:
91.                         if( C1 == B115K2 -1 ) begin C1 <= 11'd0; i <= i + 1'b1; end
92.                         else begin rTXD <= T[i - 16]; C1 <= C1 + 1'b1; end
93.                         
94.                         27:
95.                         i <= Go;
96.                         
97.                endcase
98.    
99.         assign S_CLK = CLOCK2;
100.         assign TXD = rTXD;
101.    
102.    endmodule

以上内容为部分核心操作。步骤16~27是发送一帧数据的伪函数。第99~100行则是相关的输出驱动。综合完毕并且下载程序,如果串口调试软件出现 ABCD等两字节数据,结果表示实验成功。

细节一:完整的个体模块

SDRAM基础模块已经就绪完毕。

细节二:其它时序参数

驱动SDRAM最大的收获莫过于学习各种稀奇古怪的时序参数,虽然实验十六的IIC,也有时序参数,但是前者好比一粒面包屑,后者则是一片面包,两种时序参数有“体积”上的明确差距。笔者曾经说过,时序参数即时间要求有第一层与第二层之分,第一层时间要求正如IIC的时序参数,打得像面包一样 ... 反之,第二层时间要求宛如SDRAM的时序参数,小得似面包屑一般。

SDRAM的时序参数除了 tRP,TRRC,TMRD,CAS Latency 等这些东西以外,它还有更为极为,而且不能控制的时序参数。更确切来说,这些时序参数都属于物理因数的范围 ... 难得有机会学习SDRAM,笔者就稍微聊聊它们吧。

clip_image026

图18.12 时序参数①。

图18.12是读操作的部分时序,当CL得到满足以后,数据就会被吐出来,其中:

TLZ(TLOZ)为 clock to data output in low-Z time。简单来说,就是数据被出发沿吐出之前,必须经过的延迟时间。根据手册,133Mhz为1ns。

TAC为 access time from clock。简单来说就是有效时间。根据手册,133Mhz为5.4ns

TOH为 data out hold time。简单来说就是常见的 THOLD。根据手册,133Mhz为2.5ns

clip_image028

图18.13 时序参数②。

图18.13是写操作的部分时序图,然而重点家伙就是当中 T××S或者T××H。一般××是指数据的属性或者类别,不过S与H都有相同的意义,就是典型的TSETUP还有THOLD。笔者习惯称呼它们为寄存器特性,因为只要任何一方得不到满足,数据读入寄存器就得不到保证。寄存器特性好比哥布林一样,数量常常多到令人喷饭,如果一一分析会耗死爷爷不偿命。

clip_image030

图18.14 对外的理想时序。

为了用足一支竹竿扫尽一切,笔者才故意向将CLOCK1左移180° 测试手气,看看SDRAM能不能读出正确的结果,如果不是再追加位移或者减少位移以致修正,结果如图18.14所示。一般而言,T××S或者T××H这些家伙都会得到满足,然后乖乖就范。话虽如此,同学们还须注意,Verilog充其量只能满足第二层的时间要求,却不能涉及(解决)其中,我们往往只能依赖运气与直觉。当然,我们可以借助静态时序分析的力量去搞定一切,有兴趣的朋友请看《工具篇I》。

posted on 2015-03-02 20:40  ALINX官方博客  阅读(6995)  评论(1编辑  收藏  举报