[转载]一个硬件工程师高手的设计经验分享
原文地址:一个硬件工程师高手的设计经验分享作者:森林海
现象一:这主频100M 的CPU 只能处理70%,换200M 主频的就没事了
点评:系统的处理能力牵涉到多种多样的因素,在通信业务中其瓶颈一般都在存储器上,CPU 再快,外部访问快不起来也是徒劳。
现象二:CPU 用大一点的CACHE,就应该快了
点 评:CACHE的增大,并不一定就导致系统性能的提高,在某些情况下关闭CACHE反而比使用CACHE还快。原因是搬到CACHE中的数据必须得到多次重复使用才会提高系统效率。所以在通信系统中一般只打开指令CACHE,数据CACHE 即使打开也只局限在部分存储空间,如堆栈部分。同时也要求程序设计要兼顾CACHE的容量及块大小,这涉及到关键代码循环体的长度及跳转范围,如果一个循环刚好比CACHE大那么一点点,又在反复循环的话,那就惨了。
现象三:这么多任务到底是用中断还是用查询呢?还是中断快些吧
点 评:中断的实时性强,但不一定快。如果中断任务特别多的话,这个没退出来,后面又接踵而至,一会儿系统就将崩溃了。如果任务数量多但很频繁的话,CPU 的很大精力都用在进出中断的开销上,系统效率极为低下,如果改用查询方式反而可极大提高效率,但查询有时不能满足实时性要求,所以最好的办法是在中断中查询,即进一次中断就把积累的所有任务都处理完再退出。
现象四:存储器接口的时序都是厂家默认的配置,不用修改的
点评:BSP对存储器接口设置的默认值都是按最保守的参数设置的,在实际应用中应结合总线工作频率和等待周期等参数进行合理调配。有时把频率降低反而可提高效率,如RAM的存取周期是70ns,总线频率为40M 时,设3 个周期的存取时间,即75ns即可;若总线频率为50M时,必须设为4 个周期,实际存取时间却放慢到了 80ns。
现象五:一个CPU 处理不过来,就用两个分布处理,处理能力可提高一倍
点评:对于搬砖头来说,两个人应该比一个人的效率高一倍;对于作画来说,多一个人只能帮倒忙。使用几个CPU 需对业务有较多的了解后才能确定,尽量减少两个CPU 间协调的代价,使1+1 尽可能接近2,千万别小于1。
现象六:这个CPU 带有DMA模块,用它来搬数据肯定快
点 评:真正的DMA 是由硬件抢占总线后同时启动两端设备,在一个周期内这边读,那边些。但很多嵌入CPU内的DMA只是模拟而已,启动每一次DMA之前要做 不少准备工作(设起始地址和长度等),在传输时往往是先读到芯片内暂存,然后再写出去,即搬一次数据需两个时钟周期,比软件来搬要快一些(不需要取指令, 没有循环跳转等额外工作),但如果一次只搬几个字节,还要做一堆准备工作,一般还涉及函数调用,效率并不高。所以这种DMA只对大数据块才适用。
四:信号完整性
现象一:这些信号都经过仿真了,绝对没问题
点 评:仿真模型不可能与实物一模一样,连不同批次加工的实物都有差别,就更别说模型
了。再说实际情况千差万别,仿真也不可能穷举所有可能,尤其是串扰。曾经 有一教训是
某单板只有特定长度的包极易丢包,最后的原因是长度域的值是0xFF,当这个数据出现在
总线上时,干扰了相邻的WE 信号,导致写不进RAM。其 它数据也会对WE 产生干扰,
但干扰在可接受的范围内,可是当8 位总线同时由0 边1时,附近的信号就招架不住了。结
论是仿真结果仅供参考,还应留有足够的余 量。
现象二:100M的数据总线应该算高频信号,至于这个时钟信号频率才8K,问题不大
点评:数据总线的值一般是由控制信号或时钟 信号的某个边沿来采样的,只要争对这个边
沿保持足够的建立时间和保持时间即可,此范围之外有干扰也罢过冲也罢都不会有多大影响
(当然过冲最好不要超过芯片 所能承受的最大电压值),但时钟信号不管频率多低(其实频
谱范围是很宽的),它的边沿才是关键的,必须保证其单调性,并且跳变时间需在一定范围
内。
现象三:既然是数字信号,边沿当然是越陡越好
点评:边沿越陡,其频谱范围就越宽,高频部分的能量就越大;频率越高的信号就越容易辐
射(如微波电台可做成手机,而长波电台很多国家都做不出来),也就越容易干扰别的信号,
而自身在导线上的传输质量却变得越差,因此能用低速芯片的尽量使用低速芯片,。
现象四:为保证干净的电源,去偶电容是多多益善
点评:总的来说去偶电容越多电源当然会更平稳,但太多了也有不利因素:浪费成本、布线
困难、上电冲击电流太大等。去偶电容的设计关键是要选对容量并且放对地方,一般的芯片
手册都有争对去偶电容的设计参考,最好按手册去做。
现象五:信号匹配真麻烦,如何才能匹配好呢?
点 评:总的原则是当信号在导线上的传输时间超过其跳变时间时,信号的反射问题才显得
重要。信号产生反射的原因是线路阻抗的不均匀造成的,匹配的目的就是为了 使驱动端、
负载端及传输线的阻抗变得接近,但能否匹配得好,与信号线在PCB 上的拓扑结构也有很
大关系,传输线上的一条分支、一个过孔、一个拐角、一个接 插件、不同位置与地线距离
的改变等都将使阻抗产生变化,而且这些因素将使反射波形变得异常复杂,很难匹配,因此
高速信号仅使用点到点的方式,尽可能地减少 过孔、拐角等问题。
五:可靠性设计
现象一:这块单板已小批量生产了,经过长时间测试没发现任何问题点评:硬件设计和芯片应 用必须符合相关规范,尤其是芯片手册中提到的所有参数(耐压、I/O 电平范围、电流、时序、温度PCB 布线、电源质量等),不能光靠试验来验证。公司有不 少产品都有过惨痛的教训,产品卖了一两年,IC厂家换了个生产线,咱们的板子就不转了,原因就是人家的芯片参数发生了点变化,但并没有超出手册的范围。如 果你以手册为准,那他怎么变化都不怕,如果参数变得超出手册范围了还可找他索赔(假如这时你的板子还能转,那你的可靠性就更牛了)。
现象二:这部分电路只要要求软件这样设计就不会有问题
点评:硬件上很多电气特性直接受软件控制,但软件是经常发生意外的,程序跑飞了之后无法预料会有什么操作。设计者应确保不论软件做什么样的操作硬件都不应在短时间内发生永久性损坏。
现象三:用户操作错误发生问题就不能怪我了
点评:要求用户严格按手册操作是没错的,但用户是人,就有犯错的时候,不能说碰错一个键就死机,插错一个插头就烧板子。所以对用户可能犯的各种错误必须加以保护。
现象四:这板子坏的原因是对端的板子出问题了,也不是我的责任点评:对于各种对外的硬件接口应有足够的兼容性,不能因为对方信号不正常,你就歇着了。它不 正常只应影响到与其有关的那部分功能,而其它功能应能正常工作,不应彻底**,甚至永久损坏,而且一旦接口恢复,你也应立即恢复正常。