第一个知识点:不同类型的处理器
密码学52件事
第一个知识点:不同类型的处理器
原文地址:http://bristolcrypto.blogspot.com/2014/10/52-things-number-1-different-types-of.html
这是每个密码学博士生应该知道的52件事系列的第一篇文章。PhD研究生在第一年结束的时候应该掌握这些问题。并且尽可能早的在他们能放弃的时候放弃(23333)无论怎样,我们会将这些问题在接下来的一年里表达出来,我自愿的为这个第一个事情的编写做出贡献。这个第一个主题就是计算机架构,它被表达成下面的问题:
下面这些有什么不同?
- 一个通用的处理器
- 一个通用的带指令集扩展的处理器
- 一个专用的处理器(协处理器)
- 一个FPGA
没有一个严格的通用处理器的定义,然而,一般认为如果处理器是图灵完备的那么就是通用处理器。这个包括了所有能完成计算可计算任务的处理器。(例如,能够计算所有图灵机能计算的)。我不会仔细研究图灵机的定义,但是如果现在你已经不理解我说什么了,那么我推荐你看Theory of Computation
[1]这本书。注意尽管这个没有性能和指令能力集的概念,事实上,一些研究者已经证明了你只需要一个指令就可以完成图灵完备[2]。在如今的现代处理器下,大多数可编程的CPU
都被认为是通用的。
把一个CPU
设计成通用的会导致性能的开销。一个通用处理器可能计算任何可计算的任务,但是它处理重复复杂的任务的性能将不会很好。处理器设计者会基于最小架构包括扩展指令集来完成那些经常被各种各样的应用使用的任务。虽然功能上被扩展过的架构和最小架构没什么不同,但是实际上在终端用户看来有着巨大的性能差异。
既然我们都为密码学工作,那么我集中在一个使用扩展指令的密码学例子。考虑一个使用AES
加密的桌面应用机器。任何来自其他储存设备的读取都需要在被缓存之前给一个CPU
中断来完成内容的解密。磁盘获取时刻miss cache
已经很糟糕了,同时还要加上解密的时间,我们就不得不重新考虑磁盘加密了。我们很清楚AES
是我们复杂的重复任务同时我们只有一个没有指令集扩展的通用CPU
,我们只能用流操作实现解密。Intel
和AMD
都意识到磁盘加密的需求,为了减少其他存储器获得数据使用AES
的开销,在桌面CPU
的流水线上设计了AES-NI x86
扩展指令集来加速加密磁盘。
如果你想急速所有的计算,最优化的方法就是使用一个专用的处理器或者一个专用集成电路。但是这样我们就为了性能失去了通用处理器的灵活性。这种处理器通常和通用处理器是紧密耦合的,用术语就是协处理器(co-processor)。注意,一个协处理器可能和通用处理器有相同的包,但是不必集成通用处理器的架构。也就是说,我们看看现在的处理器架构,Intel
和AMD
早已集成了声卡,显卡和数字信号处理器到它们的CPU
。这个额外的功能通过专用寄存器呈现出来,同时协处理器变成一个分离的被通用处理器管理的组件。
最终我们看看FPGA(Field-Programmable Gate Arrays)
。这个数字集成电路(ASIC)和通用处理器的中间产品。如果一个应用需要高性能同时需要不频繁的修改,那么FPGA
可能是最好的选择。为了理解FPGA
,想象一下成千上万个电路接线板和成千上万的逻辑门和查找表(复用器表示内存)放在电路接线板上。如果你把一个应用描述成一组逻辑门和时序约束,那么你能把他们放在电路板上,然后生成一个电路来计算你的应用。一个FPGA
支持重新编程的灵活性。这个和通用处理器主要区别就是你怎样设计和实现你的应用。为了充分利用硬件,你必须使用硬件描述语言(Verilog or VHDL)把应用描述成一组硬件组件和事务。这个过程将会频繁的使用在通用和专用处理器原型机生产之前。然而,这并不是没有缺点。设计一个有着底层构建的程序将会使得其十分笨重。同时,能源消耗和硬件花费要比嵌入集成电路的通用处理器要高。近来,FPGA
厂家Xilinx
已经开始把带有ARM
的FPGA
通用处理器集成到一个包中。这个会让FPGA
能够被ARM
核心使用,把它当做一个灵活的协处理器。结果,你能够构建专用逻辑去计算你的密码操作急速你的密码应用。
总结一下,通用处理器能计算所有可计算的事务。相似的,带扩展指令集的通用处理器也能,并且它可能在特殊的应用上做的更好。一个专用处理器(协处理器)也能在特定的任务上非常快但是只能计算特定的任务。一个FPGA
可能被用于构建上面的硬件但是相对于ASIC
为了灵活性牺牲了性能。
[1]http://www.amazon.co.uk/Introduction-Theory-Computation-Michael-Sipser/dp/0619217642
[2]http://www.cl.cam.ac.uk/~sd601/papers/mov.pdf
[3]http://www.xilinx.com/products/zynq-7000/extensible-virtual-platform.htm