GPU结构略知
第一代GPU结构,GeForce6800
第二代GPU结构GeForce8800
16个流多处理器(SM)
每个SM中包含了8个流处理器SP
每个SP包含一个乘加单元
每个SM管理了24个线程簇(warp),共有768个线程
采用单线程多数据(Single-thread, Multiple-data)技术
每个周期在8个SP上并行执行一个线程簇
GF8800的存储层次:
GPU应用:
对多个数据进行同一种运算(STMD适用)
一次存储器访问,多次运算(外部DDR访问开销高,局部存储器容量较小)
浮点计算比例高(特别是单精度浮点)
典型计算:物理模拟,线性代数计算
应用领域:
计算生物学,图像处理