了解显卡

  1. 从零开始认识显卡

硬件

  ROG Strix RTX 4080为例:

  • 供电接口:8pin接口,单个提供225w供电,高功耗可使用多个

image

  该4080提供6个供电接口:

image

  还有背插显卡,无需外接供电,需搭载特定主板和转接头使用:

image

  • 散热模组由:风扇、鳍片、热管、均热板组成

image

  热管利用汽热转换传递热量

image

  • 电路板结构,其中gpu芯片由nvdia、amd、intel三家供应

image

  AIC厂商(如华硕)完成电路板与散热的设计和生产

image

  • 视频接口,对外传输图像

image

  • PCIe接口,与主板、cpu、内存等元器件交互,如PCIe4.0单通道传输速率为2GB

image

  • 供电模块:核心PWM、电容、MOS管、现存PWM、电感组成

image

image

  • 显存的总带宽(每秒传输的数据量)由频率、位宽、倍增系数决定的

    • 频率:每秒传输多少个周期
    • 位宽:一次(周期)可以传输的数据量
    • 倍增系数:发挥多少倍性能

image

image

  • 显卡的gpu核心

  • SM流式多处理器,负责几乎所有的图形运算,例如由76颗SM计算单元,每组SM单元中由128个流处理器,共9728个流处理器(也叫做CUDA核心),【处理器个数越多、频率越高,性能越强】,若每组看成一个核心,就相当于76个核心,9728个线程的处理器,显卡核心数量决定算力。

    image

    • nvidia ada-lovelace架构,459亿颗晶体管

    image

image

image

image

image

image

  • 显卡更适合做简单的四则运算

  三角面的顶点坐标(x,y,z),用32位的二进制表示,也叫做单精度浮点数(FP32)

image

  每秒能计算的次数就是单精度浮点算力,用于衡量图形渲染的性能。

  GPU对比CPU更加适合图形渲染

image

  一个CUDA核心能支持FP32计算,也能向下兼容半精度FP16计算。

image

  gpu的效率也和设计架构有关。

image

image

image

image

image

  架构不同,性能也不同。

image

  • 单精度浮点算力和架构决定了gpu的游戏性能。

image

用于AI

  CUDA核心的旁边是第4代Tensor Core张量核心,适合做AI相关的深度学习计算,如AI绘图软件可以调用Tensor Core,生成图片的速度比纯CUDA快。

image

image

  • 主流显卡TimeSpy跑分天梯图
  • 主流AIC厂商

image

  • 显卡子型号

image

  ‍

posted @ 2024-05-19 11:16  PamShao  阅读(35)  评论(0编辑  收藏  举报