最后,再纠正一个错误的看法。
那就是有的人认为,图灵、ampere GPU上的RT core,需要消耗相当多的面积和晶体管,也会占用相当大的功耗。所以RDNA2引入光线加速单元,功耗发热将难以控制,导致性能提升不如预期。或者RDNA1能耗比和图灵相当,但因为图灵GPU上的RT core消耗了大量功耗,等于图灵带着电阻丝,坐着跟你打能耗比还能打成平手。
这个看法是错误的。
根据知乎Edison Chen《NVIDIA GA10X 架构深入揭秘》
https://zhuanlan.zhihu.com/p/250305204一文所述:
"有人曾经根据 TU102 和 TU106 芯片图分析,认为每个 TPC 里的 RT Core 面积大约是 0.8 平方毫米,由于每个 TPC 里包含有两个 SM,每个 SM 配备一个 RT Core,相当于每个 RT Core 面积大约是 0.4 平方毫米。
对于拥有 36 个 TPC 的 TU102 来说,RT Core 的整体面积占用低于 4%(0.8mm^2 * 36 TPC / 754mm^2),相对于完全使用着色器来做光线求交的方式而言,RT Core 能够以 4% 不到的芯片面积实现 10 倍于着色器跑光线追踪的性能(以斯坦福大学的弥勒佛模型为例,使用 DXR 进行完整渲染,TU102 12 GigaRay/s vs GP102 1.1 GigaRay/s),效费比还是非常划算的。"
推测依据为TU102的dieshot。
图灵RT core仅占整个芯片面积的4%,那么其晶体管所占数量大概率也会在4%左右,也就是7亿左右。对于现今动辄上百亿晶体管的GPU来说,这个数目实在微不足道。
另外RT core消耗的功耗可能就更低了,因为前面也说过,“RT core其实就是个目录”,在整个光线追踪流程中RTcore也不是资源占用最多的,占的最多的是FP32单元。更何况RTcore占整个芯片的晶体管比例非常低。
个人认为RTcore所占功耗不足4%。对270W的2080ti来说,也就是10W左右。
其实做一个简单的测试便可知道,使用硬件支持DXR的GPU,运行一款支持DXR的游戏,比如战地5。开启光线追踪效果,关闭追踪效果,观察其整机功耗变化。
如果没有明显的功耗变化或者剧烈波动,即可说明光线追踪加速单元对整卡功耗影响微乎其微。