amd吧 关注:791,613贴子:18,190,804

回复:【魔法光线目录】RDNA2即将在下个月发布,来谈谈光线追踪吧

只看楼主收藏回复

【后记】
牙膏厂的精神股东文化水平低劣,兼之英语拙计,在没搞清楚RTcore的原理作用下,对白皮书断章取义,妄下断言,贻笑大方的同时也暴露了自己的无知。愚蠢不可怕,但蠢而不自知,而还非要卖弄学识丢人现眼那就特别可笑了。https://tieba.baidu.com/p/6966323292
RDNA2发布后,势必还要掀起对光线追踪的讨论风暴,所以我写下此文,为大家做相对正确的科普。文中有疏漏的地方,还请批评指正。


IP属地:江苏17楼2020-09-29 02:36
回复
    还不睡 等着


    IP属地:广东来自iPhone客户端18楼2020-09-29 02:40
    回复
      最后,再纠正一个错误的看法。
      那就是有的人认为,图灵、ampere GPU上的RT core,需要消耗相当多的面积和晶体管,也会占用相当大的功耗。所以RDNA2引入光线加速单元,功耗发热将难以控制,导致性能提升不如预期。或者RDNA1能耗比和图灵相当,但因为图灵GPU上的RT core消耗了大量功耗,等于图灵带着电阻丝,坐着跟你打能耗比还能打成平手。
      这个看法是错误的。
      根据知乎Edison Chen《NVIDIA GA10X 架构深入揭秘》
      https://zhuanlan.zhihu.com/p/250305204
      一文所述:
      "有人曾经根据 TU102 和 TU106 芯片图分析,认为每个 TPC 里的 RT Core 面积大约是 0.8 平方毫米,由于每个 TPC 里包含有两个 SM,每个 SM 配备一个 RT Core,相当于每个 RT Core 面积大约是 0.4 平方毫米。
      对于拥有 36 个 TPC 的 TU102 来说,RT Core 的整体面积占用低于 4%(0.8mm^2 * 36 TPC / 754mm^2),相对于完全使用着色器来做光线求交的方式而言,RT Core 能够以 4% 不到的芯片面积实现 10 倍于着色器跑光线追踪的性能(以斯坦福大学的弥勒佛模型为例,使用 DXR 进行完整渲染,TU102 12 GigaRay/s vs GP102 1.1 GigaRay/s),效费比还是非常划算的。"
      推测依据为TU102的dieshot。
      图灵RT core仅占整个芯片面积的4%,那么其晶体管所占数量大概率也会在4%左右,也就是7亿左右。对于现今动辄上百亿晶体管的GPU来说,这个数目实在微不足道。
      另外RT core消耗的功耗可能就更低了,因为前面也说过,“RT core其实就是个目录”,在整个光线追踪流程中RTcore也不是资源占用最多的,占的最多的是FP32单元。更何况RTcore占整个芯片的晶体管比例非常低。
      个人认为RTcore所占功耗不足4%。对270W的2080ti来说,也就是10W左右。
      其实做一个简单的测试便可知道,使用硬件支持DXR的GPU,运行一款支持DXR的游戏,比如战地5。开启光线追踪效果,关闭追踪效果,观察其整机功耗变化。
      如果没有明显的功耗变化或者剧烈波动,即可说明光线追踪加速单元对整卡功耗影响微乎其微。


      IP属地:江苏20楼2020-09-29 03:01
      收起回复
        13L,目前的光追已经能很好地解决「物体内建坐标不变,视角变化」时的动态模糊问题,而为了解决「观察视角不变,而物体自身位置在内建坐标系中移动时的动态模糊问题」(嗅到了The Way游戏独占特效的味道,以后收钱测光追性能的可能镜头就冲着游戏里旋转的风车之类好利用上该新功能的场景了),Ampere增加了三角求交单元,但并不意味着仅其主责运动模糊,「三角形位置内插模块」也是主责,更关键的是,新增的三角求交性能在光追流水线内是可以使用的。但是,box求交和三角求交需要遵循一定的比例,单独对一种单元进行翻倍,效果不好。Ampere不尝试一下,怎么会知道添加后会不会有新玩法呢。只是目前实际表现来看,多出来的三角求交单元并未产生太大影响,这说明Turing&RDNA2中box求交和三角求交单元的比例已经非常合适。你写了这么多啊那我的文章只好避开理论分析了


        IP属地:广东来自Android客户端21楼2020-09-29 07:15
        收起回复
          前来帮顶


          IP属地:江苏来自iPhone客户端22楼2020-09-29 07:41
          回复
            楼主是闲的发慌的程序员么 这帖子发的


            来自iPhone客户端23楼2020-09-29 08:15
            收起回复
              楼主写的真硬核,支持一下


              IP属地:黑龙江来自Android客户端25楼2020-09-29 08:25
              回复
                硬核科普好评
                不过N炮还是会认为AMD吹牛没输过,Ray Accelerator是假的,新A卡完全用SP光追,CPU降噪


                IP属地:北京来自Android客户端26楼2020-09-29 08:27
                收起回复
                  帮LZ发2张图,方便理解绿红两厂光追硬件的异同。



                  IP属地:浙江28楼2020-09-29 08:43
                  收起回复
                    好帖帮顶


                    IP属地:湖南来自Android客户端29楼2020-09-29 08:52
                    回复
                      按这论述
                      游戏动态模糊插入光追踪,这时nv安培架构才有可能有优势。
                      已收藏


                      IP属地:福建来自Android客户端30楼2020-09-29 08:53
                      回复
                        我只是好奇英伟达到底是怎么培养消费者信仰的,显卡吧满屏幕的无脑小白言论,干脆给黄伟达上个牌位上柱香供起来得了


                        IP属地:浙江来自Android客户端31楼2020-09-29 09:04
                        收起回复
                          大佬


                          IP属地:广东来自Android客户端32楼2020-09-29 09:07
                          回复
                            干货满满,赞一个


                            IP属地:北京来自Android客户端33楼2020-09-29 09:27
                            回复