p106吧 关注:27,446贴子:255,949
  • 61回复贴,共1

40HX P102 P104简单对比

只看楼主收藏回复

最近感觉P104SD跑图实在太慢,于是下单40HX和P102,收到几天了,基本了解这两张卡的情况,和我手里的P104做个对比:
一、关于40HX部分:
1. PCI-E带宽:补电容后PCI-E 1.1 x16带宽等同3.0x4 游戏水平与2060相当,但因为输出延迟不适合网游。优化好的单机大作可以2K高画质60帧:古墓丽影,地平线5等。1080P 2077可以跑60多帧,其余3A基本可跑1080P画质拉满60帧。
2. SD跑图相关半精度FP16:基本全被砍没,AI画图显存占用大,并且目前SD模型多是基于FP16,所以40HX效率较差和出图结果与使用FP16有些许差别。
以下优化感谢4tzR23大佬的帖子。
40HX基于目前测试结果,SD1.5目前我测试的最佳跑图设置:
设置方法就是修改源码及加参数--no-half --no-half-vae(如果使用lora和controlnet较多时还需要加--medvram),目的是关闭半精度设置以单精度为主的混合精度模式,载入显存模型是fp16,但计算以fp32为主。在SD根目录下modules\devices.py的最后一行,将return torch.autocast("cuda")改为torch.autocast("cuda", dtype=torch.float32, enabled=True),这样启动显存占用减半。
下面是N卡工作模式的相关资料,感谢星光2213大佬的帖子。
Nvidia显卡有两种工作模式:
TCC:Tesla 计算集群(Tesla Compute Cluster,简称 TCC)模式
WDDM:Windows 图形驱动模式(Windows Display Driver Model,简称 WDDM)模式。
两种模式有不同的适用场景
TCC:该模式下,GPU 完全用于计算,不能作为本地显示输出。
WDDM:该模式下,GPU 既用于计算又用于本地显示输出。
TCC模式适合运算,如AI跑图,WDDM模式适合玩游戏。
TCC模式与WDDM模式切换的具体操作方法如下:
按WIN+R打开运行,然后输入 cmd 打开命令行(必须是管理员身份打开才行,不然会提示无权限)然后输入 nvidia-smi 回车来查看你的显卡,显卡名字的前面会有0 和 1 来代表CUDA id。
假设CUDA id=0
切换至 WDDM 模式命令:nvidia-smi -dm 0 -i 0
切换至TCC模式命令:nvidia-smi -dm 1 -i 0
成功后需要重新启动电脑,重启后显卡的模式就改变了,这样操作可以不重装驱动来改变显卡的用途。
3. 光追与DLSS:
砍废了,开了DLSS帧数反而会下降,估计和单精度被砍正相关。
4. VBIOS问题:
VBIOS锁电压,无法使用小飞机这类软件降压降频操作。
5. 视频编解码:
没有这方面应用,没测试视频编解码能力,据说完整保留没被砍。
二、40HX P102 P104这三张卡SD跑图对比:
在同模型,同参数,pytorch以及xformers等版本均一致的前提下:
以P104为基准的话,40HX的出图效率,FP16模型高20%左右,FP32模型高30%左右。P102不论FP16/FP32都比P104快40-50%。另外由于P104/P102可以用FP16,显存占用明显更低。40HX打开SD使用模型首次画图,时间会非常久,后续画图正常,我猜测大概是需要将模型相关FP16数据转换为FP32载入显存,转换极为耗时。
三、最后关于价格:
40HX是330+包邮购于某多,PCB显示21年4月生产。考虑到半精度,光追,DLSS的被砍问题,40HX就是一个矿龄较短的P106+P104的结合体。如果有意玩1080P下的3A游戏,并且随便跑跑SD,补好电容300以内的40HX是可以考虑的。
P102是270+包邮购于某宝,PCB显示18年3月生产。之前188到付的车没赶上,270是给换好散热器保3个月(就是188车给加了类似技嘉Eagle 3050的前盖加风扇的半组散热器),3DMark通过率还不错,可以达到99.1%,实际比之前188的车贵几十块。这卡可以降压降频,单纯跑AI还可以,PCI-Ex4 1.1带宽太小,毕竟是18年生产的老矿渣,听说P102翻车率较高,其他用途就不建议了。
欢迎各位大佬指正和补充。


IP属地:天津1楼2023-08-10 14:58回复
    不能修改,就重发一下吧


    IP属地:天津来自Android客户端2楼2023-08-10 14:59
    回复
      玩AI 可以试试 某宝上 599的 Tesla M40 24G


      IP属地:贵州3楼2023-08-10 15:07
      收起回复
        前几天多多有十几张200的车,秒光,不知道是不是188那种车。


        IP属地:广东来自手机贴吧4楼2023-08-10 16:53
        收起回复
          视频编解码,是你说的这三块卡都被没有被砍,还是40HX没有被砍,打算买一张。因为我现在用的是P106,感觉是被砍了,软件用的是剪映,视频导出的时候显卡没有调用,但是用SD,玩游戏都是可以正常调用


          IP属地:广东5楼2023-08-10 17:53
          收起回复
            102是啥呀?ga102?


            IP属地:河南来自iPhone客户端7楼2023-08-11 03:34
            收起回复
              n家专用矿卡的半精度都被砍的稀烂 你买来画图只能说类似于用烂锄头种地


              IP属地:天津来自Android客户端9楼2023-08-11 10:44
              收起回复
                老哥用的什么AI软件啊


                IP属地:河南来自iPhone客户端10楼2023-08-12 01:50
                收起回复


                  IP属地:江苏11楼2023-08-25 11:00
                  回复
                    pr视频导出,实测40hx视频编码器正常


                    IP属地:广东来自Android客户端14楼2023-09-09 00:27
                    收起回复
                      102和104与40hx没有可比性


                      IP属地:山东来自Android客户端16楼2024-04-22 11:06
                      收起回复
                        104能不能2张并行练丹呢


                        IP属地:陕西来自Android客户端17楼2024-06-20 14:44
                        收起回复
                          马克


                          IP属地:广西来自iPhone客户端18楼2025-01-01 10:36
                          回复
                            40HX小飞机不能调电压,有没有破解方法?400入的,2060s的性能,3a基本中特效通吃,还是蛮香的,就是功耗大了点,拉电压估计可以降底30W的功耗,可惜试过所有的超频软件都不能降低电压。


                            IP属地:福建19楼2025-03-28 09:28
                            收起回复
                              好像屯不住了,零售破400关口了,见于答辩价格的50系,准备上个40hx继续等。


                              IP属地:广西来自Android客户端20楼2025-03-28 17:20
                              回复