40HX P102 P104简单对比【p106吧】

p106吧关注：27,446贴子：255,949

61回复贴，共1页

40HX P102 P104简单对比

最近感觉P104SD跑图实在太慢，于是下单40HX和P102，收到几天了，基本了解这两张卡的情况，和我手里的P104做个对比：
一、关于40HX部分：
1. PCI-E带宽：补电容后PCI-E 1.1 x16带宽等同3.0x4 游戏水平与2060相当，但因为输出延迟不适合网游。优化好的单机大作可以2K高画质60帧：古墓丽影，地平线5等。1080P 2077可以跑60多帧，其余3A基本可跑1080P画质拉满60帧。
2. SD跑图相关半精度FP16：基本全被砍没，AI画图显存占用大，并且目前SD模型多是基于FP16，所以40HX效率较差和出图结果与使用FP16有些许差别。
以下优化感谢4tzR23大佬的帖子。
40HX基于目前测试结果，SD1.5目前我测试的最佳跑图设置：
设置方法就是修改源码及加参数--no-half --no-half-vae（如果使用lora和controlnet较多时还需要加--medvram），目的是关闭半精度设置以单精度为主的混合精度模式，载入显存模型是fp16，但计算以fp32为主。在SD根目录下modules\devices.py的最后一行，将return torch.autocast("cuda")改为torch.autocast("cuda", dtype=torch.float32, enabled=True)，这样启动显存占用减半。
下面是N卡工作模式的相关资料，感谢星光2213大佬的帖子。
Nvidia显卡有两种工作模式：
TCC：Tesla 计算集群（Tesla Compute Cluster，简称 TCC）模式
WDDM：Windows 图形驱动模式（Windows Display Driver Model，简称 WDDM）模式。
两种模式有不同的适用场景
TCC：该模式下，GPU 完全用于计算，不能作为本地显示输出。
WDDM：该模式下，GPU 既用于计算又用于本地显示输出。
TCC模式适合运算，如AI跑图，WDDM模式适合玩游戏。
TCC模式与WDDM模式切换的具体操作方法如下：
按WIN+R打开运行，然后输入 cmd 打开命令行（必须是管理员身份打开才行，不然会提示无权限）然后输入 nvidia-smi 回车来查看你的显卡，显卡名字的前面会有0 和 1 来代表CUDA id。
假设CUDA id=0
切换至 WDDM 模式命令：nvidia-smi -dm 0 -i 0
切换至TCC模式命令：nvidia-smi -dm 1 -i 0
成功后需要重新启动电脑，重启后显卡的模式就改变了，这样操作可以不重装驱动来改变显卡的用途。
3. 光追与DLSS：
砍废了，开了DLSS帧数反而会下降，估计和单精度被砍正相关。
4. VBIOS问题：
VBIOS锁电压，无法使用小飞机这类软件降压降频操作。
5. 视频编解码：
没有这方面应用，没测试视频编解码能力，据说完整保留没被砍。
二、40HX P102 P104这三张卡SD跑图对比：
在同模型，同参数，pytorch以及xformers等版本均一致的前提下：
以P104为基准的话，40HX的出图效率，FP16模型高20%左右，FP32模型高30%左右。P102不论FP16/FP32都比P104快40-50%。另外由于P104/P102可以用FP16，显存占用明显更低。40HX打开SD使用模型首次画图，时间会非常久，后续画图正常，我猜测大概是需要将模型相关FP16数据转换为FP32载入显存，转换极为耗时。
三、最后关于价格：
40HX是330+包邮购于某多，PCB显示21年4月生产。考虑到半精度，光追，DLSS的被砍问题，40HX就是一个矿龄较短的P106+P104的结合体。如果有意玩1080P下的3A游戏，并且随便跑跑SD，补好电容300以内的40HX是可以考虑的。
P102是270+包邮购于某宝，PCB显示18年3月生产。之前188到付的车没赶上，270是给换好散热器保3个月（就是188车给加了类似技嘉Eagle 3050的前盖加风扇的半组散热器），3DMark通过率还不错，可以达到99.1%，实际比之前188的车贵几十块。这卡可以降压降频，单纯跑AI还可以，PCI-Ex4 1.1带宽太小，毕竟是18年生产的老矿渣，听说P102翻车率较高，其他用途就不建议了。
欢迎各位大佬指正和补充。

送TA礼物

IP属地:天津

1楼2023-08-10 14:58回复

不能修改，就重发一下吧

IP属地:天津

来自Android客户端2楼2023-08-10 14:59

玩AI 可以试试某宝上 599的 Tesla M40 24G

IP属地:贵州

3楼2023-08-10 15:07

收起回复

前几天多多有十几张200的车，秒光，不知道是不是188那种车。

IP属地:广东

来自手机贴吧4楼2023-08-10 16:53

收起回复

视频编解码，是你说的这三块卡都被没有被砍，还是40HX没有被砍，打算买一张。因为我现在用的是P106，感觉是被砍了，软件用的是剪映，视频导出的时候显卡没有调用，但是用SD，玩游戏都是可以正常调用

IP属地:广东

5楼2023-08-10 17:53

收起回复

102是啥呀？ga102？

IP属地:河南

来自iPhone客户端7楼2023-08-11 03:34

收起回复

n家专用矿卡的半精度都被砍的稀烂你买来画图只能说类似于用烂锄头种地

IP属地:天津

来自Android客户端9楼2023-08-11 10:44

收起回复

老哥用的什么AI软件啊

IP属地:河南

来自iPhone客户端10楼2023-08-12 01:50

收起回复

马

IP属地:江苏

11楼2023-08-25 11:00

pr视频导出，实测40hx视频编码器正常

IP属地:广东

来自Android客户端14楼2023-09-09 00:27

收起回复

102和104与40hx没有可比性

IP属地:山东

来自Android客户端16楼2024-04-22 11:06

收起回复

104能不能2张并行练丹呢

IP属地:陕西

来自Android客户端17楼2024-06-20 14:44

收起回复

马克

IP属地:广西

来自iPhone客户端18楼2025-01-01 10:36

40HX小飞机不能调电压，有没有破解方法？400入的，2060s的性能，3a基本中特效通吃，还是蛮香的，就是功耗大了点，拉电压估计可以降底30W的功耗，可惜试过所有的超频软件都不能降低电压。

IP属地:福建

19楼2025-03-28 09:28

收起回复

好像屯不住了，零售破400关口了，见于答辩价格的50系，准备上个40hx继续等。

IP属地:广西

来自Android客户端20楼2025-03-28 17:20

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

61回复贴，共1页

<返回p106吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

40HX P102 P104简单对比

登录百度账号

扫二维码下载贴吧客户端