根据Ampere的改进 个人有个大胆的预测 Hopper的游戏卡 会是在Ampere的SM基础上 再加一组固定FP32(以及控制的LT/SD)! (对应的 每个SM应该是需要192KB L1 Data cache/shared memory 了 缓存面积继续大增。。。)
这样可以完美契合NV那张对int32需求的图 对Int32需求最高时 也就是自由那组都输出int 达成2:1 ;而需求最低时 可以3倍与原Turing架构SM输出FP32!
这么一来 个人对下代旗舰的预测就是这样了
我预言 GH102 8GPC 每个12SM 标称跑2030Mhz时 CUDA core总算力可以高达 8x12x2x2(64x3)=75T 浮点! 继续飞跃式提升!
Tensor Core和RT core就没啥可预测了 最好继续翻倍 100%难的话 50%也可以接受。。。
@wxwx99 试问6FF下 GH102是否可以做到?