deepseek吧 关注:103,302贴子:175,473

8张A100-SXM4 80G共640G显存成功部署完整版Deepseek-R1

只看楼主收藏回复





IP属地:广东1楼2025-02-03 16:04回复
    这就是NVIDIA带给我的自信
    补充下,不爆显存最高每个回复可跑到25token/s
    由于使用ollama部署,只能吃到一张卡的性能,其他卡都在空转


    IP属地:广东2楼2025-02-03 16:06
    收起回复
      富哥v我五万零花钱,看看实力。


      IP属地:河南来自Android客户端3楼2025-02-03 17:14
      回复
        vivo4090


        IP属地:江苏来自Android客户端4楼2025-02-03 17:20
        回复
          豪无人性


          IP属地:上海来自iPhone客户端5楼2025-02-03 17:58
          回复
            只有25token很浪费啊 5W块都能7-8个TOKEN了。


            IP属地:广西6楼2025-02-03 18:01
            收起回复
              大佬


              IP属地:广西来自Android客户端7楼2025-02-03 18:07
              回复
                上下文有多长


                IP属地:安徽来自Android客户端8楼2025-02-03 23:20
                收起回复
                  卧槽富哥。


                  IP属地:四川来自Android客户端9楼2025-02-03 23:39
                  回复
                    L老百姓用不着替老黄续命了!有现成的APP用,根本没有必要部署本地


                    IP属地:北京来自Android客户端10楼2025-02-04 00:26
                    收起回复
                      卧槽,阔佬


                      IP属地:广西来自Android客户端11楼2025-02-04 01:53
                      回复
                        卧槽富哥啊,能本地部署满血AI模型来跑文字游戏有够爽。


                        IP属地:中国澳门12楼2025-02-04 02:06
                        回复
                          有nsfw限制吗?


                          IP属地:广东来自Android客户端13楼2025-02-04 04:33
                          收起回复
                            🐮


                            IP属地:广东来自Android客户端14楼2025-02-04 05:01
                            回复


                              IP属地:福建来自Android客户端15楼2025-02-04 05:25
                              回复