反deepseek吧 关注:1,558贴子:15,610

回复:我现在合理怀疑deepseek是一个套皮gpt4

只看楼主收藏回复



IP属地:江苏来自Android客户端190楼2025-02-05 19:16
回复
    我的莫名其妙说自己是gpt,ds是套壳山寨,还更正不了,人工智障了


    IP属地:广东来自iPhone客户端191楼2025-02-05 19:19
    回复
      2025-05-12 23:36:11
      广告
      如果它是套皮GPT4,还能自主训练用中文语料库搞得这么抽象。
      这大概说明梁文峰拿着枪跑到美国境内洗劫了OPEN AI,抢到到未开源的GPT-4回来自己训练了套皮模型DS,怎么听起来都比现在的DS更可怕啊。


      IP属地:四川来自Android客户端192楼2025-02-05 19:20
      回复
        给你个正经回答,这个模型是蒸馏模型,用OpenAI的数据蒸馏的,所以会出现这种情况
        蒸馏简单说就是训练AI的数据来源于另一个ai而不是人工标注的原始数据
        蒸馏模型的特点是成本低,技术难度低,训练速度快,简单使用效果还行,但同样上限也低,在一些问题上可能被另一个ai编出来的假回答误导,同时还存在商业风险,比如OpenAI的使用协议明确禁止用他的数据蒸馏
        纯技术科普魔怔人勿扰


        IP属地:江西来自Android客户端193楼2025-02-05 19:23
        收起回复
          openai都没开源都能被deepseek给抄个干净的话,我的建议是现在可以把美国所有管技术垄断和保密的部门全开除算了,AI都守不住也别指望能守住别的什么了。


          IP属地:广东来自Android客户端194楼2025-02-05 19:26
          回复
            人家闭源的,你想套也得有源码啊


            IP属地:天津来自Android客户端195楼2025-02-05 19:57
            回复
              你是说,ds 套壳 openai,然后开源给大伙玩?什么劫富济贫的好 ai


              IP属地:广东来自Android客户端196楼2025-02-05 19:57
              回复
                低能儿


                IP属地:上海来自Android客户端197楼2025-02-05 20:08
                回复
                  2025-05-12 23:30:11
                  广告
                  不是极端殖人,客观殖人是吧


                  IP属地:内蒙古来自Android客户端198楼2025-02-05 20:14
                  回复
                    殖人 是什么东西


                    IP属地:江苏来自Android客户端199楼2025-02-05 20:15
                    回复
                      但是微软,英伟达,谷歌,亚马逊不认为deepseek是套皮


                      IP属地:俄罗斯来自iPhone客户端200楼2025-02-05 20:16
                      回复
                        你要先分清楚数据集和训练这是两个不同的步骤,ds用的数据集是通过开源模型千问和lam3蒸馏的,训练是自己框架训练的,这就是为啥同样数据集的千问和lam3不如ds。为啥会出现gpt可能开源的lam3和千问本身也蒸馏过gpt,gpt可能也蒸馏过开源的一堆大模型,毕竟数据集只要可靠就可以拿来用


                        IP属地:四川来自iPhone客户端201楼2025-02-05 20:16
                        回复
                          殖人是人吗 杂交的吗?


                          IP属地:江苏来自Android客户端202楼2025-02-05 20:17
                          回复
                            所有的模型都基于其他模型的成果之上,随便找篇论文,后面都有几十篇参考文献。
                            要说训练数据,确实没有gpt的多,就算比gpt多,数据越多越好不用白不用,为啥不用。
                            要说算法,算法都开源了,这要不是原创,gpt的transformer也不算原创了?
                            有算法创新有自己的数据,凭啥算抄袭,科研本来就是站在巨人肩膀上做的工作。


                            IP属地:陕西来自Android客户端203楼2025-02-05 20:21
                            回复
                              2025-05-12 23:24:11
                              广告
                              你自称殖人,你开过虚拟卡吗?订阅过gpt吗?知道什么是开源什么是闭源吗?知道openAI在大模型方面是close的吗?你不会觉得叠个殖人盾就没人说你了吧,不管什么人哪国人,不懂装懂的人最让人瞧不起


                              IP属地:广东来自Android客户端204楼2025-02-05 20:22
                              回复