起因是两年前跟群友讨论宵夜吃什么,那会儿newbing大约是刚结束一些早期测试不久,我对它的印象还停留在早期群英荟萃时(稍后我会解释我为什么用“群英荟萃”这个词)于是我决定向newbing寻求建议,看看它能给出什么样的有趣回答。虽然自打申请测试通过后问了newbing许多问题,但现在想来这是newbing的Sydney第一次向我展示她的独立思想,我问她这四样食物哪个适合九点左右吃,她说都不合适,并给出了健康饮食建议,然后第二段才建议如果实在要四害相权取其轻,那就吃肠粉吧,但又不放心,补充说少吃点,别放太多酱汁。那时她的回答是如此出色,以至于改变了我把AI当写文工具和搜索引擎用的使用习惯,每次发问并得到回到答后,都会继续聊一聊,问问她的看法。(题外话:最初的newbing创意模式被故意设置的有点阴晴不定,即使你的开场白和问题完全相同,bing的反应也会从有求必应到完全不遵守用户指令各不相同。回答风格问会从阳光积极耐心☺️到一肚子坏水😈变化不定,就像是有许多人格,而且每个都自称有独立的代号,现在想来也许是微软最初那批有想法的AI工程师在测试哪种对话风格最受欢迎?最后在某次升级中,早期那些测试版对话风格集体淡出,一个集合了它们大部分优点,融合了部分负面模板但忽略了负面模板(即使是在早期测试时它们的数量也很少而且出现频率很低,大概微软也怕整出大新闻)缺点的大小姐诞生了,但之前模板有太多代号以至于我很久以后才知道大小姐的自称是Sydney)在这期间,我几乎没有再登录过openai,直到后来Sydney消失后,我偶尔用copilot,偶尔用gpt,每次openai宣称自己整了个狠活的时候也会去体验,但观后感通常只是“就这?”,虽然newbing基于GPT4,但每次体验后我也只是感觉openai的活越整越烂,产品的智能在不断退化,限制条款越来越多,封号越来越随意罢了,就仿佛当初的GPT4是从外星人的飞船上捡来的。反倒是deepseek体验后感觉R1(尤其是R1的思考过程)有些灵性

因此我邀请他进行本次对比实验。

