一、背景
新年伊始,美股迎来了势如山崩的“DeepSeek之夜”!2025年1月27日,中国本土人工智能企业DeepSeek公司的爆火引发了美国人工智能界的恐慌,在芯片巨头股价的暴跌拖累下,整个美股大盘也一泻千里,纳指下跌3.1%,标普500指数也跌幅超1.5%。受到影响最大的莫过于芯片龙头英伟达,其市值一夜之间蒸发近6000亿美元(约4.2万亿元人民币),这个损失甚至高于腾讯控股目前的总市值(约3.4万亿元)。
二、DeepSeek公司简介
DeepSeek是杭州深度求索人工智能基础技术研究有限公司的简称,正式名称为“深度求索”,成立于2023年7月,位于浙江省杭州市,注册资本1000万人民币。该公司是由国内量化巨头幻方量化旗下的子公司,专注于研究世界领先的通用人工智能底层模型与技术,挑战人工智能前沿性难题。其创始人梁文锋曾明确表示DeepSeek的V2模型开发团队没有任何海外归来人员,所有成员均是本土的。
三、DeepSeek的技术突破
DeepSeek公司打破了西方人工智发展能的“刻板印象”,其R1模型在第三方测试中,表现全部优于美国一众头部模型。英伟达在股价暴跌后于美国当地时间1月27日发表声明称,恭喜DeepSeek公司“取得了一项出色的AI突破”,“DeepSeek的模型也是测试时间扩展的完美范例。当前受美国制裁影响,中国公司无法使用高端芯片,在算力资源上处于劣势。然而,就是在这种情况下,DeepSeek仍然能够开发出领先模型,一定程度上说明当前AI大模型所需的算力资源被高估了。
举个说明:此前被认为需要1万块顶级GPU才能开发的产品,而现在100块“阉割版”GPU也能实现。这就是DeepSeek的功劳!DeepSeek火爆的核心理由主要是其卓越的技术实力与显著的成本优势。
DeepSeek发布的模型在性能上表现出色,能够媲美甚至超越行业巨头的产品,这是其获得广泛关注的基础。同时,DeepSeek以极低的成本实现了高性能,这种低成本创新模式打破了行业惯例,使得更多用户能够享受到先进的AI技术。这种高性价比的特点,使得DeepSeek在市场上具有强大的竞争力,从而赢得了广泛的关注和认可。
四、DeepSeek爆火的主要原因
DeepSeek之所以如此火爆,主要归因于以下几个关键因素:
①技术突破与性能卓越。DeepSeek发布的模型,如R1,在性能上表现出色,与OpenAI的模型不相上下,甚至在某些方面有所超越。这些模型在专业大模型排名中位居前列,展现了其强大的技术实力。
②成本优势显著。DeepSeek以极低的成本实现了与行业巨头相媲美的性能。例如,V3模型仅用较少的投入就达到了与OpenAI几亿美元投入相匹敌的效果,这种低成本创新模式挑战了行业共识,也吸引了大量用户的关注。
③开源与创新。DeepSeek团队将模型训练中的技术创新全部公开,促进了技术社区之间的深入交流与协同创新。这种开源精神不仅提升了DeepSeek的知名度,也吸引了更多开发者加入到DeepSeek的生态系统中来。
④媒体关注与报道。主流媒体对DeepSeek的成功进行了广泛报道,这些报道不仅提升了DeepSeek的知名度,也引发了公众对其技术突破的关注。
⑤市场影响与用户需求。DeepSeek的成功满足了市场对高性能、低成本AI模型的需求,同时也推动了AI技术的普及和应用。其出色的表现也引发了投资者和创业者的关注。
五、结语
DeepSeek凭借卓越的技术实力、显著的成本优势、开源的创新精神以及媒体和市场的广泛关注而火爆全球。特朗普政府的“星际之门”计划刚刚宣布就遭遇超乎寻常的重大打击,孙正义旗下的软银集团股价也重挫10%。DeepSeek为其他科技公司提供了新的选择,即在有限条件下,是可以通过技术优化而非大量购买芯片进行AI研发的。这样大家都能理解美国科技股全线暴跌,英伟达一夜之间跌掉6000亿美元市值了!但愿中国的科技自立自强之路越走越宽,涌现出更多的本土科技独角兽企业!