江源吧 关注:31,914贴子:433,702
  • 1回复贴,共1
DeepSeek
DeepSeek(深度求索)是一家专注于开发先进大语言模型和相关技术的创新型科技公司。它由幻方量化创立,成立于2023年7月17日,注册资本为1000万元,注册地位于浙江省杭州市拱墅区。DeepSeek的法定代表人是裴湉,企业类型为其他有限责任公司,所属行业为研究和试验发展。

DeepSeek成立于2023年7月17日,由知名量化资管巨头幻方量化创立。DeepSeek是一家创新型科技公司,长久以来专注于开发先进的大语言模型(LLM)和相关技术,作为大厂外唯一一家储备万张A100芯片的公司,幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
2023年8月2日,注册资本变更为1000万元,章程备案,投资人变更为宁波程恩企业管理咨询合伙企业,市场主体类型变更为其他有限责任公司。
2024年9月5日,DeepSeek官方更新API支持文档,宣布合并DeepSeek Coder V2和DeepSeek V2 Chat两个模型,升级推出全新的DeepSeek V2.5新模型。官方表示为向前兼容,API用户通过deepseek-coder或deepseek-chat均可以访问新的模型。
2024年12 月,一份关于DeepSeek发布历程、优化方向的专家会议纪要文件在业内流传。对此,DeepSeek回应称,公司未授权任何人员参与券商投资者交流会,所谓“DeepSeek专家”非公司人员,所交流信息不实。DeepSeek表示,公司内部制定有严格的规章制度,明令禁止员工接受外部访谈、参与投资者交流等市场上各类面向投资者的机构信息交流会。相关事项均以公开披露信息为准。 [1]
DeepSeek的核心产品包括DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek Coder、DeepSeek Math、DeepSeek-VL和DeepSeek-VL2等模型。这些模型不仅完全开源,还支持商用,提供了多种接入方式,如AI对话、API接口和模型下载,方便用户快速集成和使用。
DeepSeek的技术特点在于其高效的训练和推理能力。例如,DeepSeek-V2的推理成本仅为每百万token 1元人民币,相比其他大模型显著降低了成本。此外,DeepSeek在模型架构上进行了创新,提出了新的多头潜在注意力机制(MLA)和混合专家结构(MoESparse),大幅降低了显存占用和计算量。
DeepSeek在业界引起了广泛关注,尤其是在大模型价格战中,其低成本的模型策略使得其他大厂纷纷降价。DeepSeek V3在国内外引起了轰动,尽管训练成本仅为60万美元,但其性能几乎追上了Claude 3.5 Sonnet和GPT-4。这些成就使得DeepSeek成为AI领域不可忽视的力量。[2]
Deepseek V3 在国内外引起了轰动,一些美国学者称它能将ChatGPT 超越。
一般项目:工程和技术研究和试验发展;技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广;软件开发;计算机系统服务;信息系统集成服务;人工智能应用软件开发;信息技术咨询服务;电子产品销售;通讯设备销售;仪器仪表销售;数据处理服务;互联网数据服务;计算机软硬件及辅助设备零售;人工智能硬件销售;专业设计服务(除依法须经批准的项目外,凭营业执照依法自主开展经营活动)。 [1]
2024年12月,DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米,或供职于小米AI实验室,领导小米大模型团队。[3]


IP属地:吉林1楼2025-02-24 16:19回复
    这东西厉害了👍


    IP属地:吉林来自Android客户端2楼2025-02-25 12:12
    回复