DeepSeek【江源吧】

江源吧关注：31,914贴子：433,702

1回复贴，共1页

DeepSeek

DeepSeek
DeepSeek（深度求索）是一家专注于开发先进大语言模型和相关技术的创新型科技公司。它由幻方量化创立，成立于2023年7月17日，注册资本为1000万元，注册地位于浙江省杭州市拱墅区。DeepSeek的法定代表人是裴湉，企业类型为其他有限责任公司，所属行业为研究和试验发展。

DeepSeek成立于2023年7月17日，由知名量化资管巨头幻方量化创立。DeepSeek是一家创新型科技公司，长久以来专注于开发先进的大语言模型（LLM）和相关技术，作为大厂外唯一一家储备万张A100芯片的公司，幻方量化为DeepSeek的技术研发提供了强大的硬件支持。
2023年8月2日，注册资本变更为1000万元，章程备案，投资人变更为宁波程恩企业管理咨询合伙企业，市场主体类型变更为其他有限责任公司。
2024年9月5日，DeepSeek官方更新API支持文档，宣布合并DeepSeek Coder V2和DeepSeek V2 Chat两个模型，升级推出全新的DeepSeek V2.5新模型。官方表示为向前兼容，API用户通过deepseek-coder或deepseek-chat均可以访问新的模型。
2024年12 月，一份关于DeepSeek发布历程、优化方向的专家会议纪要文件在业内流传。对此，DeepSeek回应称，公司未授权任何人员参与券商投资者交流会，所谓“DeepSeek专家”非公司人员，所交流信息不实。DeepSeek表示，公司内部制定有严格的规章制度，明令禁止员工接受外部访谈、参与投资者交流等市场上各类面向投资者的机构信息交流会。相关事项均以公开披露信息为准。 [1]
DeepSeek的核心产品包括DeepSeek LLM、DeepSeek-V2、DeepSeek-V3、DeepSeek Coder、DeepSeek Math、DeepSeek-VL和DeepSeek-VL2等模型。这些模型不仅完全开源，还支持商用，提供了多种接入方式，如AI对话、API接口和模型下载，方便用户快速集成和使用。
DeepSeek的技术特点在于其高效的训练和推理能力。例如，DeepSeek-V2的推理成本仅为每百万token 1元人民币，相比其他大模型显著降低了成本。此外，DeepSeek在模型架构上进行了创新，提出了新的多头潜在注意力机制（MLA）和混合专家结构（MoESparse），大幅降低了显存占用和计算量。
DeepSeek在业界引起了广泛关注，尤其是在大模型价格战中，其低成本的模型策略使得其他大厂纷纷降价。DeepSeek V3在国内外引起了轰动，尽管训练成本仅为60万美元，但其性能几乎追上了Claude 3.5 Sonnet和GPT-4。这些成就使得DeepSeek成为AI领域不可忽视的力量。[2]
Deepseek V3 在国内外引起了轰动，一些美国学者称它能将ChatGPT 超越。
一般项目：工程和技术研究和试验发展；技术服务、技术开发、技术咨询、技术交流、技术转让、技术推广；软件开发；计算机系统服务；信息系统集成服务；人工智能应用软件开发；信息技术咨询服务；电子产品销售；通讯设备销售；仪器仪表销售；数据处理服务；互联网数据服务；计算机软硬件及辅助设备零售；人工智能硬件销售；专业设计服务（除依法须经批准的项目外，凭营业执照依法自主开展经营活动）。 [1]
2024年12月，DeepSeek开源大模型DeepSeek-V2的关键开发者之一罗福莉将加入小米，或供职于小米AI实验室，领导小米大模型团队。[3]

送TA礼物

IP属地:吉林

1楼2025-02-24 16:19回复

这东西厉害了👍

IP属地:吉林

来自Android客户端2楼2025-02-25 12:12

扫二维码下载贴吧客户端

下载贴吧APP
看高清直播、视频！

贴吧热议榜

1回复贴，共1页

<返回江源吧

发表回复

发贴请遵守贴吧协议及“七条底线”贴吧投诉

内容:

使用签名档查看全部

发表

保存至快速回贴

日	一	二	三	四	五	六

DeepSeek

登录百度账号

扫二维码下载贴吧客户端