DeepSeek 是“深度求索” 开发的一系列人工智能模型。DeepSeek 通过持续的技术创新 和市场拓展,
在自然语言处理和大型语言模型方面取得了显著进展,在国际市场上获得了 广泛认可。
其中: ● DeepSeek-V3 是在14.8万亿高质量 token 上完成预训练的一个强大的混合专家 (MoE) 语言模型,
拥有6710亿参数(激活参数370亿)。作为通用大语言模型,其在在知识类任 务(知识问答、内容生成等)领域表现出色。
● DeepSeek-R1 是基于 DeepSeek-V3-Base 训练生成的强化推理能力模型,在数学、代 码生成和逻辑推断等复杂推理任务上
表现优异。