DeepSeek是一家专注通用人工智能(AGI)的中国科技公司,主攻大模型研发与应
用。DeepSeek-R1是其开源的推理模型,擅长处理复杂任务且可免费商用。⽬前较为亮眼的模型为 DeepSeek-R1,DeepSeek-R1 是基于 DeepSeek-V3 进⾏训练的。DeepSeek-V3:通常指 DeepSeek-V3-671B,具备通用模型能力,适⽤于聊天和编码场景、多语言自动翻译、图像生成和 AI 绘画等多模态场景。DeepSeek-R1:通常指 DeepSeek-R1-671B,基于DeepSeek-V3,强化推理能⼒的训练,在长链推理方面有独特优势。在数学、代码以及各种复杂逻辑推理任务上应⽤出⾊,主要用于科学研究、复杂问题求解和逻辑分析