DeepSeek R1 论文解读:强化学习如何自主激发推理能力
2025年1月15日
分析 DeepSeek R1 论文的核心创新,包括 RL 推理、GRPO 算法和模型蒸馏。
DeepSeek-V3 技术报告解读:省钱与高性能的极致平衡
2024年12月30日
分析 DeepSeek-V3 的低成本训练策略、架构创新和工程优化。