生命体验家-汤国放的个人博客
Home
Blog
Project
DeepSeek-R1
1 篇
全部文章
分类
标签
2025
1 篇
DeepSeek R1 论文解读:强化学习如何自主激发推理能力
2025年1月15日
分析 DeepSeek R1 论文的核心创新,包括 RL 推理、GRPO 算法和模型蒸馏。