LLM
3 篇2026
3 篇-
Gemini 3.1 Pro 出来了,聊聊我的实际体感
Google 发布 Gemini 3.1 Pro,ARC-AGI-2 跑到 77.1%,价格还是白菜价。我试了一圈,说说真实感受。
-
GLM-5:从 Vibe Coding 到 Agentic Engineering,开源模型终于卷到这了
智谱发布 GLM-5,744B 参数的 MoE 模型,主打 agentic coding。异步 RL、DSA 稀疏注意力、三阶段后训练,开源模型第一次在 agent 任务上真正逼近闭源前沿。
-
Ministral 3:小模型不需要 36 万亿 token,蒸馏才是正道
Mistral 用级联蒸馏把 24B 模型压到 3B,只用了别人十分之一的数据。这条路走通了吗?