llm
15 篇2026
7 篇-
Gemini 3.5 Flash:很快,但不再便宜得随便用
Gemini 3.5 Flash 的速度、代码代理体验、价格和社区反馈。
-
DeepSeek V4 发布一周后:便宜、开源、昇腾,以及那些被传歪的点
发布一周后复盘 DeepSeek V4:Pro/Flash 两个版本、API 价格、开源许可、逆向限制和华为昇腾支持到底确认到哪一步。
-
GPT-5.5 使用体验
从跑分、和 GPT-5.4 的差异、安全约束,以及 Codex 里的实际开发体感,聊聊 GPT-5.5 到底值不值得当主力模型。
-
低算力成本的新秀 Unsloth
简单聊聊 Unsloth 为什么被很多个人开发者喜欢,以及它和 SFT、GRPO、DPO 等训练方法的关系。
-
VLA能在自动驾驶落地吗?
聊聊自动驾驶 VLA 现在到底有没有稳定开源模型、它依赖什么数据,以及离真正量产还有多远。
-
DeepSeek Engram 论文解读:存算分离的架构创新
分析 DeepSeek Engram 模块如何通过查表机制提升 LLM 效率,实现存算分离。
-
不卷参数卷效率:小米 MiMo-V2-Flash 的架构创新
深度解读小米 MiMo-V2-Flash:当 309B 参数的 MoE 遇上极致的 128 窗口 Attention,如何在性能与效率之间找到完美平衡点。
2025
7 篇-
LLM 选型避坑指南:从 Total B 到 Active A 的实战经验
从踩坑经验出发,梳理 LLM 参数架构与主流梯队,给出选型时的务实参考。
-
从git clone超时到模型跑起来:H800 内网部署的12小时
记录内网环境部署 LLaMA-Factory 的踩坑与配置流程。
-
拒绝鼠标:基于Google GenAI的SolidWorks自动化交互接口设计
记录基于 Gemini 的 SolidWorks 自动化交互开发踩坑过程。
-
MarketPulse : 基于 Google Gemini AI 的金融资讯智能分析系统
介绍基于 Gemini 的金融资讯分析与推送流程,强调自动化去噪与可落地性。
-
读完 GLM-4.5 技术报告:开源大模型的帕累托最优边界思维
一个 AI 从业者读完智谱 GLM-4.5 技术报告后的真实思考,关于融合之美、工程智慧和开源精神
-
用 Rust 给内网装个 AI:Qwen3-VL 部署踩坑实录
记录内网部署 Qwen3-VL 与 Rust 终端工具的实践细节,侧重合规与可用性。
-
DeepSeek R1 论文解读:强化学习如何自主激发推理能力
分析 DeepSeek R1 论文的核心创新,包括 RL 推理、GRPO 算法和模型蒸馏。