2025年6月14日

智能驾驶这些年从硬件选型到算法适配是如何更新迭代的?


架构不是画图,是跟着项目换骨架

刚做智能驾驶时,总觉得架构师是在画一张很漂亮的系统图。后来才发现,真实工作更像是在泥地里搭架子:先让车跑起来,再想办法让它稳定、便宜、可量产、可维护。

0 到 1 阶段,目标就是快。ROS、Python、小脚本,只要能把链路跑通都可以。到了量产阶段,问题就变了:算力够不够、功耗压不压得住、日志会不会把盘打满、接口改了谁负责、异常时怎么降级。这些东西比“架构图好不好看”重要多了。

SoC 选型:从 MDC 到 Orin,再到 Thor

我 2021 年毕业进上汽时,项目里还在用华为 MDC 跑智驾。那时候大家都在摸索,平台、工具链、量产节奏都还没完全稳定。后来因为量产和生态成熟度的问题,又切到 NVIDIA Xavier、Orin。再往后,我离开之后,平台继续往 Thor 这一代走。

华为 MDC 官网里的智能驾驶应用场景配图

这不是某一家公司的特殊经历,基本是国内智驾厂商都走过的路:先用能跑的,再用能量产的,最后再追更高算力、更高集成度。NVIDIA 这条线从 Xavier、Orin 往 Thor 演进,背后其实就是感知模型越来越大、数据吞吐越来越高、车端算力越来越不够用。

NVIDIA 官方 DRIVE AGX Thor 开发平台

所以选 SoC 不能只看 PPT 上的 TOPS。真正要看的是:模型实际跑出来延迟多少,发热怎么样,工具链好不好用,供应和量产能不能跟上,出了问题有没有人能一起扛。

有时候最强的芯片不一定最适合当前项目。架构选型,本质上就是在性能、成本、时间和风险之间做妥协。

国产平台也在追

地平线也是类似节奏,从 J3、J5 到 J6。J6 这种国产芯片的出现,说明国内供应链也在追这个节奏。不是只有海外平台能做智驾,只是工具链、生态和量产经验都需要时间堆。

地平线官方征程 6 芯片示意

中间件:从 ROS 到魔改 ROS2

中间件这块,大家看起来方案很多,ROS、ROS2、DDS、SOME/IP、Adaptive AUTOSAR,但工程上没有那么神秘。

更准确地说,不是“只要符合 AUTOSAR 就行”。AUTOSAR 更像量产车的软件架构和约束体系,里面会涉及通信、诊断、服务治理、安全等一整套东西。智驾算法链路里真正痛的,还是大带宽数据怎么传、延迟怎么控、节点怎么管理、异常怎么恢复。

我们最早用 ROS 通讯,验证快,但量产味道很淡。后来换 ROS2,利用 DDS 这套发布订阅机制,整体工程化好一些。再后来又做 ROS2 的魔改,主要就是为了扛大通信量:多路相机、激光雷达、BEV 特征、感知结果、规划轨迹,全都在车上跑,原生方案不一定撑得舒服。

感知变化最大

这几年变化最大的其实是感知。

最早前辈们做简单 ADAS,更多是基于图像特征:车道线检测、车牌检测,再强依赖毫米波雷达做目标和距离。那时候模型不大,规则也多,能把 ACC、LKA 这类功能做好就不错了。

再往后进入 bbox 目标检测阶段,检测车、人、锥桶这些目标,再用接地点、相机标定去估距离。这个阶段比传统特征强很多,但本质上还是“看见目标,再拼几何关系”。

现在量产主流已经是 Transformer / BEV 这一套了。算力上来以后,多相机、多传感器的信息可以在统一空间里融合,感知不再只是一个个框,而是开始理解道路结构、障碍物、车道拓扑。

至于 VLA、端到端,方向很性感,但离真正大规模量产还有距离。不是论文里跑通就能上车,车上要考虑长尾、安全兜底、可解释、回归测试,还有责任边界。

接口和安全不能后补

系统一复杂,感知、定位、预测、规划、控制、车辆接口几十个节点一起跑,接口就必须像契约一样管理。字段怎么定义、谁能改、怎么兼容,都要落到 IDL、Protobuf、Code Review 里,不然联调迟早爆炸。

安全也是一样。主链路负责体验,监控链路负责兜底。规划轨迹离不离谱、控制指令会不会过大、系统心跳有没有掉,这些东西不能靠人品。AI 可以激进,但车上必须有一个冷静的“监工”。

写在最后

智能驾驶架构不是一次性设计出来的,它是被项目阶段、芯片平台、算法路线、量产压力一点点推着变出来的。

这几年看下来,所谓架构能力,其实就是知道什么时候该快,什么时候该稳,什么时候该重构,什么时候该认怂。