自动驾驶分类

BEVFormer

PipeLine流程

其实和大多数的算法流程一样，BEVFormer的pipeline流程如下：

使用Backbone和Neck（ResNet-101-DCN + FPN）提取环视图像的多尺度特征。

Encoder模块（包括Temporal Self-Attention模块和Spatial Cross-Attention模块），通过论文提出的方法将环视图像特征转换为BEV特征。

类似于Deformable DETR的Decoder模块，完成3D目标检测的分类和定位任务。

正负样本的定义采用了Transformer中常用的匈牙利匹配算法，使用Focal Loss + L1 Loss作为总损失，并最小化该损失。

损失的计算使用Focal Loss分类损失和L1 Loss回归损失，并进行反向传播和更新网络模型参数。

自动驾驶

端到端自动驾驶

下一代量产辅助驾驶系统会是端到端吗？

暂且不论目前号称是纯端到端的FSD，性能还远远不能达到L3级别以上所需要的可靠性和稳定性，未来就算是统计意义上这个车辆和人是一样安全的，还要面临如何和人类驾驶员的错误做align的问题。更直白一点来说，就是说，一个自动驾驶系统想要让大众和舆论接受，关键可能不在于一个绝对的事故率和致死率，而是在于大众是否能接受有一些场景中，对于人类是相对轻松解决，而机器会犯错的。这个需求对于纯端到端系统来说更难以实现。

那么站在现在的这个时刻，下一代量产辅助驾驶系统中切实可行的方案是什么？简单来说，我认为一个合适的系统应当是首先充分挖掘传统系统的能力上限，然后再去结合端到端的灵活和普适性，也就是一个渐进式端到端的方案。

Genhiy...大约 2 分钟