【论文解读】YOLOP 全景驾驶感知同时处理三大视觉任务-伙伴云

【论文解读】YOLOP 全景驾驶感知同时处理三大视觉任务

网友投稿 714 2022-05-29

前言

YOLOP能同时处理目标检测、可行驶区域分割、车道线检测三个视觉感知任务，并速度优异、保持较好精度进行工作，代码开源。它是华中科技大学——王兴刚团队，在全景驾驶感知方面提出的模型，致敬开源精神。

论文地址：https://arxiv.org/abs/2108.11250

开源代码：https://github.com/hustvl/YOLOP

摘要

全景驾驶感知系统是自动驾驶的重要组成部分。高精度、实时的感知系统可以辅助车辆在行驶中做出合理的决策。提出了一个全景驾驶感知网络（YOLOP）来同时执行交通目标检测、可行驶区域分割和车道检测。

在上图中，紫色边界框表示交通对象，绿色区域是可行驶区域，红色线表示车道线。

一、网络框架

YOLOP由一个用于特征提取的编码器，和三个用于处理特定任务的解码器组成。下图是YOLOP的网络结构：

YOLOP是一种单阶段网络，包含一个共享编码器，三个用于特定任务的解码器。其中三个任务的解码器：目标检测部分、可行驶区域分割、车道线分割。不同解码器之间并没有复杂的、冗余共享模块，这可以极大降低计算量，同时使得该网络易于端到端训练。

【论文解读】YOLOP 全景驾驶感知同时处理三大视觉任务

1.1 Encoder 编码器

该网络中的编码器由Backbone网络与Neck网络构成。

Backbone网络：参考了YOLOv4，采用CSP-Darknet结构，提取输入图像的特征。它支持特征传播和重用，减少了参数和计算的数量。

Neck网络：使得提取的图像特征以充分利用它们。它由空间金字塔池（SPP）模块和特征金字塔网络（FPN）模块组成。SPP模型生成并融合不同尺度的特征，FPN模块融合不同语义层次的特征。因此，Neck网络生成包含“多个尺度”和“多个语义级别信息”的丰富特征，便于融合特征。

1.2 Decoders 解码器

YOLOP包含三个用于三个任务的解码器：目标检测部分、可行驶区域分割、车道线分割。

1）对于目标检测任务，YOLOP 采用了类似于 YOLOv4 的基于锚框Anchor的多尺度检测技术。这部分结构由“路径聚合网络”组成；Neck网络中的 FPN 自上而下传输语义特征，而 PAN 自下而上传输图像特征。YOLOP 将它们结合起来以获得更好的特征融合效果，由此获得的多尺度融合特征图用于检测。

多尺度特征的每个grid被赋予三个先验anchor(包含不同纵横比)，检测头将预测位置偏移、高宽、类别概率以及预测置信度。

2）可行驶区域分割和车道线分割部分使用相同的网络结构。将FPN的输出特征(分辨率为)送入到分割分支。我们设计的分割分支非常简单，通过三次上采样处理输出特征尺寸为，代表每个像素是驾驶区域/车道线还是背景的概率。由于Neck中已包含SPP模块，我们并未像PSPNet添加额外的SPP模块。此外，我们采用了最近邻上采样层以降低计算量。因此，分割解码器不仅具有高精度输出，同时推理速度非常快。

来自 FPN 底层的大小为(W/8, H/8, 256)的特征被馈送到分割分支。它应用三个上采样过程并将特征图恢复为(W, H, 2)，它表示输入图像中可行驶区域和车道线的像素级概率。在其他分割网络有 SPP 模块的地方，YOLOP 分割头不需要，因为Neck网络中共享 SPP 模块。

二、损失函数和训练方法

YOLOP 使用简单的损失函数，它为三个解码器头提供三个单独的损失函数。检测损失是分类损失、对象损失和边界框损失的加权和。可行驶区域分割头和车道线分割头的损失函数都包含带有 logits 的交叉熵损失。车道线分割由于其在预测备用类别方面的有效性而具有额外的 IoU 损失。模型的整体损失函数是所有三个损失的加权和。

三、YOLOP效果与性能

车辆检测效果：

可行区域检测效果：

车道线检测效果：

性能小结：

YOLOP 在具有挑战性的 BDD100K 数据集上针对三个任务的最新模型进行了测试。它在对象检测任务的准确性方面击败了 Faster RCNN、MultiNet 和 DLT-Net，并且可以实时推断。对于可行驶区域分割任务，YOLOP 的性能分别比 MultiNet 和 DLT-Net 等模型高 19.9% 和 20.2%。而且，它比它们都快 4 到 5 倍。同样，对于车道检测任务，它的性能优于现有的最先进模型高达 2 倍。

它是首批在 Jetson TX2 等嵌入式设备上同时实时执行这三项任务并实现最先进性能的模型之一。

本文只供大家参考和学习，谢谢。

AI 网络自动驾驶

excel图表分为独立图表和什么（excel图表分为独立图表和什么图表）

714 2022-05-29

【论文解读】YOLOP 全景驾驶感知同时处理三大视觉任务

excel图表分为独立图表和什么（excel图表分为独立图表和什么图表）

wps表格图片嵌入式怎么设置（wps表格怎么把图片嵌入表格）

wps表格图片嵌入式怎么设置（wps表格怎么设置图片嵌入式）

推荐文章

企业生产管理是什么，企业生产管理软件

进盘点进销存软件排行榜前十名

进销存系统哪个简单好用？进销存系统优点

工厂生产管理（工厂生产管理流程及制度）

生产管理软件，机械制造业生产管理，制造业生产过程管理软件

进销存软件和ERP有什么区别？进销存与erp软件理解

进销存如何进行库存管理

如何利用excel制作销售订单管理系统？

数据库订单管理系统有哪些功能？数据库订单管理系统怎么设计？

什么是数据库管理系统？

最近发表

热评文章

零代码开发是什么？2022低代码平台排行榜

智能进销存库存管理系统（智慧进销存）

在线文档哪家强？8款在线文档编辑软件推荐

WPS2016怎么绘制简单的价格表?

什么是在线文档？怎么发在线文档

简单进销存库存管理盘点

友情链接

【论文解读】YOLOP 全景驾驶感知 同时处理三大视觉任务

推荐文章

最近发表

热评文章

友情链接

【论文解读】YOLOP 全景驾驶感知同时处理三大视觉任务