Yasin

Hot Topic of AI 😊

KEEP WALKING

使用超像素分割与图割的网状遮挡物检测算法

Yasin published on 2021-05-09 included in categories Reading 遮挡物检测

标题使用超像素分割与图割的网状遮挡物检测算法年份： 2017 年 7 月 GB/T 7714: [1]刘宇, 金伟正, 范赐恩, et al. 使用超像素分割与图割的网状遮挡物检测算法[J]. 计算机应用, 2018, 38(001):238-245. 1 摘要针对由于摄影角度受限，一些自然图像被铁丝网、栅栏、外墙玻璃接缝等网状遮挡物所遮挡的问题，提出了一种用于修复此类图像的网状遮挡物检测算法。对于现有算法使用单像素颜色特征和固定形状特征造成对颜色和形状不均的网状遮挡物检测效果不佳的弊端，首先将图像进行超像素分割，引入颜色与纹理直方图的联合特征来描述超像素块，将基于像素分类问题转换成基于超像素的分类问题，抑制了局部颜色变化造成的误分类；然后，使用图割算法将超像素块进行分类，使网状结构能够沿着光滑的边缘进行延伸，不受固定的形状限制，提高了对异形网状结构的检测准确率，并且不依赖Farid等提出的算法（FARID M S，MAHMOOD A，GRANGETTO M.Image de-fencing framework with hybrid inpainting algorithm.Signal，Image and Video Processing，2016，10（7）：1193-1201）所需的人工输入；其次使用新的联合特征训练支持向量机（SVM）分类器并对所有未被分类的超像素块进行分类，得到准确网状遮挡物掩膜；最后，使用SAIST算法对图像进行修复。实验中，获得的网状遮挡物掩膜比Farid等提出的算法所得到的保留了更多的细节，在修复算法不变的同时显著提升了图像修复效果。在使用相同网状遮挡物掩膜的情况下，使用SAIST算法修复得到的图片在峰值信噪比（PSNR）和结构相似性（SSIM）上分别比Farid等提出算法提高了3.06和0.02。新的掩膜检测算法联合SAIST修复算法的总体修复效果对比Farid等提出算法及Liu等提出的算法（LIU Y Y，BELKINA T，HAYS J H，et al.Image de-fencing.Proceedings of the 2008 IEEE Conference on Computer Vision and Pattern Recognition.Washington，DC：IEEE Computer Society，2008：1-8）有了明显提升。实验结果表明，所提算法提升了网状遮挡物的检测准确性，得到了效果更好的去除网状遮挡物的图像。 Examples of image de-fencing 2 算法流程 2.1 超像素分割为了突破单个像素的特征限制，同时保留图像的局部细节特征，本文算法使用简单线性迭代聚类 ( Simple Linear Iterative Clustering，SLIC)算法对图像进行超像素分割预处理。SLIC算法将图像上的每个像素点n由一个五维特征向量$[I_n,a_n,b_n,x_n,y_n]^T$表示，$l_n,a_n,b_n$截是点n在CIELAB (CIEL* a* b* 1976 color space)色彩空间的L,a,b三个通道上的像素值，$x_n,y_n$为点n的坐标。图像中的每一个像素点通过K-means聚类的方法分配其最邻近的聚类中心的标号值，像素点n距离一个聚类中心$C_i=[l_i,a_i,b_i,x_i,y_i]^T $的距离D表示为:

Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection

Yasin published on 2021-05-08 included in categories Reading 车道线检测

标题 Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection 年份： 2020 年 10 月 GB/T 7714: [1] Tabelini L , Berriel R , Paixo T M , et al. Keep your Eyes on the Lane: Real-time Attention-guided Lane Detection[J]. 2020. 1 摘要本文提出了LaneATT:一种基于锚点的深车道检测模型，它与其他一般的深度目标检测器类似，使用锚点进行特征池化操作。由于车道遵循规则模式，且高度相关。全局信息可能对推断它们的位置至关重要，特别是在闭塞、车道标志缺失等情况下。因此，本研究提出了一种新的基于锚点的注意机制，可以聚集全局信息。主要贡献：一个SOTA车道线检测方法；一个更快的训练收敛时间的模型；一种新的基于锚点的车道检测注意机制。 2 研究方法LaneATT是一个基于锚的单级车道检测模型(比如YOLOv3、SSD)，方法框架如图1，输入为一个由前置摄像头拍摄的RGB图$I = \R^{3\times H_I\times W_I}$，输出为车道边界线。主干网络为CNN，生成一个特征映射，然后池提取每个锚的特征。将提取的特征与全局注意力特征相结合，该模型可以更方便地利用其他车道的信息，已解决遮挡问题。最后，将组合特征传递到全连通层，预测最终输出通道。 Overview of the method 主干从输入图像生成特征映射。然后，将每个锚点投影到特征图上。这个投影用于汇集与注意力模块中创建的另一组功能相连接的功能。最后，使用这个结果特征集，两个层，一个用于分类，另一个用于回归，做出最终的预测。 2.1 Lane and anchor representation 车道线点定义：$(X,Y)$ $Y = {y_i}^{N_{}{pts}-1}{i=0}$，其中$y_i = i\cdot \frac{H_I}{N{pts}-1} $;

LaneAF: Robust Multi-Lane Detection with Affinity Fields

Yasin published on 2021-04-30 included in categories Reading 车道线检测

标题 LaneAF: Robust Multi-Lane Detection with Affinity Fields 年份： 2021 年 3 月 GB/T 7714: Abualsaud H, Liu S, Lu D, et al. LaneAF: Robust Multi-Lane Detection with Affinity Fields[J]. arXiv preprint arXiv:2103.12040, 2021. 具有亲和力域的鲁棒多车道检测 1 摘要本研究提出了一种涉及二值分割掩码和像素级亲和域预测的车道检测方法。可以在后处理步骤中使用这些亲和字段以及二进制掩码将车道像素水平和垂直聚类到相应的车道实例中。这种聚类是通过一个简单的逐行解码过程实现，需要的算力很小；这种方法允许LaneAF在不假设固定或最大车道数的情况下检测可变数量的车道。此外，这种聚类与以前的视觉聚类方法相比更具可解释性，可以通过分析来识别和纠正错误。在常用车道检测数据集上获得的结果表明，该模型能够有效、稳健地检测和聚类车道。本文提出的方法在Tusimple测试上与SOTA表现相同，并在CULane数据集上获得了SOTA。 2 引言车道检测是自动感知标记车道形状和位置的过程，是自动驾驶系统的重要组成部分，直接影响车辆的引导和转向，同时也帮助道路上众多agent之间的交互。随着道路上的司机数量的增加，自动驾驶系统已经在汽车和科技行业以及学术界得到了相当大的关注。根据公路安全保险研究所(IIHS)的数据，仅在美国，2018年的车祸就夺走了36560人的生命，这凸显了任何有助于预防车祸的技术的重要性。由于道路通常有不同类型的车道线(纯白、破白、纯黄等)，每一种车道线都有特定的含义，车辆可以与它们交互，自动车道检测系统也可以在路况变化时帮助提醒司机。此外，还有几个因素使车道检测成为一项具有挑战性的任务。首先，世界上有各种各样的道路基础设施；此外，车道检测系统必须能够识别车道结束、合并和分流的情况；最后，车道检测系统必须具有识别磨损或不清楚的车道标志的能力。车道的精确检测也使周围车辆的轨迹预测更加鲁棒。 A model that outputs binary segmentation masks and affinity fields 本文方法中使用了二进制分类来检测车道，但这种类型分类产生一个单通道输出，导致不能识别单独的车道实体。为了分离不同的车道，提出了一种基于亲和域的新聚类方案(见图1)。亲和域最初被用于多人二维姿态估计，它由单位向量，编码位置和方向组成。本文定义了两种类型的亲和场——水平亲和场(HAF)和垂直亲和场(VAF)。这些关联字段使唯一的lane实例能够被识别和分段。由于这些亲和域会出现在任何有前景通道像素的地方，因此它们不会绑定到预定数量的通道。因此，该模型与道路上的车道数量无关。本文的主要贡献如下: 展示了使用卷积神经网络(CNN)为骨干网，本质上聚合和细化多尺度特征，与之前提出的其他定制架构和车道检测损失相比，可以获得更好的性能。优于其他架构和之前提出的车道检测损失。详细介绍了用于车道实例分割的预测二值分割掩码和亲和域的训练模型的过程和损失。引入了有效的方法来生成和解码此类关联字段到未知数量的集群通道实例中。 3 研究方法提出的方法包括一个前馈CNN，它被训练来预测二进制车道分割掩码和逐像素亲和域。该模型被训练来预测两个亲和场，分别称之为水平亲和场(HAF)和垂直亲和场(VAF)。亲和性场就是向量场，它将图像平面上的任何2D位置映射为2D中的单位向量。 VAF中的单位向量对其上方的下一组车道像素所在的方向进行编码；HAF中的单位向量指向当前行的车道中心。这两个亲和域与预测的二值分割，然后可以用于聚类前景像素通道作为后处理步骤。 3.1 Network Backbone近期车道检测方法利用了各种主干架构；但其中最流行的通常是ResNet系列架构、ENet和ERFNet。本文中提出了DLA-34骨干网络。 DLA模型族利用了深层聚合，将语义和空间融合统一起来，以便更好地进行定位和语义解释。特别是这种架构扩展了紧密连接的网络，并具有层次化和迭代跳过连接的金字塔网络的特征，提高了表达力，细化了分辨率。两种聚合：迭代深度聚合(IDA)和层次深度聚合(HDA)。IDA专注于融合分辨率和尺度，而HDA专注于合并所有模块和通道的特性。这些架构还包含了可变形的卷积操作，可以根据其输入对空间采样网格进行卷积调整。 3.2 Affinity Fields除了二值车道分割掩码外，本文的模型还被训练来预测水平和垂直亲和场(HAFs和VAFs)。对于任何给定的图像，HAF和VAF可以被认为是向量$\vec{H}(·,·)$和$\vec{V}(·,·)$，为图像中的每个$(x, y)$位置分配一个单位向量。HAF能够水平地聚集车道像素，而VAF能够垂直地聚集车道像素。利用预测的亲和域和二值掩码，通过简单的逐行解码过程从下到上实现聚类通道像素。 Creating affinity fields from ground truth data Creating HAFs and VAFs: 如算法1所示，使用Ground Truth分割掩模动态创建亲和字段，从下到上一行一行地进行。对于图像中的任意y行，使用地面真向量场映射$\vec{H_g}t(·,·)$计算每个车道线点$(x^l_i,y)$的HAF向量，如下所示

Deep Learning for Automatically Detecting Sidewalk Accessibility Problems Using Streetscape Imagery

Yasin published on 2021-04-24 included in categories Reading 车道线检测

标题 Deep Learning for Automatically Detecting Sidewalk Accessibility Problems Using Streetscape Imagery 年份： 2019 年 10 月 GB/T 7714: [1] Weld G, Jang E, Li A, et al. Deep Learning for Automatically Detecting Sidewalk Accessibility Problems Using Streetscape Imagery[C]. The 21st International ACM SIGACCESS Conference on Computers and Accessibility, 2019: 196–209. 1 概述最近的研究已经应用机器学习方法在在线地图图像(例如卫星照片、街景全景图)中自动查找和/或评估行人基础设施。虽然这些方法可以解决人行道的检测，但它们受到两个相互关联的问题的限制: 小的训练集和机器学习模型的选择。本文借助最近发布的人行道数据集(Project Sidewalk dataset），该数据集包括30多万个基于图像的人行道可达性标签，首次检验了深度学习在谷歌街景(GSV)全景图中的人行道自动评估。具体来说，有两个应用领域:自动验证众包标签automatically validating crowdsourced labels和自动标记人行道可达性automatically labeling sidewalk accessibility issues问题。对于这两个任务，引入并使用一个经过修改的残差神经网络(ResNet)来支持图像和非图像(上下文)特征(例如地理)。提出了性能分析，非图像特征和训练集大小的影响，以及跨城市泛化。实验结果显著改善了以前的自动化方法，在某些情况下，满足或超过人类标记性能。人行道应该让所有人受益。它们为在城市中移动提供了安全、环保的管道。对于残疾人来说，人行道可以对他们的独立性、生活质量和整体身体活动产生重大影响。虽然像谷歌和苹果地图这样的地图工具已经开始提供以行人为中心的功能，但它们没有包含人行道路线或人行道可达性的信息，这限制了它们的实用性，并对残疾人产生了特别大的影响。关键的问题是数据从何而来、它是如何收集的？ Research Questions: R1: 机器学习方法在两个任务(验证和标记)中表现如何? R2: 额外的与图像无关的训练特征对表现有什么影响?

基于纹理的复杂环境下道路消失点检测算法

Yasin published on 2021-04-24 included in categories Reading 车道线检测

标题基于纹理的复杂环境下道路消失点检测算法年份： 2014 年 6 月 GB/T 7714: [1]傅重添, 杨健, 路飞飞. 基于纹理的复杂环境下道路消失点检测算法[J]. 计算机应用与软件, 2014(6):292-294. 1 摘要在乡村或者越野环境中，道路没有明显的边界和行车线，阻碍了一般视觉道路检测算法的应用。采用计算道路消失点的方法，提出一种快速的局部适应软投票 FLASV( Fast Local Adaptive Soft Voting) 算法。算法首先采用 Gabor 滤波器计算每个像素点的纹理方向，然后依据像素点的置信水平决定是否参与投票，最后采用快速局部投票的算法估计消失点的位置。实验结果分析表明，该算法能很好地适应复杂多变的环境，具有较低的时间复杂度和较高的准确性。 2 研究方法 2.1 1. 纹理方向估计图像纹理分析方法大致分为基于传统的方法，基于纹理模型的方法和基于信号变换的方法。基于 Gabor 滤波器的纹理分析法是一种基于信号变换的空域—频域联合分析的方法，它克服了传统傅里叶方法的不足，能很好地兼顾信号在频率域和空间域中的分辨能力，具有在空间域和频率域能够同时取得最优局部化的特性，因而在理论上具有比其他方法更好的纹理区分能力。基于多尺度多方向的Gabor滤波器的变换函数表达式为： $$ \psi_{\omega, \varphi}(x, y)=\frac{\omega}{\sqrt{2 \pi} c} \mathrm{e}^{\frac{-\omega^{2}\left(4 a^{2}+b^{2}\right)}{\left(8 c^{2}\right)}}\left(\mathrm{e}^{\mathrm{ia\omega}}-\mathrm{e}^{\frac{-c^{2}}{2}}\right) $$ 式中，$\omega$和 $\phi$表示尺度和方向。本文使用 36 个方向，5 个尺度的 Gabor 滤波器，即$\omega$ = 5，$\phi$= 36，$a = xcos\phi+ ysin\phi，b = － xsin\phi+ ycos\phi，c = 2.