• 全国 [切换]
  • 深圳市鼎达信装备有限公司

    扫一扫关注

    当前位置: 首页 » 新闻动态 » 真空技术 » 正文

    改进的Faster R-CNN方法及其在电缆隧道积水定位识别中的应用

    放大字体  缩小字体 发布日期:2021-11-10 08:49:06    浏览次数:68    评论:0
    导读

    摘要:针对电缆隧道内积水的问题,提出了一种改进的基于区域建议的卷积神经网络(Faster R-CNN)方法,并将其应用在电缆隧道积水定位识别中。考虑到Softmax分类方法的正则化参数选取会引起概率计算产生问题,改用支持向量机(SVM)进行图像分类,以增强分类的置信度。使用区域建议网络(RPN)提取隧道积水原图中的区域建议,然后

    摘要:针对电缆隧道内积水的问题,提出了一种改进的基于区域建议的卷积神经网络(Faster R-CNN)方法,并将其应用在电缆隧道积水定位识别中。考虑到Softmax分类方法的正则化参数选取会引起概率计算产生问题,改用支持向量机(SVM)进行图像分类,以增强分类的置信度。使用区域建议网络(RPN)提取隧道积水原图中的区域建议,然后用Fast R-CNN检测网络在建议框中进行图像识别、SVM分类和位置精修。实验结果表明,所提方法计算速度快、识别精度高,在实际工程中表现出较高的效率。

    关键词:电缆隧道;积水定位;区域建议;卷积神经网络;支持向量机

    0 引言

    电缆是由几根或几组导线围绕中心绞合而成的,每组导线之间相互绝缘,且外侧包有高度绝缘的覆盖层,因此电缆具有内通电、外绝缘的特征。电缆隧道是全封闭型的地下构筑物,其可容纳较多数量的电缆,并有供安装和巡视的通道。电缆隧道适用于地下水位低,电缆线路较集中的电力主干线,一般敷设30根以上的电力电缆。

    鉴于架空输电线路占用过多地上空间,以及出于安全性方面的考虑,在110 kV及以下电压等级系统中,电缆隧道的应用日益广泛。但是,电缆隧道长期运行会因种种原因造成隧道内积水,如结构损伤造成渗漏、隧道接缝处防水处理不好、雨水倒灌等。电缆本体,尤其是电缆中间接头、T接头长时间浸泡在水中运行,会造成电缆绝缘受潮,形成水树枝,加速绝缘老化,进而形成电树枝,引发绝缘击穿,造成电缆故障停电。除此之外,隧道积水还会使隧道内的空气湿度增大,腐蚀隧道内的附属设施,对电力电缆的正常安全运行构成威胁[1]。因此,及时监控和识别出隧道积水具有十分重要的现实意义。

    目前,国内外对于电缆隧道内的积水检测研究较少,只有基于水泵及水位的检测系统,其检测目标为电缆隧道内集水坑的水位,当水位超过预设值时会启动远程警报,隧道维护人员通过该信号确定水泵是否正常排水,并采取相关的应急措施[2]。然而,这种检测方式只能将对象局限于集水坑,无法兼顾整个电缆隧道各个位置的积水情况,且反馈不够及时,难以实时监控电缆隧道内的积水情况,解决潮湿问题。为改进电缆隧道内积水检测的以上缺陷,本文基于视频监控系统,采用数字图像处理技术和基于区域建议的卷积神经网络Faster R-CNN(Faster Region-based Convolutional Neural Network)算法进行电缆隧道积水的实时监控和图像定位识别。该算法先使用区域建议网络RPN(Region Proposal Network)提取积水位置区域建议,然后用检测网络在建议框中进行图像识别以及支持向量机SVM(Support Vector Machine)分类,最后对区域建议框进行位置精修。本文算法通过将传统Faster R-CNN中的Softmax分类方法替换为SVM,避免了由Softmax正则化参数选取造成的概率计算近似结果,增强了分类的置信度。

    1 基于区域建议的卷积神经网络

    卷积神经网络[3]CNN(Convolutional Neural Network)已经被广泛应用于多个领域中,如目标检测[4]和语音识别[5]等。其中,Ross Girshick等人在2014年提出的基于区域建议的卷积神经网络R-CNN(Region-based Convolutional Neural Network)表现出色,发展十分迅速。R-CNN是使用区域建议方式进行图像识别的经典算法和基础方法,之后的Fast R-CNN和Faster R-CNN算法都是在R-CNN的基础上提出和改进得到的。

    一般而言,R-CNN算法可以分为4个步骤:①候选区域生成;②特征提取;③类别判断;④位置精修。即首先使用视觉方法生成大量候选区域,再用CNN方法通过卷积运算形成这些区域的高维特征向量,然后将这些特征向量送入某种分类器,如简单的逻辑回归和Softmax回归等,计算候选区域得分数(Object Score)和候选框(Bounding Box)的重叠度IoU后,进行候选框的位置精修,从而实现对象识别和定位[6]

    与使用滑动窗依次判断所有可能区域的原始目标检测算法相比,R-CNN算法预先提取了一系列较可能是物体的候选区域,然后仅在这些候选区域上(采用CNN)提取特征进行判断,有效减少了后续特征向量的计算量,可较好地应对尺度问题;CNN在实现上采用GPU并行计算,计算速度和效率得到了提高;此外,外围框的回归步骤使得目标定位的准确性也得到了提高。

    2 基于Faster R-CNN的积水定位识别

    尽管R-CNN成为了图像识别领域的典型算法,但其第一步区域建议生成耗时长是该算法亟待解决的瓶颈问题。针对该缺陷,Faster R-CNN应运而生,针对该算法提出了一种RPN,它是一个基于全卷积的网络[7],能够同时预测输入图片每个位置的目标区域框和目标得分,旨在高效生成高质量的区域建议框。它的出现替代了之前的Selective Search[8]和Edge Boxes[9]等方法,其与检测网络共享全图的卷积特征,使得区域建议检测几乎不耗费时间[10 -11]。因此,本文以Faster R-CNN为主体、以ZFnet为基础、用SVM替代Softmax分类方法,来实现电缆隧道内的积水定位识别。

    2.1 积水定位识别的网络训练

    Faster-RCNN算法中包含2个CNN:RPN和Fast R-CNN检测网络。本文采用ZFnet对CNN进行预训练,用作RPN和Fast R-CNN检测网络的初始化。训练过程如图1所示。

    1积水定位识别的网络训练过程
    Fig.1Network training process for water accumulation identification

    (1)预训练CNN。

    本文使用ZFnet进行预训练,典型的ZFnet结构如附录A中的图A1所示。它包含5个卷积层CONv(ConVolutional layer)和2个全连接层FC(Fully Connected layer),部分卷积层的后面还添加了池化层,每层滤波器尺寸和卷积步长略有不同。如图A1所示,ZFnet的最后一个卷积层CONV5输出256通道的特征图(Feature Map),全连接层FC6将256个通道内的全部特征进行串联,生成一个4 096 维的单通道高维特征向量。不同类别的图像在深层特征上的差异很大,对经过CONV5、FC6、FC7输出的特征向量使用分类器(本文使用的是SVM),能够输出较好的图像识别效果。本文使用PASCAL VOC2011 Example Images对ZFnet进行预训练,用于RPN和Fast R-CNN检测网络的初始化。本质上,本文使用的RPN和Fast R-CNN检测网络就是在ZFnet的基础上,加上特定功能的层得到的,具体方式将在下文进行介绍。

    (2)训练RPN。

    使用之前预训练得到的ZFnet对RPN进行初始化,在原CONV5的后面额外增加一个特定功能的小卷积层CONV6,在该层上对CONV5输出的Feature Map(与原始图像相互映射)进行滑窗式的卷积运算,对于图像的每个位置,考虑9个固定尺度和长宽比(1∶1)的候选窗口。CONV6的输出作为2个独立的全连接层——box回归层和box分类层的输入,最终得到每个位置上9×2个窗口属于目标/背景的概率,以及9×4个平移缩放参数。RPN训练流程如图2所示。

    2RPN训练过程
    Fig.2Training process of RPN

    (3)训练Fast R-CNN检测网络。

    同样使用预训练得到的ZFnet对检测网络进行初始化,将RPN得到的区域建议作为检测网络的输入,同样进行5层卷积提取特征,并通过相应的池化层进行特征图压缩运算,得到256通道的特征图,然后经过FC6和FC7的全连接层串联,最后通过SVM进行分类,最终得到该区域建议框内是否存在隧道积水和该积水区域框的位置。多次使用样本进行训练和微调,在误差反向传播的过程中更新层连接权重矩阵ω、偏差矩阵b的参数,最终得到适合用于电缆隧道积水定位识别的检测网络。

    (4)RPN与Fast R-CNN检测网络共享卷积层。

    经过以上训练后,2个网络还是彼此独立的,因此需要通过共享卷积层来使得特征既可用作区域建议框的生成,又可用作目标检测。具体方法是:

    a. 使用ZFnet独立训练生成RPN;

    b. 使用a中RPN生成的区域建议和网络参数训练Fast R-CNN检测网络;

    c. 利用Fast R-CNN检测网络的参数初始化RPN,注意此时要将RPN和Fast R-CNN检测网络共享的卷积层的学习率设置为0,即不更新这些卷积层,仅更新RPN特有的那些网络层,并重新训练。则RPN和Fast R-CNN检测网络就共享了所有公共的卷积层,使得区域建议几乎不耗费时间,有效缩短了算法耗时。

    2.2 SVM方法

    SVM 是一种以统计学习理论为基础的机器学习方法[12]。主要通过寻求结构化风险最小实现经验风险和置信范围的最小化,使系统在样本数量不大时也能得到较好的统计规律。与传统的模式识别方法相比,SVM推广能力很强并能保证全局最优[13]。SVM算法的核心思想是寻找一个满足分类要求的最优分类超平面H,使得H不仅能将不同类的样本正确分开,而且不同类样本中每个点到H的距离最小值之和达到最大[14-15]

    x表示待分类数据,xRn,线性分类器的学习目标是在n维数据空间中寻找一个分类超平面,将数据分为2类。超平面用ωTx+b=0来表示,其中ωTb是通过大量样本训练得到的。

    在线性可分的情况下,用y表示分类类别,如式(1)所示。

    (1)

    此时的分类间隔d为:

    (2)

    则使d最大的问题可转化为:

    (3)

    采用Lagrange优化法求解上述问题,定义目标函数为:

    (4)

    其中,αi(i=1,2,…,n)为各个样本的拉格朗日系数。

    求解L(ωbαi)的最小值,即求解如下对偶问题:

    (5)

    求解式(5)得到线性可分情况的最优平面解。

    对于线性不可分的情况,引入松弛变量ζi>0(i=1,2,…,n)允许错分样本的存在,则样本集(xi,yi)满足:

    (6)

    其中,ζi为训练样本关于最优分类超平面的偏差。

    另外,增加一个惩罚因子C≥0,控制对错分样本的约束程度,则此时的最大间隔问题等价为:

    (7)

    接下来同样使用Lagrange优化法转化为求解对偶问题:

    (8)

    现实中的分类大多是非线性分类,本文中遇到的隧道积水图片识别分类同样也是非线性的,这时候可以通过空间变换,将非线性问题转化为某个高维空间中的线性问题,在变换后的高维空间中求其最优分类面或最优广义分类面。从线性不可分的低维空间映射到线性可分的高维空间要使用到核函数,常见的核函数有多项式核函数(Polynomial)、高斯径向基函数(RBF)和S形双曲正切(Sigmiod)函数等,本文在隧道积水定位识别算法中使用RBF核:

    (9)

    积水识别是一个二分类问题,给定一组训练样本,将其分为2类进行标记,有积水为“+1”,无积水为“-1”,只需要1个SVM分类器。在实际操作中,可以通过下列步骤训练和使用SVM进行分类:

    (1)对已分类的图片进行特征提取;

    (2)采用简单的线性方法对特征向量实行归一化,防止大的数据波动主导数据波动、小的数据波动被忽略;

    (3)选定核函数,本文使用的是RBF核;

    (4)使用交叉验证法选取参数Cγ

    (5)采用最佳参数对训练集进行训练获取SVM分类模型;

    (6)用训练得到的SVM模型对FC7输出的特征向量进行分类预测,将输出特征向量矩阵与SVM权重矩阵进行点乘,得到该区域建议框的得分,即该区域建议框中是否存在积水。

    2.3 利用Faster R-CNN进行积水定位识别

    由以上网络训练过程和SVM分类方法可知:使用Faster R-CNN进行积水定位识别的2个网络共享卷积层,因此整个检测过程只需完成系列卷积运算,实现了端到端的定位识别,解决了区域建议步骤耗时长的瓶颈问题,大幅缩短了算法时间;以SVM作为最后的分类器,实现了经验风险和置信范围的最小化,使分类器在样本数量不大时也能得到较好的统计规律。

    积水定位识别的算法流程如下。

    (1)将样本图像输入ZFnet进行系列卷积运算,在CONV5卷积层上得到特征图。

    (2)CONV5得到的特征图进入区域建议网络RPN,在特征图上生成大量区域建议框。需要注意的是,对于特征图的每个位置,本文考虑9个固定尺度和长宽比(1∶1)的候选窗口。

    (3)对RPN生成的区域建议框进行非极大值抑制(NMS),保留得分较高的200个框。

    (4)由Fast R-CNN检测网络对区域建议框中的图像提取特征向量,输入全连接层,再输入SVM分类器计算各区域建议框的得分,并对区域建议框进行回归精修。

    3 实验结果

    为验证本文算法在隧道积水识别中的有效性,在PC机上进行了仿真实验,PC的基本配置如下:CPU双核2.8 GHz,GPU采用单块TitanX,12 GB显存,32 GB内存,Ubuntu 14.04操作系统,深度学习采用ZF框架进行网络训练,训练时间共22 h。

    3.1 仿真步骤

    (1)网络结构:本次实验使用ZF-Faster R-CNN的结构,以图2所示的ZFnet框架为主,根据2.3节的算法流程进行改造。输入先通过5层卷积层和3层池化层得到特征向量,然后在RPN中使用特定卷积层得到一系列区域建议及坐标,在Faster R-CNN中对上述区域建议取特征向量,最后输入全连接层进行SVM分类和建议框回归精修。

    (2)训练算法:本文使用随机梯度下降法进行网络微调训练,初始学习率为10-4,动量项为0.9,权值衰减系数为0.000 5,训练迭代次数为6 000。

    (3)训练数据:本文收集了2 170张珠海横琴隧道的积水图像,人工标定并以8∶2的比例分配了训练和测试用的数据集,训练前没有对积水图像做任何处理,重复训练10次取平均值作为最终结果。

    (4)方法比较:为了验证改进ZF-Faster R-CNN的优良性能,将本文提出的方法与CNN和BPNN方法进行对比实验。将训练集分别输入ZF-Faster R-CNN、CNN、BPNN进行训练,将训练得到的网络模型用于测试集测试,每组实验都取10次测试的平均值作为最终结果输出,3种方法的训练集、测试集完全相同。

    3.2 仿真结果

    本文给出了纵向6幅电缆隧道积水识别的仿真实验结果,并在横向上将原图、本文方法结果、CNN方法结果、BPNN方法结果进行了比较,见附录B中的图B1。本文采用的基于改进的ZF-Faster R-CNN的电缆隧道积水定位识别方法可以准确识别定位不同角度、不同环境的隧道积水状态,统计结果显示识别准确率高达89.6%以上,而CNN、BPNN方法在候选框的选取上会出现多框情况(如图B1(c)、(d)所示),识别结果不够精准,有时还会出现识别错误。

    在识别速度上,本文方法以98 ms的速度优于CNN方法(121 ms)和BPNN方法(127 ms)。

    此外,附录B中的图B2给出了不同卷积层数下卷积中间层特征图的可视化结果。观察图B2可知,浅层的卷积层只能提取到一些低级的特征,如边缘、线条和角等,而深层的卷积层则可以提取到更加复杂和抽象的特征。

    本文方法的训练误差如图3所示。由图可见,在初始的2 000次迭代训练中,训练误差快速减小,3 000次以后训练误差逐渐稳定,表示训练已经得到了较好的权重和参数,生成了较合适的网络模型。

    3训练误差
    Fig.3Training error

    本文方法在识别效果准确率和识别速度上相较其他方法具有优势,这是因为新提出的方法在区域建议预训练中得到了较为理想的权重和偏置,使得后续训练时网络更容易收敛。

    4 结论

    本文将图像处理技术和深度学习方法应用于电缆隧道积水图像的识别和分析中,提出了一种改进的Faster R-CNN方法,并在电缆隧道积水定位识别中进行了应用。该实验在实践上是对积水检测方法效果和时效的创新,在理论上则主要对分类环节进行了改进。本文以SVM替代传统Faster R-CNN中的Softmax分类方法,避免了Softmax正则化参数选取可能导致的概率计算近似结果,使系统在样本数量不大时也能得到较好的统计规律,保证了全局最优,提高了分类置信度。在电缆隧道的特殊环境下,通过对积水的识别,能够实现对早期隧道积水的快速检测,为及时采取相应的排水措施提供了可能,防止电缆由于绝缘受损导致电力安全运行受到威胁。该方法可基于电缆隧道内原有的视频监控系统,也可基于智能巡检机器人实现电缆隧道内的积水检测。实验结果表明,该方法具有非常快的识别速度和较高的识别准确率,为电缆隧道的安全运行提供了有效保障,是图像处理技术在电力行业应用上的一次创新尝试。


     
    (文/小编)
    打赏
    免责声明
    • 
    本文为小编原创作品,作者: 小编。欢迎转载,转载请注明原文出处:https://2024.dingdx.com/news/show.php?itemid=2965 。本文仅代表作者个人观点,本站未对其内容进行核实,请读者仅做参考,如若文中涉及有违公德、触犯法律的内容,一经发现,立即删除,作者需自行承担相应责任。涉及到版权或其他问题,请及时联系我们。
    0相关评论
     

    © Copyright 深圳市鼎达信装备有限公司 版权所有 2015-2022. All Rights Reserved.
    声明:本站内容仅供参考,具体参数请咨询我们工程师!鼎达信作为创新真空产品研发制造商,我们提供海绵吸具,海绵吸盘,真空吸盘,真空发生器,真空泵,真空鼓风机,缓冲支杆,真空配件,真空吊具等等产品

    粤ICP备17119653号