目标检测综述VIP免费

下载本文档

阅读 162
下载 12
格式 docx
大小 310.46 KB
约14页
2024-11-19 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/14页

2/14页

3/14页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/14

文本预览下载提示常见问题

、传统目标检测方法如上图所示，传统目标检测的方法一般分为三个阶段：首先在给定的图像上选择一些候选的区域，然后对这些区域提取特征，最后使用训练的分类器进行分类。下面我们对这三个阶段分别进行介绍。(1)区域选择这一步是为了对目标的位置进行定位。由于目标可能出现在图像的任何位置，而且目标的大小、长宽比例也不确定，所以最初采用滑动窗口的策略对整幅图像进行遍历，而且需要设置不同的尺度，不同的长宽比。这种穷举的策略虽然包含了目标所有可能出现的位置，但是缺点也是显而易见的：时间复杂度太高，产生冗余窗口太多，这也严重影响后续特征提取和分类的速度和性能。(实际上由于受到时间复杂度的问题，滑动窗口的长宽比一般都是固定的设置几个，所以对于长宽比浮动较大的多类别目标检测，即便是滑动窗口遍历也不能得到很好的区域)(2)特征提取由于目标的形态多样性，光照变化多样性，背景多样性等因素使得设计一个鲁棒的特征并不是那么容易。然而提取特征的好坏直接影响到分类的准确性。(这个阶段常用的特征有SIFT、HOG等)(3)分类器主要有SVM,Adaboost等。总结：传统目标检测存在的两个主要问题：一是基于滑动窗口的区域选择策略没有针对性，时间复杂度高，窗口冗余；二是手工设计的特征对于多样性的变化并没有很好的鲁棒性。、基于RegionProposal的深度学习目标检测算法对于传统目标检测任务存在的两个主要问题，我们该如何解决呢？对于滑动窗口存在的问题‘regionproposal提供了很好的解决方案。regionimage.Exiractregionproposals(-2k)proposa（l候选区域）是预先找出图中目标可能出现的位置。但由于regionproposal利用了图像中的纹理、边缘、颜色等信息，可以保证在选取较少窗口（几千个甚至几百个）的情况下保持较高的召回率。这大大降低了后续操作的时间复杂度，并且获取的候选窗口要比滑动窗口的质量更高（滑动窗口固定长宽比）。比较常用的regionproposal算法有selectiveSearch和edgeBoxes,如果想具体了解regionproposal可以看一下PAMI2015的hatmakesforeffectivedetectionproposals？有了候选区域，剩下的工作实际就是对候选区域进行图像分类的工作（特征提取+分类）。对于图像分类，不得不提的是2012年ImageNet大规模视觉识别挑战赛（ILSVRC）上，机器学习泰斗GeoffreyHinton教授带领学生Krizhevsky使用卷积神经网络将ILSVRC分类任务的Top-5error降低到了15.3%，而使用传统方法的第二名top-5error高达26.2%。此后，卷积神经网络占据了图像分类任务的绝对统治地位，微软最新的ResNet和谷歌的InceptionV4模型的top-5error降到了4%以内多，这已经超越人在这个特定任务上的能力。所以目标检测得到候选区域后使用CNN对其进行图像分类是一个不错的选择。2014年，RBG（RossB.Girshick）大神使用regionproposal+CNN代替传统目标检测使用的滑动窗口+手工设计特征，设计了R-CNN框架，使得目标检测取得巨大突破，并开启了基于深度学习目标检测的热潮。1.R-CNN（CVPR2014,TPAMI2015）（Region-basedConvolutionNetworksforAccurateObjectdetectionandSegmentation）R-CNN:Region-basedConvolutionalNetworkp^rion?ycsLr-XJ_____CNN;^Inmoniior?no.3.Compute4.ClassifyCNNfeaturesregions上面的框架图清晰的给出了R-CNN的目标检测流程：(1)输入测试图像(2)利用selectivesearch算法在图像中提取2000个左右的regionproposal。⑶将每个regionproposal缩放(warp)成227x227的大小并输入到CNN,将CNN的fc7层的输出作为特征。⑷将每个regionproposal提取到的CNN特征输入到SVM进行分类。上面的框架图是测试的流程图,要进行测试我们首先要训练好提取特征的CNN模型，以及用于分类的SVM:使用在ImageNet上预训练的模型(AlexNet/VGG16)进行微调得到用于特征提取的CNN模型，然后利用CNN模型对训练集提特征训练SVM。对每个regionproposal缩放到同一尺度是因为CNN全连接层输入需要保证维度固定。上图少画了一个过程对于SVM分好类的regionproposal做边框回归(bounding-boxregression)，边框回归是对regionproposal进行纠正的线性回归算法，为了让regionproposal提取到的窗口跟目标真实窗口...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

目标检测综述

、传统目标检测方法如上图所示，传统目标检测的方法一般分为三个阶段：首先在给定的图像上选择一些候选的区域，然后对这些区域提取特征，最后使用训练的分类器进行分类

下面我们对这三个阶段分别进行介绍

(1)区域选择这一步是为了对目标的位置进行定位

由于目标可能出现在图像的任何位置，而且目标的大小、长宽比例也不确定，所以最初采用滑动窗口的策略对整幅图像进行遍历，而且需要设置不同的尺度，不同的长宽比

这种穷举的策略虽然包含了目标所有可能出现的位置，但是缺点也是显而易见的：时间复杂度太高，产生冗余窗口太多，这也严重影响后续特征提取和分类的速度和性能

(实际上由于受到时间复杂度的问题，滑动窗口的长宽比一般都是固定的设置几个，所以对于长宽比浮动较大的多类别目标检测，即便是滑动窗口遍历也不能得到很好的区域)(2)特征提取由于目标的形态多样性，光照变化多样性，背景多样性等因素使得设计一个鲁棒的特征并不是那么容易

然而提取特征的好坏直接影响到分类的准确性

(这个阶段常用的特征有SIFT、HOG等)(3)分类器主要有SVM,Adaboost等

总结：传统目标检测存在的两个主要问题：一是基于滑动窗口的区域选择策略没有针对性，时间复杂度高，窗口冗余；二是手工设计的特征对于多样性的变化并没有很好的鲁棒性

、基于RegionProposal的深度学习目标检测算法对于传统目标检测任务存在的两个主要问题，我们该如何解决呢

对于滑动窗口存在的问题‘regionproposal提供了很好的解决方案

regionimage

Exiractregionproposals(-2k)proposa（l候选区域）是预先找出图中目标可能出现的位置

但由于regionproposal利用了图像中的纹理、边缘、颜色等信息，可以保证在选取较少窗口（几千个甚至几百个）的情况下保持较高的召回率

这大大降低了后续操作的时间复杂度，并且获取

wxg + 关注: 实名认证
内容提供者

该用户很懒，什么也没介绍

收藏店铺进入空间

目标检测综述VIP免费

目标检测综述

您可能关注的文档

相关文档

热门下载

相关标签