目标检测RCNN到SSD学习总结VIP免费

下载本文档

阅读 194
下载 5
格式 pdf
大小 2.46 MB
约10页
2024-11-14 发布于天津市
收藏
评论
点赞(0)
海报
举报

1/10页

2/10页

3/10页

在线预览已结束，请下载后查看完整版，加入VIP享文档下载特权

/10

文本预览下载提示常见问题

第一部分从RCNN开始介绍基于候选区域的目标检测器，包括FastR-CNN、FasterR-CNN和FPN等。第二部分则重点讨论了包括YOLO、SSD和RetinaNet等在内的单次检测器。深度学习目标检测模型全面综述：FasterR-CNN、R-FCN和SSD从零开始PyTorch项目：YOLOv3目标检测实现像玩乐高一样拆解FasterR-CNN：详解目标检测的实现过程后RCNN时代的物体检测及实例分割进展物体检测算法全概述：从传统检测方法到深度神经网络框架基于候选区域的目标检测器滑动窗口检测器一种用于目标检测的暴力方法是从左到右、从上到下滑动窗口，利用分类识别目标。为了在不同观察距离处检测不同的目标类型，我们使用不同大小和宽高比的窗口。滑动窗口（从右到左，从上到下）根据滑动窗口从图像中剪切图像块。由于很多分类器只取固定大小的图像，因此这些图像块是经过变形转换的。但是，这不影响分类准确率，因为分类器可以处理变形后的图像。将图像变形转换成固定大小的图像。变形图像块被输入CNN分类器中，提取出4096个特征。之后，我们使用SVM分类器识别类别和该边界框的另一个线性回归器。滑动窗口检测器的系统工作流程图。我们创建很多窗口来检测不同位置的不同目标。要提升性能，一个简单的办法就是减少窗口数量。选择性搜索用候选区域方法（regionproposalmethod）创建目标检测的感兴趣区域（ROI）。在选择性搜索（selectivesearch，SS）中，首先将每个像素作为一组。然后，计算每一组的纹理，并将两个最接近的组结合起来。但是为了避免单个区域吞噬其他区域，我们首先对较小的组进行分组。我们继续合并区域，直到所有区域都结合在一起。下图第一行展示了如何使区域增长，第二行中的蓝色矩形代表合并过程中所有可能的ROI。（作者为了保证能够划分的完全，对于相似度，作者提出了可以多样化的思路，不但使用多样的颜色空间（RGB，Lab，HSV等等），还有很多不同的相似度计算方法。论文考虑了颜色、纹理、尺寸和空间交叠这4个参数）R-CNNR-CNN利用候选区域方法创建了约2000个ROI。这些区域被转换为固定大小的图像，并分别馈送到卷积神经网络中。该网络架构后面会跟几个全连接层，以实现目标分类并提炼边界框。使用候选区域、CNN、仿射层来定位目标。以下是R-CNN整个系统的流程图：通过使用更少且更高质量的ROI，R-CNN要比滑动窗口方法更快速、更准确。边界框回归器候选区域方法有非常高的计算复杂度。为了加速这个过程，通常会使用计算量较少的候选区域选择方法构建ROI，并在后面使用线性回归器（使用全连接层）进一步提炼边界框。使用回归方法将蓝色的原始边界框提炼为红色的。FastR-CNNR-CNN需要非常多的候选区域以提升准确度，但其实有很多区域是彼此重叠的，因此R-CNN的训练和推断速度非常慢。如果我们有2000个候选区域，且每一个都需要独立地馈送到CNN中，那么对于不同的ROI，我们需要重复提取2000次特征。此外，CNN中的特征图以一种密集的方式表征空间特征，那么我们能直接使用特征图代替原图来检测目标吗？直接利用特征图计算ROI。FastR-CNN使用特征提取器（CNN）先提取整个图像的特征，而不是从头开始对每个图像块提取多次。然后，我们可以将创建候选区域的方法直接应用到提取到的特征图上。例如，FastR-CNN选择了VGG16中的卷积层conv5来生成ROI，这些关注区域随后会结合对应的特征图以裁剪为特征图块，并用于目标检测任务中。我们使用ROI池化将特征图块转换为固定的大小，并馈送到全连接层进行分类和定位。因为Fast-RCNN不会重复提取特征，因此它能显著地减少处理时间。将候选区域直接应用于特征图，并使用ROI池化将其转化为固定大小的特征图块。以下是FastR-CNN的流程图：在下面的伪代码中，计算量巨大的特征提取过程从For循环中移出来了，因此速度得到显著提升。FastR-CNN的训练速度是R-CNN的10倍，推断速度是后者的150倍。FastR-CNN最重要的一点就是包含特征提取器、分类器和边界框回归器在内的整个网络能通过多任务损失函数进行端到端的训练，这种多任务损失即结合了分类损失和定位损失的方法，大大提升了模型准确度。ROI池化因为FastR-CNN使用全连接层，所以我们应用ROI池化将不同大小的ROI转换为固定...

1、当您付费下载文档后，您只拥有了使用权限，并不意味着购买了版权，文档只能用于自身使用，不得用于其他商业用途（如 [转卖]进行直接盈利或[编辑后售卖]进行间接盈利）。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。
3、如文档内容存在违规，或者侵犯商业秘密、侵犯著作权等，请点击“违规举报”。

碎片内容

目标检测RCNN到SSD学习总结

第一部分从RCNN开始介绍基于候选区域的目标检测器，包括FastR-CNN、FasterR-CNN和FPN等

第二部分则重点讨论了包括YOLO、SSD和RetinaNet等在内的单次检测器

深度学习目标检测模型全面综述：FasterR-CNN、R-FCN和SSD从零开始PyTorch项目：YOLOv3目标检测实现像玩乐高一样拆解FasterR-CNN：详解目标检测的实现过程后RCNN时代的物体检测及实例分割进展物体检测算法全概述：从传统检测方法到深度神经网络框架基于候选区域的目标检测器滑动窗口检测器一种用于目标检测的暴力方法是从左到右、从上到下滑动窗口，利用分类识别目标

为了在不同观察距离处检测不同的目标类型，我们使用不同大小和宽高比的窗口

滑动窗口（从右到左，从上到下）根据滑动窗口从图像中剪切图像块

由于很多分类器只取固定大小的图像，因此这些图像块是经过变形转换的

但是，这不影响分类准确率，因为分类器可以处理变形后的图像

将图像变形转换成固定大小的图像

变形图像块被输入CNN分类器中，提取出4096个特征

之后，我们使用SVM分类器识别类别和该边界框的另一个线性回归器

滑动窗口检测器的系统工作流程图

我们创建很多窗口来检测不同位置的不同目标

要提升性能，一个简单的办法就是减少窗口数量

选择性搜索用候选区域方法（regionproposalmethod）创建目标检测的感兴趣区域（ROI）

在选择性搜索（selectivesearch，SS）中，首先将每个像素作为一组

然后，计算每一组的纹理，并将两个最接近的组结合起来

但是为了避免单个区域吞噬其他区域，我们首先对较小的组进行分组

我们继续合并区域，直到所有区域都结合在一起

下图第一行展示了如何使区域增长，第二行中的蓝色矩形代表合并过程中所有可能的ROI

（作者为了保证能够划分的完全，对于相似度，作者提出了可以多样化的思路，不

爱的疯狂 + 关注: 实名认证
内容提供者

该用户很懒，什么也没介绍

收藏店铺进入空间

目标检测RCNN到SSD学习总结VIP免费

目标检测RCNN到SSD学习总结

您可能关注的文档

相关文档

热门下载

相关标签