目标检测算法综述(大学学院广州)摘要:从简单的图像分类到三维姿势预测,计算机视觉领域一直不缺乏有趣的问题,其中就包括对象目标检测和许多其他的计算机视觉问题一样,目标检测仍然没有一个显而易见的最优方法,这意味着这个领域还有很多潜力
本文先从对象检测与其他计算机视觉问题开始,继而对经典传统到现在利用深度学习的目标检测算法进行了归纳总结,综述了这些算法是怎么解决目标检测的困难与挑战的,主要是现在用得比较多的性能较好的深度学习目标检测算法,最后介绍了目标检测算法的最新应用和发展趋势
关键词:目标检测;计算机视觉;深度学习;引言在本文中,我们将深入了解目标检测的实际应用、作为机器学习的目标检测的主要问题是什么、以及深度学习如何在这几年里解决这个问题
对象检测与其他计算机视觉问题分类(Classification)分类问题是计算机视觉中最著名的问题,它是识别出图像的类别,比如人、兔子、猫、狗等等
在学术界使用的最流行的数据集之一是 ImageNet,由数百万个分类图像组成,并在 ImageNet 大规模视觉识别挑战(ILSVRC)的年度竞赛中使用
近年来,分类模型的精确度已经超过了人类的肉眼,所以这个问题已算是基本解决了的
定位定位是在图像中找到某个对象的位置,和分类有些类似
定位有很多实际应用例如,智能裁剪一一基于对象所在的位置裁剪图像,或者常规的对象提取之后再用其他方法做进一步处理
它可以与分类结合定位对象,然后将其分类为多种可能的类别之一
目标检测定位和分类可以迭代起来,最终在一张图片汇总对多个目标进行检测和分类
目标检测是在图像上发现和分类一个变量的问题
目标检测与定位、分类相比,重要的区别是这个“变量”
目标检测的输出长度是可变的,因为检测到的对象的数量会根据图像的不同而变化
目标检测算法与其原理传统方法尽管有很多不同类型的方法,我们关注两个最流行并且仍然被广泛使用的传统方法