7.7.3 faster rcnn
    ross b.girshick在rcnn和fast rcnn的基础上,提出了新的faster rcnn(见图7-31)。faster rcnn将特征抽取、region proposals提取、物体分类都整合在了一个网络中,使得综合性能有了较大提高,在检测速度方面尤为明显,gpu环境下简单物体检测任务达到了每秒17张图片。
    图7-31 faster rcnn流程简化图
    值得一提的是,faster rcnn把输入的大小为(224,224,3)的图片,经过cnn处理,提取特征的维度为51x39x256。可以把该特征看成一个尺度51x39的256通道图像,对于该图像的每一个位置,考虑9个可能的region proposals,如图7-32所示。在faster rcnn中region proposals也称为anchor。物体的分类结果取决于region proposals和图像数据,因此faster rcnn也可以理解为先检测出region proposals,然后再检测出物体分类,整个物体检测阶段还是分为了两阶段。这个是faster rcnn和后面将要介绍的yolo和ssd最大的区别,后者region proposals和物体分类结果是在一起生成的。
    图7-32 faster rcnn候选区域示意图

章节目录

智能系统与技术丛书·AI安全之对抗样本入门所有内容均来自互联网,一曲书屋只为原作者兜哥的小说进行宣传。欢迎各位书友支持兜哥并收藏智能系统与技术丛书·AI安全之对抗样本入门最新章节