1.3.6 VGG的结构
1.3.6 vgg的结构
牛津大学vgg(visual geometry group)组在2014年ilsvrc提出了vgg模型。该模型相比以往模型进一步加宽和加深了网络结构,它的核心是五组卷积操作,每两组之间做max-pooling空间降维。同一组内采用多次连续的3x3卷积,卷积核的数目由较浅组的64增加至最深组的512,同一组内的卷积核数目是一样的。卷积之后接两层全连接层,之后是分类层。由于每组内卷积层的不同,有11、13、16、19层这几种模型,图1-21展示了一个16层的网络结构。vgg模型结构相对简洁,提出之后也有很多文章基于此模型进行研究,如在imagenet上首次公开的超过人眼识别的模型正是借鉴了vgg模型的结构。
图1-21 vgg结构图
牛津大学vgg(visual geometry group)组在2014年ilsvrc提出了vgg模型。该模型相比以往模型进一步加宽和加深了网络结构,它的核心是五组卷积操作,每两组之间做max-pooling空间降维。同一组内采用多次连续的3x3卷积,卷积核的数目由较浅组的64增加至最深组的512,同一组内的卷积核数目是一样的。卷积之后接两层全连接层,之后是分类层。由于每组内卷积层的不同,有11、13、16、19层这几种模型,图1-21展示了一个16层的网络结构。vgg模型结构相对简洁,提出之后也有很多文章基于此模型进行研究,如在imagenet上首次公开的超过人眼识别的模型正是借鉴了vgg模型的结构。
图1-21 vgg结构图