HOME 首页
SERVICE 服务产品
XINMEITI 新媒体代运营
CASE 服务案例
NEWS 热点资讯
ABOUT 关于我们
CONTACT 联系我们
创意岭
让品牌有温度、有情感
专注品牌策划15年

    resnet参数量(resnet参数量计算)

    发布时间:2023-05-23 19:53:55     稿源: 创意岭    阅读: 129        

    大家好!今天让创意岭的小编来大家介绍下关于resnet参数量的问题,以下是小编对此问题的归纳整理,让我们一起来看看吧。tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    开始之前先推荐一个非常厉害的Ai人工智能工具,一键生成原创文章、方案、文案、工作计划、工作报告、论文、代码、作文、做题和对话答疑等等tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    只需要输入关键词,就能返回你想要的内容,有小程序、在线网页版、PC客户端和批量生成器tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    问友Ai官网:https://ai.de1919.comtAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    本文目录:tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    resnet参数量(resnet参数量计算)tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    resnet数据尺寸为单数tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    ResNet论文:
    https://arxiv.org/abs/1512.03385
    本文主要参考视频:https://www.bilibili.com/video/BV1T7411T7wa
    https://www.bilibili.com/video/BV14E411H7Uw
    结构概况
    ResNet的网络结构图如图所示:
    这是ResNet不同层数的网络 结构图。
    可以看到,结构大差不差。不论是18层、34层、50层、还是101层、152层。
    上来都是一个7x7的卷积层,然后是一个3x3的最大池化下采样。
    然后就是按照图中的conv2_x、conv3_x、conv4_x、conv5_x中的残差结构。
    最后再跟一个平均池化下采样,和全连接层,sofmax输出。
    conv1与池化层
    我们先看一下前两层。
    首先呢,ResNet使用ImagesNet数据集,采用的默认输入尺寸是224x224,RGB图像,三通道
    按照表中,我们可以看到,图片输入之后,首先是一个7x7,64,stride 2
    也就是一个卷积层,卷积核大小为7x7,输出通道为64(也就是卷积核个数),stride=2。
    没说padding,我们需要自己算一下,表里写了这一层的输出是112x112
    补充一点知识:
    假设输入图片为 W x W 卷积核大小为F x F,步长stride=S,padding=P(填充的像素数)
    则输出图像的大小 W2 =(W - F +2P)/S +1
    可以注意到这个公式中有除法,一般我们做卷积时除不尽的时候都向下取整
    可以参考pytorch官方文档:https://pytorch.org/docs/stable/generated/torch.nn.Conv2d.html#torch.nn.Conv2d
    但是我们做池化的时候,也可以采用向上取整
    参看pytorch官方文档:https://pytorch.org/docs/stable/generated/torch.nn.MaxPool2d.html#torch.nn.MaxPool2d
    有一个参数ceil_mode,默认是floor是向下取整,可以设置为True,向上取整
    ceil_mode – when True, will use ceil instead of floor to compute the output shape
    有的时候池化会选择向上取整(最大池化和平均池化有时取整方式不同)
    那就是说 112 = (224 - 7 + 2P)/ 2 + 1
    化简后就是 111 = (217 + 2P)/2 = 108.5+P
    所以P=3 所以Padding是3
    所以我们输入图片进来,第一层是in_channel=3,out_channel=64,kernel_size=7,stride=2,padding=3
    没有偏置bias。经过这一层我们会得到大小为112x112的尺寸,通道数为64
    然后经过一个3x3的最大池化下采样,stride=2
    W o u t = ( W i n − F + 2 P ) / S + 1 W_{out}= (W_{in} - F + 2P)/S + 1 W
    out

    =(W
    in

    −F+2P)/S+1
    池化层也采用向下取整。所以 56=(112 - 3 + 2P)/2 +1 计算出来P=1
    所以第二层池化层是in_channel=64,out_channel=64,kernel_size=3,stride=2,padding=1
    经过池化层,我们会得到一个56x56,64通道的输出,紧接着就是conv2_x中对应的一系列残差结构
    残差结构
    经过前面两层,我们得到一个56x56,64通道的输出
    紧接着是conv2_x
    这就是残差块,残差块大致有两种类型,一种是两层卷积的,一种的三层卷积的,就是途中红框画的。
    比如如果是ResNet34,那么池化层之后,就是两个3x3,64的卷积层,这两个组成一个残差块。
    如果是ResNet50,那么池化层之后就是1x1,64的卷积层 + 3x3,64的卷积层 + 1x1,256的卷积层,三个组成一个残差块。
    后面写的x3就代表有三个这样的残差块连接一起
    如下图所示,关于残差结构的原理,不多说了,这里主要讲实现。
    有几个点需要注意:
    以ResNet34为例,按照表格里面写的,池化之后,我们的大小是56x56x64,那么经过conv2_x之后我们的输出还是56x56x64
    输入和输出特征矩阵的大小一样,那么就说明stride=1,padding=1
    因为公式 W o u t = ( W i n − F + 2 P ) / S + 1 W_{out}= (W_{in} - F + 2P)/S + 1 W
    out

    =(W
    in

    −F+2P)/S+1
    要保证一样,那就S=1,不然的话,大于1就没法一样,然后计算padding可知,也是1
    所以经过这两层之后呢,得到的还是56x56x64的特征图,可以直接与残差块那个分支相加。
    但是呢这里需要注意,我们看conv3_x,是3x3,128通道,也就是说经过conv2_x后得到的56x56,64通道
    到conv3_x里面升维了,并且大小也变了,变成28x28了
    这时候要注意一个问题,分支与主分支的结果就无法相加了,大小不一致,维度不一致啊
    怎么办呢,所以还有一种虚线连接的残差块,如图
    在分支里面做了一个1x1的卷积层,1x1的卷积层主要是用来升维和降维的。同时通过设置stride可以改变尺寸
    所以就通过这个卷积层得到了28x28,128通道的特征图,可以与主分支直接相加了
    并且我们通过计算可以算出来,残差块主分支padding=1,右边的分支padding=2
    对于ResNet50和101,深层次的ResNet也是按照这样的方法处理的
    但是注意啊,这种虚线结构只是为了解决尺寸不一样无法相加的情况
    什么情况下需要用这个呢?
    对于ResNet18和ResNet34而言,conv3_x,conv4_x和conv5_x的第一层才需要虚线结构。
    可以看到表里面,ResNet34的conv3_x的第一层会输出28x28,128通道的,但是输入是56x56,64通道的,所以需要虚线结构,而conv2_x不需要,因为输入输出是一样的。
    而对于ResNet50和ResNet101,ResNet152而言,conv2_x和conv3_x,conv4_x和conv5_x的第一层都需要虚线结构
    因为ResNet50从conv2_x开始,输入56x56,64通道,输出是56x56,256通道的,所以conv2_x也需要虚线结构,不过这个虚线结构只调整通道数即可。
    所以,我们根据表格可以看到ResNet50中,conv3_x有四个残差块,这其中只有第一个会遇到尺寸不一样的问题,需要用虚线结构,别的都不需要。
    同样的,conv4_x和conv5_x的第一层也需要
    另外再注意一个改进:
    Batch Normalization
    Batch Normalization的目的是使我们的一批(Batch)feature map满足均值为0,方差为1的分布规律。
    这里关于BN层的原理就不写了,可以看这个视频和博客
    https://www.bilibili.com/video/BV1T7411T7wa
    https://blog.csdn.net/qq_37541097/article/details/104434557
    我们需要知道的是
    建议将bn层放在卷积层(Conv)和激活层(例如Relu)之间,且卷积层不要使用偏置bias
    所以说,我们实际上的残差网络块应该是如图,这个样子的
    总结
    至此,整个ResNet的网络结构就清晰了。其中需要注意的点主要就是:
    计算卷积过程中的参数 W o u t = ( W i n − F + 2 P ) / S + 1 W_{out}= (W_{in} - F + 2P)/S + 1 W
    out

    =(W
    in

    −F+2P)/S+1
    ResNet18层和34层conv3_x、conv4_x、conv5_x中的第一层需要用虚线结构
    ResNet50层、101层和152层中的conv2_x、conv3_x、conv4_x、conv5_x中的第一层都需要用虚线结构
    BN层放在卷积层(Conv)和Relu之间,且卷积层不要使用偏置bias

    resnet参数量(resnet参数量计算)tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司

    以上就是关于resnet参数量相关问题的回答。希望能帮到你,如有更多相关问题,您也可以联系我们的客服进行咨询,客服也会为您讲解更多精彩的知识和内容。tAz创意岭 - 安心托付、值得信赖的品牌设计、营销策划公司


    推荐阅读:

    Called翻译(are called翻译)

    wordpress修改数据库关联(wordpress更换数据库)

    怎么用coreldraw设计vi(怎么用coreldraw设计logo)

    视频号视频几分钟(视频号 几分钟)

    如何为企业进行营销策划(如何为企业进行营销策划工作)