您当前的位置: 首页 >  算法

耐心的小黑

暂无认证

  • 1浏览

    0关注

    323博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

深度学习算法一:目标检测(yolov3)思路理解小记录

耐心的小黑 发布时间:2020-11-23 09:34:16 ,浏览量:1

一、模型部分

会根据所提供的9个先验框在darknet输出的三个特征层【y1,y2,y3】(形状分别是(N,255,13,13),(N,255,26,26),(N,255,52,52))中的每个格点grid_cell上,预测三个框,这三个框的长宽比不是随意取的,是取自根据数据集聚类得到的9个先验框的长宽,这样三个特征层正好使用了9个先验框。

二、训练部分

会根据数据集,该数据集是xml格式或者其他格式,里面的主要内容就是【img,每一个目标的框信息以及所属类别】,得出和模型输出相同形状的数据,形状分别是[(m,13,13,3,85),(m,26,26,3,85),(m,52,52,3,85)]。因为是由真实框得来的数据,所以肯定没有那么多,比如此时的框都只有一种宽高,也即真实宽高,并不像上面每一个grid_cell有三个框。所以为了和模型输出形状相同,在没有框的地方(对应矩阵里元素的位置)的数据其实都是零。这样就可以将y_truey_out送入loss函数计算误差,然后更新模型参数即可。

1、计算loss所需参数

在计算loss的时候,实际上是y_prey_true之间的对比:y_pre就是一幅图像经过网络之后的输出,内部含有三个特征层的内容,其需要解码才能够在图上作画;y_true

关注
打赏
1640088279
查看更多评论
立即登录/注册

微信扫码登录

0.0356s