您当前的位置: 首页 > 

暂无认证

  • 1浏览

    0关注

    97425博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

全球首个开源图像识别系统上线了!人脸、商品、车辆识别一网打尽!

发布时间:2021-11-03 15:52:39 ,浏览量:1

父老们,乡亲们!

你知道人脸、商品、车辆识别,以图搜图乃至自动驾驶,背后的技术是什么吗?

起初我觉得不就是图像分类、目标检测这些东西嘛,有什么难的?但能熟练这些应用的BAT高级工程师们都轻松年薪百万,笑傲人生了!!!

25567dcda1468485fb4dbe32036b6d0e.gif

当我正在酸成柠檬精的时候,BAT大神幽幽的说:这背后是综合使用目标检测、图像分类、度量学习、图像检索的【通用图像识别系统】…

ce9feed67b5bbd1af57306ede428bd9b.png

度量学习是啥?图像检索是啥?通用图像识别系统又是啥?!

看来还是我Too Simple,Too Naive了…

难道我真的就无缘年薪百万了嘛?!

正在我捶胸顿足的时候,突然发现了一个通用图像识别系统快速搭建神器—PP-ShiTu!OMG!这不梦想一下就要实现了嘛!

赶紧Star收藏住:https://github.com/PaddlePaddle/PaddleClas

那这个项目到底有什么过人之处,图像识别又比图像分类、目标检测强在哪里呢?

拿[商品识别]举个栗子🌰,如果你用单纯的图像分类和目标检测,你会发现:

  • 商品类别数以万计:根本没法事先把所有类别都放入训练集!训练集都不完备怎么训练算法?

3475bdb7d37f7de95dedc35c59554846.png

  • 样本差别极小,区分难度极大:细分类差别极其细微,实际图像的拍摄角度也多变刁钻,识别准确率非常非常低。

58bad34d121b4916e8f6e65284449498.png
  • 产业上线速度要求极高:每张复杂的图片处理速度要求在毫秒级别,在闸机前让你等个3秒绝对要炸锅!

52189ff143559e043d9cc5c5e5bd40ad.gif

而这个PP-ShiTu图像识别系统就可以完美解决以上问题!

准备好需要识别的物体图片后,只需三步,多类别、微差异、高速度等问题通通不再是问题,绝对的“开箱即用”,而且它不仅可以用作商品识别,还可以进行车辆、人脸、Logo、行人识别!!!

  • 第一步通过目标检测模型,进行主体检测;

  • 第二步对每个候选区域进行特征提取;

  • 第三步将特征提取后的向量在检索库中进行检索,完成匹配,返回识别结果。

a5c95ee8a96b3fa4d50ba7c841b1c1c2.png

而这个图像识别系统的4个核心构成模块,都是经过精心打磨。无论是单独使用亦或是串联开发,都有非凡的效果:

f56be9f70d26d79c96d564e93f4e429a.png

主体检测:采用高精准超轻量的PP-PicoDet检测算法,它在相同环境下,精度优于YOLOv5n和YOLOX-nano 8个点以上。而它的出现,使PP-ShiTu的主体检测模块,相比上一个版本在精度几乎不变的情况下,预测速度提升了15倍以上!

骨干网络:采用CPU级超高性价比的轻量化骨干网络PP-LCNet,它的准确率不仅超越大模型ResNet50的模型效果,预测速度还是后者的3倍!简直香个跟头!而PP-ShiTu充分挖掘该网络的潜力,学习一个具有超强泛化能力的特征提取模型,同一模型可在多个数据集上同时实现高精度识别。

度量学习:集成ArcMargin度量学习方法,轻松将图像转换成特征向量,训练出鲁棒的图像特征,以供后续进行检索识别。

检索系统:集成Faiss算法,高效完成向量检索。当增加新的品类时,不需要重新训练提取特征模型,仅需要更新检索库即可识别新的目标,一次训练长期使用,还兼容(Linux, Windows, MacOS)多平台。

开发者不仅可以单独或自主组装使用这四个模块,还可以直接采用构建好的车辆识别、LOGO识别、商品识别、动漫识别四个系统。只需要补充好检索库,就可以直接投产使用了!

c62a12f2fae6b1f9edc1f9c43a2f9c0b.png

有了它们的助力,看齐大厂程序员,年薪百万不是梦!(逐渐露出暴富的笑容~)

这么强大、用心的项目 ,你还在等什么?!还不赶紧🌟Star🌟收藏上车吧!

传送门:https://github.com/PaddlePaddle/PaddleClas

快速体验:https://github.com/PaddlePaddle/PaddleClas/blob/develop_reg/docs/zh_CN/tutorials/quick_start_recognition.md

直播预告

4a4e77b1f27d00db07783091cddf68ec.png

为了让开发者更深入的了解PaddleClas并手把手教大家完成图像识别系统的搭建,项目团队还精心准备了为期4天的直播课程。

11月2日百度高工为我们讲解了图像识别技术难点及选型策略,11月3日-5日还有图像识别产业应用的方法和技巧解析,现场直接为大家进行答疑,还在等什么!赶紧扫码上车吧!

扫码报名直播课,加入技术交流群

7f72352e26c9d4a6bd1cd6faad309f72.png

精彩内容抢先看!长按收藏海报~

22833fb018a0e78eb489ea52abcf85e4.png

e24120b8da3c0860cb4f5ded8446bebb.png

如果您想详细了解更多飞桨的相关内容,请参阅以下文档。官网地址:https://www.paddlepaddle.org.cn

PaddleClas项目地址:

GitHub: https://github.com/PaddlePaddle/PaddleClas/tree/release/2.3

Gitee: https://gitee.com/paddlepaddle/PaddleClas

这么强大、用心的项目 ,还不赶紧给各位开发者一个Star🌟的鼓励!

https://github.com/PaddlePaddle/PaddleClas

51da1bb57c07f74acf452bf0f96a1e59.gif

数据来源:部分图片来源于网络,侵权可删

关注
打赏
1655516835
查看更多评论
立即登录/注册

微信扫码登录

0.1587s