现在,目标检测界明星模型YOLO,最新v5版本也可以在手机上玩儿了!
瞧~只需要区区几十毫秒,桌上的东西就全被检测出来了:
这速度似乎不比电脑差?
想要亲手搭建一个?上教程。
在安卓手机上部署YOLOv5更确切的说是YOLOv5s。
YOLOv5于2020年5月发布,最大的特点就是模型小,速度快,所以能很好的应用在移动端。
而且其实最开始YOLOv5就是作为一款对图像进行检测、分类和定位的iOS端APP进入人们的视野,而且APP还是由YOLOv5的作者亲自开发。
现在,想要在安卓设备上部署它,你需配备的环境如下:
-
主机 Ubuntu18.04
-
Docker
Tensorflow 2.4.0 PyTorch 1.7.0 OpenVino 2021.3
-
安卓APP
Android Studio 4.2.1 minSdkVersion 28 targetSdkVersion 29 TfLite 2.4.0
-
安卓设备
小米11 (内存 128GB/ RAM 8GB) 操作系统 MUI 12.5.8
然后直接下载作者在GitHub上的项目。
git clone —recursive https://github.com/lp6m/yolov5s_android
使用Docke容器进行主机评估(host evaluation)和模型转换。
cd yolov5s_android docker build ./ -f ./docker/Dockerfile -t yolov5s_android docker run -it —gpus all -v pwd:/workspace yolov5s_anrdoid bash
将app文件夹下的./tflite\u model/*.tflite复制到app/tflite\u yolov5\u test/app/src/main/assets/目录下,就可在Android Studio上构建应用程序。
构建好的程序可以设置输入图像大小、推断精度和模型精度。
如果选择其中的“Open Directory”,检测结果会被保存为coco格式的json文件。
从摄像头进行实时检测模式已将精度和输入图像大小固定为int8/320,该模式在小米11达到的图像帧数为15FPS。
由于本项目是作者参加的一个”Yolov5s Export”竞赛(并且最终得了奖,奖金还是2000美元),所以他也进行了性能评估。
评估包括延时和准确度。
-
延迟时间
在小米11上测得,不包含预处理/后处理和数据传输的耗时。
结果如下:
不管模型精度是float32还是int8,时间都能控制在250ms以内,连半秒的时间都不到。
-
准确度
各种模式下的mAP(mean Average Precision)值最高为28.5,最低也有25.5。
最后,详细教程可戳下方链接;如果你只想试玩,作者也在上面提供了安卓安装包~
项目地址:
https://github.com/lp6m/yolov5s_android
本文仅做学术分享,如有侵权,请联系删文。
3D视觉精品课程推荐:
1.面向自动驾驶领域的多传感器数据融合技术
2.面向自动驾驶领域的3D点云目标检测全栈学习路线!(单模态+多模态/数据+代码) 3.彻底搞透视觉三维重建:原理剖析、代码讲解、及优化改进 4.国内首个面向工业级实战的点云处理课程 5.激光-视觉-IMU-GPS融合SLAM算法梳理和代码讲解 6.彻底搞懂视觉-惯性SLAM:基于VINS-Fusion正式开课啦 7.彻底搞懂基于LOAM框架的3D激光SLAM: 源码剖析到算法优化 8.彻底剖析室内、室外激光SLAM关键算法原理、代码和实战(cartographer+LOAM +LIO-SAM)
9.从零搭建一套结构光3D重建系统[理论+源码+实践]
10.单目深度估计方法:算法梳理与代码实现
11.自动驾驶中的深度学习模型部署实战
12.相机模型与标定(单目+双目+鱼眼)
重磅!3DCVer-学术论文写作投稿 交流群已成立
扫码添加小助手微信,可申请加入3D视觉工坊-学术论文写作与投稿 微信交流群,旨在交流顶会、顶刊、SCI、EI等写作与投稿事宜。
同时也可申请加入我们的细分方向交流群,目前主要有3D视觉、CV&深度学习、SLAM、三维重建、点云后处理、自动驾驶、多传感器融合、CV入门、三维测量、VR/AR、3D人脸识别、医疗影像、缺陷检测、行人重识别、目标跟踪、视觉产品落地、视觉竞赛、车牌识别、硬件选型、学术交流、求职交流、ORB-SLAM系列源码交流、深度估计等微信群。
一定要备注:研究方向+学校/公司+昵称,例如:”3D视觉 + 上海交大 + 静静“。请按照格式备注,可快速被通过且邀请进群。原创投稿也请联系。
▲长按加微信群或投稿
▲长按关注公众号
3D视觉从入门到精通知识星球:针对3D视觉领域的视频课程(三维重建系列、三维点云系列、结构光系列、手眼标定、相机标定、激光/视觉SLAM、自动驾驶等)、知识点汇总、入门进阶学习路线、最新paper分享、疑问解答五个方面进行深耕,更有各类大厂的算法工程人员进行技术指导。与此同时,星球将联合知名企业发布3D视觉相关算法开发岗位以及项目对接信息,打造成集技术与就业为一体的铁杆粉丝聚集区,近4000星球成员为创造更好的AI世界共同进步,知识星球入口:
学习3D视觉核心技术,扫描查看介绍,3天内无条件退款
圈里有高质量教程资料、可答疑解惑、助你高效解决问题
觉得有用,麻烦给个赞和在看~