这里不打算重复网上已经有的答案,想去具体了解的可以参考,
https://medium.com/swlh/end-to-end-text-recognition-model-deployment-on-cpu-gpu-and-vpu-with-openvino-cb727114c5a9
open_model_zoo/README.md at master · openvinotoolkit/open_model_zoo · GitHub
如何编译与下载模型请参考这里,
OpenVINO2022.1+open_model_zoo例程的编译与使用_高精度计算机视觉的博客-CSDN博客
这里里只讲一下我自己的用法,
如图所示,输入的是
-i D:/open_model_zoo/testimg
-m_td D:/open_model_zoo/tools/model_tools/intel/text-detection-0003/FP32/text-detection-0003.xml
-m_tr D:/open_model_zoo/tools/model_tools/intel/text-recognition-0015/text-recognition-0015-encoder/FP32/text-recognition-0015-encoder.xml
-dt simple
-tr_pt_first
-tr_o_blb_nm "logits"
-m_tr_ss "?0123456789abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ"
其中,所有待测的图片都放在这里,
D:/open_model_zoo/testimg
程序中的源码有一个地方要改一下,
int key = cv::waitKey(); //
这里原来是:int key = cv::waitKey(1),太快了,基本上还没看清就跳到下一张了,所以我要求按一下任意键(Q表示完全退出)继续下一张。
如果你只想测某一张具体的图片,使用这样的格式即可,
-i D:/open_model_zoo/testimg/001.png
本文结束。