您当前的位置: 首页 >  git

不脱发的程序猿

暂无认证

  • 1浏览

    0关注

    492博文

    0收益

  • 0浏览

    0点赞

    0打赏

    0留言

私信
关注
热门博文

GitHub开源:支持100多种语言的OCR文字识别

不脱发的程序猿 发布时间:2020-10-04 16:57:51 ,浏览量:1

之前为给位朋友分享过:GitHub开源:17M超轻量级中文OCR模型、支持NCNN推理,该项目仅仅支持中文OCR识别,本篇博文将分享支持100多种语言的OCR文字识别项目:Tesseract OCR。

Tesseract是一款由HP实验室开发由Google维护的开源OCR(Optical Character Recognition , 光学字符识别)引擎。Tesseract 支持 unicode(UTF-8),可以“开箱即用” 识别100多种语言。Tesseract 架构如下所示:

 

 使用Tesseract项目识别中文,效果如下所示:

使用Tesseract项目识别英文,效果如下所示:

 项目地址请参见:Tesseract OCR

关注
打赏
1664101891
查看更多评论
立即登录/注册

微信扫码登录

0.0420s