LEADTOOLS OCR文字识别引擎是一种光学字符识别软件开发工具包(SDK),它可以为开发人员、集成商、业务流程外包商(BPO)和原始设备制造商(OEM)提供强大、简单易用的控件,从而非常容易的将OCR技术集成到应用和设备中。
LEADTOOLS为.NET(C# & VB.NET)、C/C++、Java和Web开发者提供了快速且精确度高的先进文字识别技术SDK。利用LEADTOOLS OCR文字识别工具包,可以快速的开发健壮的、可扩展的、高性能识别的文档处理应用程序,这些应用程序可提取出扫描文件中的文本,将图像转化为文本搜索格式,如PDF、PDF/A、DOC、DOCX、XML、XPS等。
LEADTOOLS广泛支持40余种字符集,编程者通过提供多语言的解决方案扩展用户群,包括英语、西班牙语、法语、德语、日语、中文、阿拉伯语及更多。
LEADTOOLS OCR SDK技术的概述- 在任何应用和环境下,均可快速、准确和可靠地完成光学字符识别
- 大量文件的批处理
- 单一和多页文档
- Web和云应用
- 全面的最大性能多线程支持
- 功能齐全的SDK
- 用于图像到最终文档的一次性识别的高级类
- 全面定制的低层次功能
- 支持多文字识别引擎
- 用于机器打印文本的OCR文字识别
- 用于手写文本的ICR
- 用于检查处理的MICR
- 用于护照号码的MRZ&MRP
- 识别40余种语言和字符集的文本,包括英语、西班牙语、法语、德语、日语、中文、阿拉伯语等
- 拼写检查和字典支持
- 自动检测、分割和识别同一个文档中的多种语言
- 整页分析和区域识别
- 针对扫描文件和图片,有独一无二的彩色和黑白图像识别
- 自动的文件清除
- 全方位的噪点去除
- Undither文本
- 点阵校正
- 从表中删除行的选项
- 自动的文档预处理
- 扫描文件的抗扭斜处理
- 以完整文档或逐页的模式检测和更正文件的方向(翻转的或颠倒的)
- 完全配置的识别引擎
- 用字符和数字过滤器缩小可能的结果
- 多次表决技术提高准确率
- 跟踪和发展回调
- 启用/禁用快速文本识别的字体特征
- 文本结果的全面报告
- 字符的位置、大小和基线
- 字符属性(词末、行末、段末等)
- 字体属性(等宽字体、比例、衬线、无衬线、粗体、斜体、下划线、删除线)
- 置信度
- 可将识别出的文本存到一块区域或一个页面上,不需要存入到外部文件中
- 输出可搜索的文件格式,如PDF、PDF/A、DOC、DOCX、XML、XPS等,并保持原来的外观和感觉
- 可检测文本字体的特色(字体类型名称、样式、大小、粗体、斜体、下划线、删除线等)
- 位置
- 表重建
- 布局
- 图形