十二月 30, 2021 | Developers Corner

Deep OCR – 技巧和诀窍

您是否已经体验过 Deep OCR 相比传统规则方法带来的性能提升?在本文中,我们将展示实用的技巧和窍门,帮助您进一步优化 Deep OCR 结果。

Deep OCR 在许多方面都优于传统方法。最明显的一点是识别率提高。不过,不受字体类型、文本极性和方向的影响,也是 Deep OCR 的强大优势。在本文中,我们会向您介绍一些可以进一步优化 Deep OCR 结果的技巧和诀窍。

首先,您应花点时间考虑适合自己应用的模式。Deep OCR 有两种模式可供选择:“检测”和“识别”。“检测”模式会在图像中找到作为字的相连字符,然后提供字的边界框。“识别”模式会将裁剪后的图像转换为机器可读的文本。

Deep OCR detection example
Detection and Recognition in Deep OCR

很多应用同时需要“检测”和“识别”两种模式。在这种情况下,可以使用“自动”模式。请记住,HALCON 提供了一个强大的工具箱,可以用来自己编写算法以便检测目标文本。如果您只对充满文本的图像中的特定文本行感兴趣,或是想要缩短运行时间,这可能会非常有用。

下面我们会为您提供一些关于如何在“检测”和“识别”模式下提高 Deep OCR 性能的提示。不过在评估结果之前,您应先看图像数据,考虑采用预处理方法,例如增强对比度。

检测

如果想要改进“检测”结果,应该看看得分图。您可以在 DeepOcrResult 句柄中找到得分图。特别是字符得分图和链接得分图,可帮助您深入了解“检测”结果。这些信息可用于调整重要参数“detection_min_word_score”和“detection_min_character_score”。

如果文本已经水平对齐,请将参数“detective_orientation”设置为 0,这样就不会出现矩形未完全对齐的问题。

对于包含细小文本的大幅图像,可以使用一个强大的参数“detection_tiling”。将此参数设置为“true”,可从内部将图像拆分为多个拼贴。拼贴过程完全自动完成,无需担心拼贴图像,只需享受文本检测结果即可。但是,请记住运行时间的增加取决于所处理图像的大小。

认可

如果在识别模式下得到了意外的结果,建议打开 DeepOcrResult 句柄查看用于识别的预处理图像。在许多情况下,这个图像可以解释“识别”失败的原因。最常见的问题是文本行的长度,可通过设置参数“recognition_image_width”来处理。可在标准示例“deep_ocr_workflow.hdev”中找到详细示例。

最后,往往也值得重新考虑 Deep OCR 是不是正确选择。即使 Deep OCR 优于基于规则的方法,仍有一些用例(速度限制、特定字体类型、硬件限制或像素精确分割)证明适合选择传统方法。

发布日期: 十二月 30, 2021

更多新闻

MVTec MERLIC 26.03 现已上市
借助 MERLIC 26.03,机器视觉应用的开发与运行将变得更加一致且更具可扩展性。该版本引入了统一的 MVTec 版本命名格式(YY.MM),并提供了更简化的、基于软件包的许可模式,同时支持灵活的附加组件。…
了解更多
MERLIC
新版深度学习工具显著提升了 Deep OCR 的性能
凭借 Deep OCR 对齐功能及其他改进,深度学习工具 26.03 提升了 OCR 应用的速度和效率。新模型、优化后的训练以及对 CUDA 12.8 的支持,在降低内存占用量的同时带来了更高的性能。
了解更多
深度学习工具
MVTec Academy 新课程:马赛克拼接——使用 HALCON 进行图像拼接
本基础培训将向您介绍HALCON中的拼接技术。本课程将向您展示如何将多张图像组合成一张大型拼接图像。因此,借助这项技术,您可以生成物体或场景的大幅图像,而这些内容原本无法完全纳入单个摄像头的视野范围内。…
了解更多
Academy
HALCON
使用 HALCON 进行并行编程
本高级培训将向您介绍使用 HALCON 进行并行编程的概念。通过应用并行编程,您可以优化 HALCON 程序的性能,并充分利用多核或多处理器硬件的优势。
了解更多
Academy
HALCON
MVTec 软件管理器 1.6.5:中国地区下载速度全面提升
为提升中国地区用户的软件下载性能,MVTec 现已提供专用的代理缓存服务器。通过 MVTec Software Manager 进行的软件下载将变得更加快速和稳定。
了解更多
MVTec
HDevelopEVO 预览版:最新更新现已推出
更快、更直观且更具交互性的编程体验:所有 HALCON 用户现在均可下载全新的 IDE 预览版。
了解更多
HALCON
MVTec License Server 25.12 新版本发布
借助 MVTec License Server Cloud-Ready 25.12,HALCON 许可证可以借用,从而在网络中断或离线情况下仍可运行。
了解更多
MVTec
MVTec 深度学习工具 25.12 现已发布
2025 年 12 月 04 日,我们发布了 MVTec 深度学习工具的新版本 25.12,从而进一步发展了我们基于人工智能的机器视觉产品组合。
了解更多
深度学习工具
MVTec Academy 全新课程:《图像采集:适用于现代相机技术的接口》
本培训课程将向你介绍 HALCON 中新增的图像采集算子。通过实践练习,你将学习必要的技术术语和概念,并进一步加深理解。
了解更多
Academy
HALCON
HALCON 25.11 现已上市
新版本的 MVTec HALCON 现已可供下载。此次版本再次带来了多项优化与全新功能,其中包括全新的 持续学习(Continual Learning)– 分类 技术,使分类模型的训练与更新过程更加快速、灵活。
了解更多
HALCON
MVTec 线上学院新课程 "通过语言接口进行代码集成"
本高级课程讲解如何在使用 C、C++、C#、Visual Basic .NET 和 Python 编写的软件项目中集成并使用 HALCON 库。
了解更多
Academy
HALCON
MVTec Academy 新课程:使用 GigE Vision 进行图像采集
本高级课程深入讲解如何在 HALCON 中使用 GigE Vision 相机。
了解更多
Academy
HALCON
MVTec MERLIC 5.8 现已上市
MVTec MERLIC 5.8 让视觉应用的开发和运行比以往更加简单,具有改进的错误处理、集中式配方管理以及更快速、更灵活的部署。
了解更多
MERLIC
MVTec Academy 新课程:手眼标定
在本高级课程中,您将学习如何使用 HALCON 进行手眼标定。
了解更多
Academy
HALCON
MVTec License Server 25.08 新版本发布
本次更新使 License Server 更容易作为 Windows 系统服务运行,并提供了更便捷的文档访问。
了解更多
MVTec
新MVTec学院课程“检查条码和2D数据码的打印质量”
在本高级培训课程中,您将学习如何使用HALCON和MERLIC对条码和数据码进行打印质量检测。
了解更多
Academy
HALCON
MERLIC
新MVTec学院课程“缺陷检测”
本基础培训将向您介绍使用MVTec HALCON进行缺陷检测。您将学习不同的方法以及在开发缺陷检测应用程序时需要考虑的因素。随后,您将使用不同方法解决一些具有挑战性的应用案例。
了解更多
Academy
HALCON
MVTec HALCON software box with surfer – new version
HALCON 25.05 现已上市
新版本的 MVTec HALCON 现已可供下载。 HALCON 25.05 引入了形状匹配扩展参数估计的第一次迭代。在此版本中,MVTec 专注于提高 HALCON 的易用性和基于规则的机器视觉。
了解更多
HALCON
MVTec Academy 新课程:“为 MERLIC 开发自定义工具”
本高级培训将向您介绍如何为MERLIC开发自定义工具,以扩展现有的MERLIC工具库。
了解更多
Academy
MERLIC
MVTec 深度学习工具 25.04 现已发布
2025 年 4 月 30 日,我们发布了 MVTec 深度学习工具的新版本 25.04,从而进一步发展了我们基于人工智能的机器视觉产品组合。
了解更多
深度学习工具
MVTec MERLIC 5.7 现已上市
借助新版本 MERLIC 5.7,MVTec 延续了 MERLIC 的既定路线——轻松的流程集成与强大的机器视觉方法相结合。新版本 提高了 MERLIC 运行环境(RTE) 的可用性,并优化了通信接口的操作。
了解更多
MERLIC
全新 MVTec Academy 课程:学习全球上下文异常检测
高级在线课程讲解如何准备数据、训练和应用 MVTec 全球上下文异常检测模型。
了解更多
Academy
HALCON
MERLIC
任务完成:MVTec 圣诞问答活动!
随着我们的圣诞问答活动圆满结束,我们很高兴与大家分享精彩的结果!
了解更多
MVTec
MVTec Software