八月 08, 2022 | Developers Corner

Deep OCR 识别训练 - 再上新台阶

HALCON 的 Deep OCR 功能强大,可以检测和识别各种工业场景中的文字。然而,如果遇到特殊字体或者是想要读取外文字符,该怎么办?HALCON 22.05 可以对识别模型进行训练,读取您想要读取的特殊字母或字体,同时 Deep OCR 的性能也得到提升,完美适配您的应用。

众所周知,要进行任何训练,首先需要一个数据集。如何建立合适的 Deep OCR 数据集?

从 Deep Learning Tool 22.06 开始,您可以使用 Deep OCR 标记的新功能。有两种可能的使用方式:

  • 您可以从头开始创建 Deep OCR 数据集:只需在 Deep Learning Tool 中初始化一个 Deep OCR 项目(参见屏幕截图),然后加载想要标记的图像即可。为了进行标记,需要沿读取方向在单词周围绘制一个矩形,工具会给出文本建议,您可对其进行修正或确认(参见屏幕截图)。
  • 另外,您也可以使用标准示例 deep_ocr_prelabel_dataset.hdev。它会根据要标记的图像和预训练的 Deep OCR 给出的文本建议创建一个数据集。您可以将创建的数据集(hdict 文件)导入 Deep Learning Tool 22.06,并对建议的标记进行修正。

一般而言,训练图像应包括可代表推理过程中各种可能性的集合。此外,建议使用平衡的数据集,也就是所有字符的出现次数大致相同。当然,出色的结果需要良好的标记。良好的真值边界框看起来应当像是 Deep OCR 检测模型的输出(参见屏幕截图)。如果对数据集感到满意,您需要将数据集导出为 hdict 文件,然后进入下一步,也就是训练

标准示例 deep_ocr_recognition_training_workflow.hdev 会引导您完成训练工作流程。您只需在训练脚本中导入之前提取的数据集,并调整训练参数即可。其中一个重要的参数是识别模型的图像宽度。如果数据集包含带有大量字符的单词图像,就必须增加该宽度。请注意,ImageWidth 的设置与其默认值 (120) 相差越大,需要的训练数据就越多,因为预训练的模型是使用默认宽度进行训练的。因此,建议在训练过程中保持图像宽度接近默认值 (120)。周期数也需要根据训练误差及任务的复杂程度进行调整。

识别模型训练完成后,标准示例会告诉您如何评估微调后的模型,并将其与预训练的模型进行比较。

最后一步是将微调后的模型集成到您的推理步骤中,然后期待令您满意的结果。与往常一样,您可以在文档中找到更多信息(《解决方案指南 I》第 19.2 章)。 

发布日期: 八月 08, 2022

更多新闻

MVTec MERLIC 26.03 现已上市
借助 MERLIC 26.03,机器视觉应用的开发与运行将变得更加一致且更具可扩展性。该版本引入了统一的 MVTec 版本命名格式(YY.MM),并提供了更简化的、基于软件包的许可模式,同时支持灵活的附加组件。…
了解更多
MERLIC
新版深度学习工具显著提升了 Deep OCR 的性能
凭借 Deep OCR 对齐功能及其他改进,深度学习工具 26.03 提升了 OCR 应用的速度和效率。新模型、优化后的训练以及对 CUDA 12.8 的支持,在降低内存占用量的同时带来了更高的性能。
了解更多
深度学习工具
MVTec Academy 新课程:马赛克拼接——使用 HALCON 进行图像拼接
本基础培训将向您介绍HALCON中的拼接技术。本课程将向您展示如何将多张图像组合成一张大型拼接图像。因此,借助这项技术,您可以生成物体或场景的大幅图像,而这些内容原本无法完全纳入单个摄像头的视野范围内。…
了解更多
Academy
HALCON
使用 HALCON 进行并行编程
本高级培训将向您介绍使用 HALCON 进行并行编程的概念。通过应用并行编程,您可以优化 HALCON 程序的性能,并充分利用多核或多处理器硬件的优势。
了解更多
Academy
HALCON
MVTec 软件管理器 1.6.5:中国地区下载速度全面提升
为提升中国地区用户的软件下载性能,MVTec 现已提供专用的代理缓存服务器。通过 MVTec Software Manager 进行的软件下载将变得更加快速和稳定。
了解更多
MVTec
HDevelopEVO 预览版:最新更新现已推出
更快、更直观且更具交互性的编程体验:所有 HALCON 用户现在均可下载全新的 IDE 预览版。
了解更多
HALCON
MVTec License Server 25.12 新版本发布
借助 MVTec License Server Cloud-Ready 25.12,HALCON 许可证可以借用,从而在网络中断或离线情况下仍可运行。
了解更多
MVTec
MVTec 深度学习工具 25.12 现已发布
2025 年 12 月 04 日,我们发布了 MVTec 深度学习工具的新版本 25.12,从而进一步发展了我们基于人工智能的机器视觉产品组合。
了解更多
深度学习工具
MVTec Academy 全新课程:《图像采集:适用于现代相机技术的接口》
本培训课程将向你介绍 HALCON 中新增的图像采集算子。通过实践练习,你将学习必要的技术术语和概念,并进一步加深理解。
了解更多
Academy
HALCON
HALCON 25.11 现已上市
新版本的 MVTec HALCON 现已可供下载。此次版本再次带来了多项优化与全新功能,其中包括全新的 持续学习(Continual Learning)– 分类 技术,使分类模型的训练与更新过程更加快速、灵活。
了解更多
HALCON
MVTec 线上学院新课程 "通过语言接口进行代码集成"
本高级课程讲解如何在使用 C、C++、C#、Visual Basic .NET 和 Python 编写的软件项目中集成并使用 HALCON 库。
了解更多
Academy
HALCON
MVTec Academy 新课程:使用 GigE Vision 进行图像采集
本高级课程深入讲解如何在 HALCON 中使用 GigE Vision 相机。
了解更多
Academy
HALCON
MVTec MERLIC 5.8 现已上市
MVTec MERLIC 5.8 让视觉应用的开发和运行比以往更加简单,具有改进的错误处理、集中式配方管理以及更快速、更灵活的部署。
了解更多
MERLIC
MVTec Academy 新课程:手眼标定
在本高级课程中,您将学习如何使用 HALCON 进行手眼标定。
了解更多
Academy
HALCON
MVTec License Server 25.08 新版本发布
本次更新使 License Server 更容易作为 Windows 系统服务运行,并提供了更便捷的文档访问。
了解更多
MVTec
新MVTec学院课程“检查条码和2D数据码的打印质量”
在本高级培训课程中,您将学习如何使用HALCON和MERLIC对条码和数据码进行打印质量检测。
了解更多
Academy
HALCON
MERLIC
新MVTec学院课程“缺陷检测”
本基础培训将向您介绍使用MVTec HALCON进行缺陷检测。您将学习不同的方法以及在开发缺陷检测应用程序时需要考虑的因素。随后,您将使用不同方法解决一些具有挑战性的应用案例。
了解更多
Academy
HALCON
MVTec HALCON software box with surfer – new version
HALCON 25.05 现已上市
新版本的 MVTec HALCON 现已可供下载。 HALCON 25.05 引入了形状匹配扩展参数估计的第一次迭代。在此版本中,MVTec 专注于提高 HALCON 的易用性和基于规则的机器视觉。
了解更多
HALCON
MVTec Academy 新课程:“为 MERLIC 开发自定义工具”
本高级培训将向您介绍如何为MERLIC开发自定义工具,以扩展现有的MERLIC工具库。
了解更多
Academy
MERLIC
MVTec 深度学习工具 25.04 现已发布
2025 年 4 月 30 日,我们发布了 MVTec 深度学习工具的新版本 25.04,从而进一步发展了我们基于人工智能的机器视觉产品组合。
了解更多
深度学习工具
MVTec MERLIC 5.7 现已上市
借助新版本 MERLIC 5.7,MVTec 延续了 MERLIC 的既定路线——轻松的流程集成与强大的机器视觉方法相结合。新版本 提高了 MERLIC 运行环境(RTE) 的可用性,并优化了通信接口的操作。
了解更多
MERLIC
全新 MVTec Academy 课程:学习全球上下文异常检测
高级在线课程讲解如何准备数据、训练和应用 MVTec 全球上下文异常检测模型。
了解更多
Academy
HALCON
MERLIC
任务完成:MVTec 圣诞问答活动!
随着我们的圣诞问答活动圆满结束,我们很高兴与大家分享精彩的结果!
了解更多
MVTec
MVTec Software