基于深度学习的光学字符识别

深度 OCR – 像人类一样阅读

深度 OCR 是一种基于深度学习的光学字符识别(OCR)方法,使机器视觉更接近人类的阅读能力。

与现有的 OCR 算法相比,深度 OCR 可以更加稳健地定位字符,无论其方向、字体或极性如何。通过自动分组字符,可以识别整个单词。这显著提高了识别性能,避免了类似字符的误解读。

深度 OCR

优点

稳健的识别:深度 OCR 可以更精确地定位字符,即使是不同的字体和旋转角度。

单词识别:字符的自动分组使得能够识别整个单词,相较于传统的 OCR 方法,显著提升了性能。

提高稳定性:深度 OCR 可以处理大图像,并提供更好的整体稳定性。

额外字符集支持:深度 OCR 支持多种字符和字体,扩展了应用范围。

置信度评分:对于每个识别的字符,都会计算置信度值,提高识别准确性,并允许进一步优化结果。

深度 OCR 训练

在 HALCON 22.05 中,MVTec 引入了深度 OCR:这是一项训练功能,允许用户将技术适配到其特定应用中。该训练功能使得能够创建自定义数据集进行 OCR 识别,解决了稀有或专用字体以及挑战性文本条件(如低对比度)的识别问题。

无需训练的深度 OCR

无需训练工作量,即可使用
  • 对常见字体和布局的标准文本具有出色的识别能力。
  • 适用于典型 OCR 应用的快速启动。

带训练的深度 OCR

适应特定应用
  • 高精度识别低对比度文本,例如轮胎或挑战性表面上的文本。
  • 针对稀有或专用字符和印刷风格的高级训练能力。
  • 为特定 OCR 任务优化的模型性能。

深度 OCR 训练的优势

  • 基于用户特定数据的训练:为文本阅读应用创建自定义训练数据集。
  • 困难文本:非常适合低对比度的难读文本(例如轮胎标签)。
  • 特殊字体:稀有的特殊字符和印刷风格也可以轻松进行训练。

它是如何运作的

实用教程

在 HALCON 和 MERLIC 中的可用性

深度 OCR 在 HALCON 和 MVTec MERLIC 中均可使用。

深度 OCR 训练目前仅在 HALCON 中提供。只需在 MVTec Deep Learning Tool 中标注数据,并将其无缝集成到 HALCON 中。
了解更多关于 HALCON 的信息

MERLIC 使得用户无需深入编程知识即可轻松使用深度 OCR。
了解更多关于 MERLIC 的信息

我们的知识与服务

从我们的专业经验中受益

实用洞察与专业知识
阅读我们的白皮书!

下载阅读我们的白皮书,获取工业机器视觉的实用洞察与专业知识,了解关键技术、行业趋势,以及可支持技术和战略决策的实际应用。

量身打造
评估您的应用需求

您想了解我们是否能为您的行业提供合适的解决方案吗?请将您的软件应用设计发送给我们,我们的专家将为您进行评估。

MVTec Software