基于深度学习的光学字符识别

深度 OCR – 像人类一样阅读

深度 OCR 是一种基于深度学习的光学字符识别（OCR）方法，使机器视觉更接近人类的阅读能力。

与现有的 OCR 算法相比，深度 OCR 可以更加稳健地定位字符，无论其方向、字体或极性如何。通过自动分组字符，可以识别整个单词。这显著提高了识别性能，避免了类似字符的误解读。

深度 OCR

优点

稳健的识别：深度 OCR 可以更精确地定位字符，即使是不同的字体和旋转角度。
单词识别：字符的自动分组使得能够识别整个单词，相较于传统的 OCR 方法，显著提升了性能。
提高稳定性：深度 OCR 可以处理大图像，并提供更好的整体稳定性。
额外字符集支持：深度 OCR 支持多种字符和字体，扩展了应用范围。
置信度评分：对于每个识别的字符，都会计算置信度值，提高识别准确性，并允许进一步优化结果。

深度 OCR 训练

在 HALCON 22.05 中，MVTec 引入了深度 OCR：这是一项训练功能，允许用户将技术适配到其特定应用中。该训练功能使得能够创建自定义数据集进行 OCR 识别，解决了稀有或专用字体以及挑战性文本条件（如低对比度）的识别问题。

Tire with number and text recognition – incorrect results without Deep OCR training.

无需训练的深度 OCR

无需训练工作量，即可使用

对常见字体和布局的标准文本具有出色的识别能力。
适用于典型 OCR 应用的快速启动。

Tire with number and text recognition –correctly recognized characters with Deep OCR.

带训练的深度 OCR

适应特定应用

高精度识别低对比度文本，例如轮胎或挑战性表面上的文本。
针对稀有或专用字符和印刷风格的高级训练能力。
为特定 OCR 任务优化的模型性能。

深度 OCR 训练的优势

基于用户特定数据的训练：为文本阅读应用创建自定义训练数据集。
困难文本：非常适合低对比度的难读文本（例如轮胎标签）。
特殊字体：稀有的特殊字符和印刷风格也可以轻松进行训练。

它是如何运作的

实用教程

在 HALCON 和 MERLIC 中的可用性

深度 OCR 在 HALCON 和 MVTec MERLIC 中均可使用。

深度 OCR 训练目前仅在 HALCON 中提供。只需在 MVTec Deep Learning Tool 中标注数据，并将其无缝集成到 HALCON 中。
了解更多关于 HALCON 的信息

MERLIC 使得用户无需深入编程知识即可轻松使用深度 OCR。
了解更多关于 MERLIC 的信息

我们的知识与服务

从我们的专业经验中受益

实用洞察与专业知识

阅读我们的白皮书！

下载阅读我们的白皮书，获取工业机器视觉的实用洞察与专业知识，了解关键技术、行业趋势，以及可支持技术和战略决策的实际应用。

前往白皮书

量身打造

评估您的应用需求

您想了解我们是否能为您的行业提供合适的解决方案吗？请将您的软件应用设计发送给我们，我们的专家将为您进行评估。