[Translate to Chinese:]

使用 MVTec Deep OCR: 像人类一样阅读

Deep OCR,是一种基于整体深度学习的 OCR 方法。 这项新技术使机器视觉距人类阅读更近了一步。

与现有算法相比,Deep OCR 在字符方向、字体类型和极性是任意的情况下也可以稳健地定位字符。 自动对字符进行分组的功能实现了识别整个单词。 由于避免了例如对具有相似外观的字符的误解,因此极大地提高了识别性能。

通过这个技术可以更加稳健地处理大图像,并且结果现在包含具有对应置信度值的候选字符列表,可用于进一步改善识别结果。由于支持的字符集得到扩展,整体稳定性提高,应用范围更加广泛,也为客户带来效益。

Deep OCR 训练

MVTec 的 Deep OCR 使用户能够在众多应用中高效地解决文本阅读应用程序。自 HALCON 22.05 版本,这项技术得到了扩展,它支持基于用户自有数据的,特定于应用程序的培训功能。这甚至可以解决最复杂的应用程序,例如阅读对比度差的文本(例如,在轮胎上)。 另一个优点是还可以训练很少使用的特殊字符或打印样式。 深度 OCR 训练显着提高了性能和可用性,并使应用程序运行更加鲁棒。

教学视频,帮助您更好地使用 Deep OCR

Deep OCR 包含在 HALCON MERLIC 中,Deep OCR 训练目前仅包含在 HALCON 中。 您可以在 MVTec 深度学习工具中轻松标记您的数据,并且这些数据可以无缝集成到 HALCON 中。

了解更多其他深度学习方法:

图像分类 | 物体检测 | 语义分割 | 异常值检测 | 边缘提取 |实例分割