机器视觉领域的深度学习 – 是颠覆性技术,还是传统方法的补充?

人人都在讨论人工智能 (AI)。在机器视觉领域,深度学习作为人工智能的一种形式,尤其吸引人们的关注。这项技术可以实现稳定的检出率,为全新的应用铺平了道路。但 是,深度学习真的是人们所说的颠覆性技术吗?还是它巨大潜力实际上在于与传统图像处理方法的结合?

Christian Eckstein MVTec 产品经理兼业务开发人员

从聊天机器人到翻译软件、数字助理甚 自动驾驶汽车,人工智能已经成为生活中许多领域不可或缺的一部分。它在工业环境中也日益普及,例如机器人领域以及按照工业物联网(又称工业 4.0)规范进行的机器数字联网。在机器视觉领域,一种特殊形式的人工智能越来越流行:深度学习。这项技术基于卷积神经网络 (CNN),被视为是对机器视觉的真正推动。

如图所示,可以通过异常值检测来检查瓶颈是否存在缺陷。

出色的物体检测结果

有一点是明确的:深度学习在物体检测领域取得了前所未有的成果。如何做到这一点?如同 所有的人工智能技术一样,深度 学习能够自主学习。这意味着不需要针对每个用例 单独编写算法。相关的背景知识如下:

深度学习的基础是神经网络。可以 通过训练神经网络,让技术能够分析大量图像数据(大数据),从中检测出某些模式和关联,再将其应用于新的案例。

机器视觉利用这一原理,例如通过使用深度学习来识别典型特征,再使用这些特征,以更高的精度对要检测的物体或缺陷进行分配或分类。

由此产生了很多优势:例如,由于不需要为检测过程手动定义关键特征和物体属性,可以显著减少机器视觉过程需要的相关开发工作。此外,这项技术 还为以前无法使用传统图像处理方法实现的新应用打开了大门。

这方面的一个很好的例子是 MVTec 的新功能“全局上下文异常值检测”:使用深度学习理解图像的逻辑内容,从而让全新类型缺陷的识别成为可能。例如,位置滑移或印刷错误的瓶子标签,或者电路板等产品上缺失的元件,可以作为缺陷检出。

深度学习有其局限性

尽管深度学习对于机器视觉的益处显然十分巨大, 但它也存在局限性。这项技术非常适合于分类、物 体识别和语义分割这三个传统应用领域,其优势也 可以在这些方面得到最佳利用。

问题在于神经网络内部决策的可追溯 性。作为一个“黑箱”,这项技 术几乎无法让人深入了解其 内部流程。然而,这种深入了解在工业环境中非常重要,正如 下面的例子所说明的:如果一名工程师负责电子 设备生产中某个半导体元件的质量,就需要详细 记录整个检查工作流程。如果不能在黑箱中对其进行无缝跟踪,那么在未能检出缺陷的情况下,就需要由工程师作出解释。传统图像处理方法在这方面更加透明,因为特定决策所依据的图像属性会有具体且透明的描述。

深度学习方法通过对齐矩形进行物体识别的示意图。

需要高性能的硬件平台

另一个限制是,深度学习有时会涉及大量训练,相 应的资源需求水平较高。生产线还需要高性能的硬件平台,但并非所有工业应用都具备,尤其是在 嵌入式设备上使用基于 AI 的机器视觉技术时。此外,深度学习在某些应用领域的规模过大,因此很难为这项技术在性能和存储方面的高要求以及相应的高成本找到合理的理由。在这种情况下,使用传统机器视觉技术往往能够更优雅、更简单、更经济高效地处理任务。

为了不错过人工智能技术的种种优势,理想的解决方案是以智能的方式结合深度学习和基于规则的传统机器视觉方法。

通过这种混合方法,两种技术都可以针对手头的应用充分发挥各自的优势。例如,传统方法可用于执行预处理步骤,如正确定位物体。然后,可以通过使用较小图像区域的深度学习,高效地判断物体是否为不合格品。这些技术结合起来,可以更加透明 地跟踪用于分类物体或缺陷的具体决策标准。