机器视觉领域的深度学习 – 是颠覆性技术,还是传统方法的补充?
人人都在讨论人工智能 (AI)。在机器视觉领域,深度学习作为人工智能的一种形式,尤其吸引人们的关注。这项技术可以实现稳定的检出率,为全新的应用铺平了道路。但 是,深度学习真的是人们所说的颠覆性技术吗?还是它巨大潜力实际上在于与传统图像处理方法的结合?
从聊天机器人到翻译软件、数字助理甚 自动驾驶汽车,人工智能已经成为生活中许多领域不可或缺的一部分。它在工业环境中也日益普及,例如机器人领域以及按照工业物联网(又称工业 4.0)规范进行的机器数字联网。在机器视觉领域,一种特殊形式的人工智能越来越流行:深度学习。这项技术基于卷积神经网络 (CNN),被视为是对机器视觉的真正推动。
出色的物体检测结果
有一点是明确的:深度学习在物体检测领域取得了前所未有的成果。如何做到这一点?如同 所有的人工智能技术一样,深度 学习能够自主学习。这意味着不需要针对每个用例 单独编写算法。相关的背景知识如下:
深度学习的基础是神经网络。可以 通过训练神经网络,让技术能够分析大量图像数据(大数据),从中检测出某些模式和关联,再将其应用于新的案例。
机器视觉利用这一原理,例如通过使用深度学习来识别典型特征,再使用这些特征,以更高的精度对要检测的物体或缺陷进行分配或分类。
由此产生了很多优势:例如,由于不需要为检测过程手动定义关键特征和物体属性,可以显著减少机器视觉过程需要的相关开发工作。此外,这项技术 还为以前无法使用传统图像处理方法实现的新应用打开了大门。
这方面的一个很好的例子是 MVTec 的新功能“全局上下文异常值检测”:使用深度学习理解图像的逻辑内容,从而让全新类型缺陷的识别成为可能。例如,位置滑移或印刷错误的瓶子标签,或者电路板等产品上缺失的元件,可以作为缺陷检出。
深度学习有其局限性
尽管深度学习对于机器视觉的益处显然十分巨大, 但它也存在局限性。这项技术非常适合于分类、物 体识别和语义分割这三个传统应用领域,其优势也 可以在这些方面得到最佳利用。
问题在于神经网络内部决策的可追溯 性。作为一个“黑箱”,这项技 术几乎无法让人深入了解其 内部流程。然而,这种深入了解在工业环境中非常重要,正如 下面的例子所说明的:如果一名工程师负责电子 设备生产中某个半导体元件的质量,就需要详细 记录整个检查工作流程。如果不能在黑箱中对其进行无缝跟踪,那么在未能检出缺陷的情况下,就需要由工程师作出解释。传统图像处理方法在这方面更加透明,因为特定决策所依据的图像属性会有具体且透明的描述。