创造力是新技术的必要条件

机器视觉行业因创新而蓬勃发展。但是,新技术是如何创造出来,又是如何投入实施的呢?MVTec Software GmbH 研究部门的研究工程师 Rebecca König 带我们参观了她的工作场所,并解释了从初步设想到实现的过程。

Rebecca König, MVTec 研究工程师

那是十二月一个寒冷的早晨, 正值降临节。我们与 Rebecca König 在 MVTec 慕尼黑总部的小厨房里小坐。当咖啡流进马克杯 时,我们问 Rebecca,她的工作成就感 来自何处。这位研究人员稍作停顿,想 了想。她自 2017 年以来一直在 MVTec 的研究部门工作,此前在慕尼黑工业大学学习数学。

取得学位后,她在 MVTec 撰写了硕士论文,并作为实习生在这里工作。将奶泡斟到卡布奇诺上面的时 候,Rebecca 给出了她的回答:“最好的部分是意识到自己开发的软件算法不仅是模拟时好用,实践中也好用。”

客户反馈是新开发工作的起点

Rebecca 的工作吸引她的地方同样也是整个机器视觉领域的重要一环。这是因 为,正是公司研发团队众多大大小小的创新让这个行业如此活力满满。“MVTec 许多新的开发工作都源于客户的具体问题。在研究部门,我们的任务是为现有方法不能解决的问题找到新的方法,”Rebecca 解释说。

基于数据集建构新方法

Rebecca 和她的十多名同事采取的方法以高校研究为基础。他们首先基于文献进行研究,检查另一个类似案例是否已经存在科学论文甚至数据集。这种数据集是大型的图像文件,可以用于测试新方法和新技术。数据集扮演着重要的角色。如果还没有数据集,MVTec 就 会开发自己的数据集,再将其提供给研究界。

事实上,这甚至可以说是 Rebecca 和同 事们的目标之一:以数据集和出版物的形式,用自己的研究工作为整个研究界提供支持。“我们以可下载的格式提供 数据集,还会定期参加专家会议,介绍 我们的工作,并与其他研究人员交流思路,”她说,“这为我们的工作带来了令人兴奋的新想法。”不过,MVTec 研究 部门的首要目标是尽快在公司的软件产 品中实施最新的研究成果。为此,部门除了 10 名固定工作人员之外,还聘用 了一些博士生和硕士生。

换个地方。我们现在到了 MVTec 应用 实验室,这是 Rebecca 的几个工作站 之一。我们在这里看到了几台设备、相 机系统,还有一个机器人。他们就是在 这里为贸易展会开发应用、模拟实际用例,以及创建之前提到的数据集。根据具体案例,用来开发新方法的数据集需 要大约 2000 幅图像。这些都需要制作。“我们面临着特别高的现实需求, 因此构建全面的数据集对于开发可靠的方法至关重要,”Rebecca 解释说。

新算法需要创造力

我们又到了公司的另一个区域,现在 坐在 Rebecca 的办公室工作站旁。数 据集创建完成后,实际工作就是从这里开始。我们的下一杯咖啡也已经冲好。“我们收到的上一次实际咨询无法通过现有方法解决。这意味着我们需要创造新方法。深度学习可能会帮助我们,”Rebecca 满怀希望地说。多年来, 深度学习一直是本领域的热门技术。与 其他公司一样,MVTec 也投入了大量时间和脑力来开发新的深度学习方法。

公司最近取得的一项成功 是“全局上下文异常值检测”,这是异常值检测的进化版本,可以理解逻辑内容并识别与整个图像相关的错误。

例如,可以检测位置滑移或错误印刷的瓶子标签,或者电路板等产品上缺失的 组件。这种形式的技术尚属世界首创。

回到眼下的问题。Rebecca 正在开发一 种新的深度学习网络架构。针对这一目的编写的算法是网络的基础,随后会为其提供数据集输入。换句话说,深 度学习模型会使用部分数据进行训练。 其余数据则用于测试和评估算法解决问 题的效果。实现目标的方法不止一种, 需要发挥创造力。例如,可以通过在单 个算法中巧妙地结合两种互补的方法,创造性地实现目标。这样可以同时利用 两种算法的优点。另一个例子是调整算 法的各个环节,充分优化以发挥其全部性能。“这正是我喜欢这份工作的原因,”Rebecca 说。接着她补充道:“我 们团队特意给自己留出了很大的自由空间,这样就可以直接进行各种尝试。我们甚至还会承担高风险的项目,尽管并不知道是否可行。失败也没关系。”

将研究成果集成到 MVTec 软件产品中

一项新技术如何弥补从理论到实践的差 距?一种新方法为面市做好准备后,就 需要实施在 MVTec 的软件产品中。“为此,我们会从研究部门转为开发部门。 我们会成为开发团队的一员,帮助将算法集成到软件中,”Rebecca 说。下一 个软件版本一发布,客户就可以用上新技术,接着等待他们反馈就可以了。