Deep Learning und das Training

An künstlicher Intelligenz (KI) ist derzeit kein Vorbeikommen. Das Thema wird sehr breit und bisweilen kontrovers diskutiert. Dabei machen vor allem große, generative Datenmodelle Furore – ChatGPT lässt grüßen! Im industriellen Kontext sind die Diskussionen sachlicher. Vielleicht auch, weil hier eher Chancen gesehen werden. Für die industrielle Bildverarbeitung sorgt die KI-Methode Deep Learning auf Basis neuronaler Netze für bisher nie gekannte Erkennungsraten. Bei der Weiterentwicklung von Deep-Learning Algorithmen zählt MVTec zu den Technologieführern. So bringt MVTec im Jahr 2024 zwei besonders interessante Features auf den Markt: „Uncertainty Estimation“ und „Continual Learning“.

Christian Eckstein, Product Manager & Business Developer bei MVTec

Deep Learning und die industrielle Bildverarbeitung sind bereits seit 2012 ein erfolgreiches Paar: Es begann mit AlexNet, einer Architektur auf Basis eines neuronalen Netzwerks (Convolutional Neural Network). Mittlerweile hat sich Deep Learning als feste Größe in der Bildverarbeitung etabliert. Seit 2012 haben sich jedoch viele Vorzeichen verändert. Beispielsweise ist die Anzahl von Stakeholdern sowie wissenschaftlichen Veröffentlichungen stark gewachsen und die Komplexität der KI-Modellarchitekturen hat sich enorm erhöht. Ein weiterer Trend: Die Größe von Datensätzen sowie die Performance von Hardware für Training und Inferenz nimmt permanent zu. Zudem erobern neue, mächtige KI-Modelle wie ChatGPT den Markt.

Deep Learning wiederum erfreut sich in der industriellen Produktion wachsender Beliebtheit und kommt in immer mehr Applikationen zum Einsatz. Dies bedeutet auch einen steigenden Bedarf an qualifizierten Data Scientists und gut ausgebildeten Deep-Learning-Experten. Dazu kommt: Dank immer schnellerer Hardware und spezialisierter Deep-Learning-Beschleuniger erreicht die Performance der Algorithmen ein bisher nicht gekanntes Niveau – was dem Vertrauen in die Technologie einen enormen Schub verleiht.

Herausforderungen bei Deep Learning meistern

Trotz all der Euphorie – in der Praxis sind beim Deep-Learning-Einsatz noch einige Herausforderungen zu meistern: So werden für das Training in der Regel sehr große Datenmengen in Form von Beispielbildern benötigt. Damit umzugehen, verursacht einen hohen Aufwand und entsprechende Kosten, die insbesondere kleine und mittelständische Unternehmen (KMU) häufig nur schwer stemmen können. Vor allem Bilder von fehlerbehafteten Objekten, sogenannte Schlechtbilder, stehen aufgrund ihrer Seltenheit bei bereits hoher Produktionsqualität nicht im geforderten Umfang zur Verfügung.

Eine weitere Herausforderung: Deep Learning ist in der Regel sehr ressourcenhungrig. Herkömmliche Prozessoren (CPU), wie sie häufig in Produktionsanlagen zu finden sind, verfügen jedoch nicht immer über genügend Rechenleistung, was das Training mit großen Datensätzen im Feld praktisch unmöglich macht.

Neue Deep-Learning-Features schaffen Abhilfe

MVTec adressiert diese Herausforderungen mit zwei neu entwickelten Technologien, die im Jahr 2024 verfügbar sein werden:

Zunächst wird das Feature „Uncertainty Estimation“ zur sicheren Erkennung von Veränderungen beitragen. Solche Veränderungen können sein: Schwankungen bei der Beleuchtung, neue Defekttypen, Abnutzung an der Produktionsanlage, geänderte Objekte in der Inspektion, schwarze Schwäne.

Deep-Learning-Anwendungen können die Welt nur in dem Rahmen begreifen, in dem sie trainiert wurden. Bei Veränderungen bewertet das Modell die Bilder weiterhin nach den bekannten Kriterien. Erscheint beispielsweise ein neuer Fehlertyp (zu dem eben noch keine Kriterien trainiert wurden) oder ein komplett anderes Objekt, wird das System vor Herausforderungen gestellt: Es versucht nun, die veränderten Bedingungen in eine bekannte Kategorie einzuordnen. Dies scheitert jedoch daran, dass die Kriterien eben nicht bekannt sind. Und genau hier setzt Uncertainty Estimation an: Als zusätzliche Prüfinstanz zur Klassifikation validiert die Technologie die Unsicherheit der Entscheidung durch eine realistische Schätzung.

Nachtraining kann erforderlich werden

Dabei ist ausschlaggebend, ob sich das neue Modell innerhalb oder außerhalb der Merkmalsverteilung des zugrundeliegenden Datensatzes befindet. Unterscheidet sich das inspizierte Bild nur unwesentlich vom Trainingsdatensatz, markiert Uncertainty Estimation es als „Near-Distribution“. Dies kann in der Praxis beispielsweise durch eine gelbe Lampe signalisiert werden, sodass eine manuelle Prüfung erfolgt. Liegt das Objekt hingegen komplett außerhalb des Merkmalsraums, wird es als „Out-of-Distribution“ klassifiziert, was wiederum durch ein rotes Licht angezeigt werden kann. Häufen sich diese Fälle, ist der Trainingsdatensatz offensichtlich nicht mehr repräsentativ für die jeweilige Inspektionsaufgabe. Dann sollte nachtrainiert werden.

Ein solches Nachtraining gestaltet sich jedoch oft als zeit- und ressourcenaufwändig. Hierfür wird in der Regel eine GPU benötigt, die an der betreffenden Anlage meist nicht verfügbar ist. Um die Hardwareanforderungen und die Trainingszeit zu reduzieren, sollte das Nachtraining mit nur wenigen neuen Bildern auskommen. Hieraus ergibt sich jedoch eine Herausforderung: Ähnlich wie ein Mensch neigt das System dazu, neue Informationen überzubewerten. Das Modell klassifiziert zwar erfolgreich die neuen Fälle, vernachlässigt aber die alten Bilder, was zu Fehlern führen kann.

Um den Aufwand für das Nachtraining zu reduzieren und dabei eine robuste Erkennungsrate zu gewährleisten, hat MVTec sein neues Feature „Continual Learning“ entwickelt: Damit lässt sich ein bestehendes Modell mit einer geringen Anzahl von Bildern nachtrainieren.

Hierfür reicht die Kapazität einer herkömmlichen CPU aus, sodass das Training direkt an der Anlage erfolgen kann. Das Training dauert je nach Anzahl der Bilder und verfügbarer Rechenleistung nur wenige Sekunden. Hierbei lassen sich einfach neue Bilder zu einer bestehenden oder einer neuen Klasse hinzufügen. Dazu ist kein tiefgehendes Machine-Vision-Know-how erforderlich, sodass der Bediener an der Maschine das Nachtraining in Eigenregie durchführen kann. Dadurch können Unternehmen den Aufwand für das Nachtraining deutlich reduzieren, den gesamten Prozess beschleunigen und Kosten einsparen.

Neue Technologien fördern Vertrauen in Deep Learning

Deep Learning gewinnt für industrielle Wertschöpfungsketten immer mehr an Bedeutung. Damit die Technologie mit den wachsenden Anforderungen Schritt halten kann und für Unternehmen weiterhin eine nützliche Option bleibt, bedarf es einer kontinuierlichen Weiterentwicklung. MVTec stellt hierfür seine beiden neuen Features Uncertainty Estimation und Continual Learning bereit. Diese ebnen den Weg, um direkt auf dem Shopfloor Veränderungen und neue Bedingungen zuverlässig zu erkennen und schnell darauf zu reagieren. Somit fördern die beiden Technologien das Vertrauen in Deep Learning und stärken im Ergebnis dessen Einsatz in der industriellen Produktion.