Visionäre Bytes

Trotz seiner entscheidenden Rolle für den Fortschritt der modernen Industrie werden die Komplexität und die Herausforderungen des Datenmanagements in der industriellen Bildverarbeitung und im Deep Learning weitgehend übersehen. Die erweiterte Datenverarbeitung bietet jedoch große Chancen, wie Martina Chmelícková, CBO bei DataVision, in diesem Artikel aufzeigt.

Martina Chmelícková, CBO bei DataVision

Die Welt der industriellen Technologie ändert sich zunehmend durch Machine Vision und Deep Learning. Der richtige Umgang mit Daten wird in der Industrie immer wichtiger, insbesondere jetzt, da die maschinelle Bildverarbeitung immer beliebter wird.

Das Handling von Bilddaten für Deep-Learning-getriebene Bildverarbeitung ist komplex. Die Genauigkeit der Daten und die Qualität des Datensatzes sind entscheidend für das Training von Deep-Learning-Modellen oder die Entwicklung von robusten Bildverarbeitungsanwendungen. Das Datenmanagement in diesen Bereichen bedeutet den Umgang mit einer großen Menge an Informationen. Dabei geht es nicht nur darum, Daten zu strukturieren, sondern auch sie zu sichern und zu schützen, insbesondere wenn es sich um Bilder handelt. Das richtige Datenmanagement ist also der Schlüssel zur Lösung der heutigen technischen Herausforderungen und zur Gestaltung des zukünftigen Datenmanagements.

In vielen Unternehmen, die industrielle Bildverarbeitung einsetzen, stellt das Datenmanagement eine große Herausforderung dar. Oft werden die Bilddaten einfach auf verschiedenen Festplatten und wenig strukturiert gespeichert. Auch die gemeinsame Nutzung dieser Daten durch Teams im selben Unternehmen kann sich als schwierig erweisen. In den meisten Fällen benötigen sie die richtigen Systeme, um Daten einfach zu senden oder darauf zuzugreifen. Dies erschwert die Zusammenarbeit unnötig.

Außerdem ist es nicht immer einfach, Bilddaten in die Cloud zu verschieben. Das Setup der unternehmenseigenen Computersysteme macht dies zu einer ziemlichen Herausforderung. Aber immer mehr Unternehmen erkennen, dass sie für das nötige Datenmanagement einen besseren Weg finden müssen. Sie suchen nach guten Lösungen zur Vereinfachung der Cloudnutzung, damit sie mehr aus ihren KI- und Bildverarbeitungsprojekten machen können.

Im Datenlabyrinth der industriellen Bildverarbeitung

Sobald Unternehmen mit Machine-Vision-Technologien arbeiten, stellen sie fest, dass das Datenmanagement eine ganz neue Disziplin ist. Denn die üblichen Methoden der Datenverarbeitung funktionieren bei Bildern und Videos nicht mehr. Hier geht es nicht nur darum, diese großen Datenmengen zu strukturieren. Die größere Herausforderung besteht darin, sie zu verschieben, weiterzugeben und weltweit zu nutzen.

Die Bedeutung gut organisierter Daten hat mit dem Aufkommen von Deep Learning außerordentlich an Bedeutung gewonnen. Deep-Learning-Modelle übertreffen in zahlreichen Bildverarbeitungsaufgaben durchweg traditionelle Machine-Vision-Algorithmen. Die Anwendung von Deep Learning liefert sogar Lösungen für komplexe Aufgaben, die zuvor nicht zufriedenstellend gelöst werden konnten. Der Einsatz von Deep Learning in der industriellen Bildverarbeitung ist vor allem in den Bereichen Qualitätskontrolle, Textlesung, Objekterkennung o.ä. interessant.

Das Training eines leistungsstarken Deep-Learning-Modells ist jedoch mit Kosten verbunden. Die größte Herausforderung besteht darin, den richtigen Datensatz zu erstellen – einen, der ausreichend groß ist, eine Vielzahl von Bildern enthält, eine ausgewogene Verteilung der Klassen beibehält und qualitativ hochwertige Annotationen einschließt. Um dies zu erreichen, muss ein Unternehmen in Bezug auf seine Datenerfassungspipeline und seine Datenverwaltungswerkzeuge gut vorbereitet sein.

Man sieht also: Wir befinden uns in einer Zeit, in der eine gute Datenverwaltung wirklich wichtig ist, um das Beste aus der industriellen Bildverarbeitung herauszuholen.

Gut definierte Bildverarbeitungspipeline

Wie kann ein Bildverarbeitungs-Workflow von der Datenverwaltung profitieren? Unabhängig davon, ob es sich um traditionelle Bildverarbeitungsmethoden oder Deep Learning handelt, werden zunächst Datensätze definiert. Diese Datensätze dienen dazu, ein Modell zu erstellen und seine Robustheit zu überprüfen. Einfacher ausgedrückt: Es muss ein Bilder-Satz festgelegt werden, der bei der Entwicklung von Algorithmen (im Falle der traditionellen Bildverarbeitung) oder für das Training eines Deep-Learning-Modells verwendet wird. Die Erstellung hochwertiger Datensätze kann durch den Einsatz des richtigen Datenmanagement-Tools erheblich verbessert werden.

Ein solches Tool sollte Funktionen für die Datenorganisation bieten, darunter Möglichkeiten für einfache Datenaufnahme (mit Datenerfassung in Echtzeit), Datenanreicherung, Bild-Annotationen, Zusammenarbeit und gemeinsame Nutzung, Aufteilung von Datensätzen (Training-Validierung-Test), Versionskontrolle, API-Zugang für die Integration und mehr. Eine gut definierte Bildverarbeitungspipeline gewährleistet die nahtlose Integration aller verwendeten Tools.

Wenn zum Beispiel HALCON von MVTec für die industrielle Bildverarbeitung verwendet wird, sollte es einfach sein, mit Bildern zu arbeiten, die direkt aus einem Datenmanagement-Tool kommen. Die Entwickler sollten nicht mit technischen Details wie der Datenquelle oder der Frage, ob die Daten in der neuesten Version vorliegen, belastet werden. Eine weitere Funktion, die unter Bildverarbeitungsingenieuren weit verbreitet ist, ist die Möglichkeit, die Ergebnisse eines Algorithmus zu visualisieren. Das Datenmanagement-Tool sollte die Möglichkeit bieten, im Bild eine Visualisierung des Bildverarbeitungsergebnisses einzublenden.

Die Zukunft des Datenmanagements in der industriellen Bildverarbeitung

Zum Datenmanagement in der industriellen Bildverarbeitung ist abschließend festzustellen, dass die sich abzeichnende Landschaft von bedeutenden Fortschritten in den Bereichen KI, maschinellem Lernen und verbesserten Netzwerkinfrastrukturen wie 5G geprägt ist. Die Entwicklung von Machine-Vision-Anwendungen ist eng mit Fortschritten bei der Datenverwaltung verbunden. So wird geeignetes Datenmanagement die künftigen Anwendungen dieser Technologie bestimmen.