Kosteneffiziente Defekterkennung in Leichtmetall-Gussteilen mit Machine Learning

Warum KI für die zerstörungsfreie Qualitätssicherung im Produktionskontext einsetzen?

In diesem Projekt konzentrieren wir uns auf die zerstörungsfreie Erkennung von Defekten in Leichtmetall-Gussteilen, insbesondere von Autoreifenfelgen. Die gängigen automatisierten Qualitätssicherungssysteme für solche Komponenten verwenden Röntgenbilder und Algorithmen, die auf klassischen Bildverarbeitungsmethoden basieren. Obwohl diese Methoden in der Regel gut geeignet sind, um viele relevante Defekte zu erkennen, erfordert ihr Einsatz Zeit und spezialisiertes Fachpersonal für die Einrichtung, insbesondere bei neuen Bauteilen. KI-basierte Methoden bieten das Potenzial für flexiblere Lösungen, insbesondere in Situationen, in denen Fachexperten knapp sind oder häufige Rekalibrierungen aufgrund der Produktvielfalt erforderlich sind. Unser gemeinsames Projekt mit dem Entwicklungszentrum Röntgentechnik des Fraunhofer IIS (EZRT) zielt darauf ab, eine KI zu entwickeln, die Defekte in Röntgenbildern der Gussteile mit hoher Genauigkeit erkennen kann.

Röntgenbild einer Felge mit annotierten Defekten. Quelle: Schön, T., Gosswami, B., Hvingelby, R., Suth, D., Kemeter, L. M., & Sierak, P. (2022). Automated defect recognition in X-ray projections using neural networks trained on simulated and real-world data.

Dateneffizienz als Schlüssel für KI-Anwendungen in der Produktion

Die Beschaffung und Aufbereitung von realen Daten sind entscheidend für den Erfolg von KI-Anwendungen in der Produktion, stellen jedoch oft einen großen Kostenfaktor dar. Im Fall der Leichtmetallfelgen erfordert die manuelle Erkennung und Markierung (Labeling) von Defekten auf Bildbasis durch einen Experten viel Zeit und Ressourcen. Da herkömmliche KI-Systeme für die Bilderkennung eine große Anzahl gelabelter Daten für das Training und die Evaluation benötigen, sind damit erhebliche Kosten verbunden. Unser Ziel in diesem Projekt war es, eine KI mit möglichst geringem Datenaufwand zu entwickeln. Zu diesem Zweck hat das Fraunhofer EZRT eine eigene Simulationspipeline für Röntgenbilder entwickelt, mit der synthetische Trainingsdaten in großen Mengen und zu vernachlässigbaren Kosten generiert werden können.

Strategische Herangehensweise an die KI-Entwicklung mit begrenzten Ressourcen

Wie bei den meisten spezifischen KI-Anwendungen im industriellen Kontext sind die Ressourcen für die KI-Entwicklung begrenzt. Dies ist ein wesentlicher Unterschied zu bekannten Basismodellen wie ChatGPT, für deren Entwicklung keine Kosten und Mühen gescheut wurden. Eine zentrale Frage in solchen Fällen ist daher, wie das begrenzte Budget optimal eingesetzt werden kann, um eine gute Leistung der KI zu erzielen. Im Fall der Leichtmetallfelgen hätte allein die Beschaffung und Annotation großer Mengen von Röntgenbildern einen erheblichen Teil der Projektressourcen beansprucht. Alternativ haben wir einen Teil des Budgets in die Generierung von synthetischen Daten investiert. Obwohl die Entwicklungskosten für das Simulationstool berücksichtigt werden müssen, ist die Erzeugung von Massendaten kein Problem mehr. Es ist auch denkbar, eine Mischung aus simulierten und realen Daten für das Training der KI zu verwenden.

Vergleich von simulierten Daten (links) mit realen Daten (rechts). Quelle: Schön, T., Gosswami, B., Hvingelby, R., Suth, D., Kemeter, L. M., & Sierak, P. (2022). Automated defect recognition in X-ray projections using neural networks trained on simulated and real-world data.

Kann ein KI-System zur Erkennung von Defekten in Gussteilen effizient nur mit simulierten Daten trainiert werden?

Die kurze Antwort lautet Nein. Im besten Fall hätten die simulierten Daten allein ausgereicht, um eine gut funktionierende KI zu trainieren. Eine KI, die ausschließlich mit simulierten Daten trainiert wurde, liefert zwar gute Ergebnisse auf synthetischen Testdaten, versagt jedoch bei der Anwendung auf realen Testdaten. Der Grund dafür liegt in der sogenannten Domänenverschiebung (»Domain Shift«) zwischen den simulierten Daten und den realen Röntgenbildern, die für den Anwendungsfall relevant sind. Kurz gesagt bedeutet dies, dass trotz der Ähnlichkeit zwischen simulierten und realen Daten systematische Unterschiede bestehen, die dazu führen, dass die KI Defekte in realen Daten nicht erkennen kann. Selbst die Hinzunahme einiger weniger realer Bilder hat nicht die gewünschten Ergebnisse erzielt.

Lösungsansatz für die dateneffiziente KI-Entwicklung

Daher ist es unerlässlich, auch annotierte reale Daten zu verwenden. Die nächste entscheidende Frage ist, wie man die kostengünstigeren simulierten Daten dennoch effektiv nutzen kann und welches Verhältnis von realen zu simulierten Daten gewählt werden sollte. Im Kontext der Leichtmetallfelgen wurden verschiedene Strategien zur KI-Entwicklung und -Schulung verglichen.

1. Full supervision: Ca. 2000 von Experten annotierte reale Röntgenbilder standen dem Projektteam für Training, Validierung und Test zur Verfügung.
2. Unsupervised-Domain-Adaptation: Zum Training der KI wurden neben den simulierten Daten nur nicht-annotierte reale Bilder verwendet.
3. Semi-Supervised-Domain-Adaptation: Zum Training der KI wurden neben den simulierten Daten größtenteils nicht-annotierte reale Bilder sowie zusätzlich einige wenige annotierte reale Bilder verwendet.

Die letzten beiden Strategien zeichnen sich durch einen geringeren Bedarf an annotierten realen Daten aus, was die Kosten massiv reduziert. Allerdings erfordern sie einen höheren Entwicklungsaufwand, da zusätzliche Domain-Adaptation Ansätze implementiert werden müssen.

 

Wollen Sie die Ergebnisse auch für Ihren Anwendungsfall nutzen?

Das Problem ist kein Einzelfall, denn Daten und insbesondere deren Annotationen sind selten in großen Mengen verfügbar. Auch Domänenverschiebungen wie von simulierten auf reale Daten sind in der Praxis keine Seltenheit. Unterschiedliche Kameratypen oder Lichtverhältnisse können bereits ausreichen, um die Performance eines KI-Modells zu schwächen. Projektverantwortliche kommen somit schnell in eine Situation, in der das Budget geschickt allokiert werden muss. Wie komplex das sein kann, zeigt das beschriebene Beispiel der Leichtmetallfelgen.

In diesem Projekt konnten wir zeigen, dass die Domain-Adaptation Trainingsstrategien in Bezug auf die Dateneffizienz dem klassischen vollständig überwachten Training deutlich überlegen sind. Es war möglich, eine ähnlich gute Performance wie unter »full supervision« mit deutlich weniger oder sogar komplett ohne annotierte reale Daten zu erreichen. Hierbei ist zu beachten, dass zwar einerseits Kosten für die Annotation eingespart werden, andererseits aber zusätzliche Kosten für die Entwicklung von Simulation und Methodik entstehen. Je nach Kosten für Annotation, Entwicklung und Beschaffung simulierter und nicht-gelabelter realer Daten muss die optimale Allokation der Projektressourcen individuell bestimmt werden.

Wenn Sie planen, eine KI zu entwickeln, unterstützen wir Sie gerne bei der Entscheidung zur optimalen Allokation Ihrer Ressourcen.

 

Das könnte Sie auch interessieren

 

Forschungsfeld

KI-basierte Bedarfsprognosen für Logistik, Handel und Verkehr

Wir bringen KI-basierte Bedarfsprognosen in der Logistik, dem Handel und der Produktion in die Anwendung, um Vorhersagen zu verbessern und Prognose-Unsicherheiten zu quantifizieren.

Abteilung »Analytics«

Die Gruppe Data Science ist eine von vier Gruppen der Abteilung »Analytics«, die neue Methoden und Verfahren für anwendungsnahe Data Analytics und KI entwickelt. Ziel der Abteilung ist aus scheinbar unbeherrschbaren Datenmengen und -materialien handhabbare, qualitative Daten udn Informationen für Ihre Kunden zu generieren.  

 

 

Fokusprojekt

ADA Lovelace Center for Analytics, Data and Applications

Kompetenzzentrum für Data Analytics und KI in der Industrie

Das ADA Lovelace Center verbindet auf einzigartige Weise KI-Forschung mit KI-Anwendungen der Industrie. Hier können sich die Partner untereinander vernetzen, vom Know-how des anderen profitieren und an gemeinsamen Projekten arbeiten.