Projektbeschreibung

Eine zentrale Herausforderung für den Einsatz datenbasierter Methoden zur Analyse und Optimierung von Prozessen in der Elektronikproduktion besteht in der Unausgeglichenheit der Daten. Trotz der großen anfallenden Datenmengen in Hochvolumenproduktionen ist der Informationsgehalt der Daten begrenzt, da bei der überwiegenden Mehrheit der Inspektionen keine Fehler erkannt werden. Um einen Fehlerschlupf zu vermeiden sind die automatisierten Inspektionsschritte, welche in der Regel auf konventionellen Bildverarbeitungsmethoden basieren, so sensitiv eingestellt, dass meist eine relativ hohe Rate an Pseudofehlern entsteht. Diese Bauteile erfüllen eigentlich die Spezifikationen, werden jedoch fälschlicherweise als fehlerhaft eingestuft, sodass ein hoher manueller Nachprüfaufwand entsteht.

Um diesen Aufwand zu reduzieren können als fehlerhaft identifizierte Bauteile mittels KI-Methoden nachgeprüft werden, sodass ein Teil der Pseudofehler erkannt wird, was eine Reduktion des Prüfaufwands zur Folge hat. Die Qualität der eingesetzten KI-Methoden ist entscheidend von der verfügbaren Datenmenge und -qualität abhängig. Um trotz der unausgeglichenen Datenlage in der Elektronikproduktion eine große Datenbasis zu Verfügung zu haben, werden im Forschungsvorhaben ColEP Vorteile und informationstechnische Lösungen der kollaborativen Verwertung von Prozess-, Qualitäts- und Metadaten von Elektronikfertigern und Anlagenherstellern untersucht. Dabei werden anhand ausgewählter KI-Anwendungsfälle in der Elektronikproduktion Verbesserungspotentiale analysiert, für die kollaborative Datensätze besonders geeignet erscheinen. Diesbezüglich erfolgt eine automatisierte Anonymisierung und Aufbereitung der Daten, um eine Grundsicherheit zu gewährleisten. Weiterhin wird unter Nutzung der GAIA-X-Konzepte ein Framework erarbeitet, dass die Souveränität der Daten für den Besitzer sicherstellen soll.

In diesem Kontext werden sowohl Frameworks zum föderalen Lernen als auch die Einbindung in existierende souveräne Dateninfrastrukturen untersucht. Im Gegensatz zu zentralisiertem Lernen, bei welchem Daten aus unterschiedlichen Quellen auf einem zentralen Server gesammelt werden, bleiben beim föderalen Lernen Trainingsdaten jederzeit lokal bei den teilnehmenden Unternehmen, wodurch Datensicherheit und -souveränität gewährleistet sind. Das Modelltraining erfolgt lokal, woraufhin die trainierten Modelle zu einem zentralen Server gesendet werden, welcher diese zu einem globalen Modell vereint.

Ziel des Projekts ist es, die Anwendbarkeit von föderalem Lernen im industriellen Kontext anhand von Use Cases in der Elektronikproduktion zu untersuchen. Dabei soll sowohl ein Vergleich der Modellperformance beim föderalen Lernen mit zentralisiertem und lokalem Lernen stattfinden. Zudem sollen datenschutzspezifische Vorteile von föderalem Lernen untersucht und sicherheitsrelevante Herausforderungen wie Datenmanipulation und Rekonstruktion von Trainingsdaten kritisch betrachtet und durch geeignete Methoden verhindert werden.