Evaluation von Methoden zur Datenanalyse, -anonymisierung und -homogenisierung als Grundlage für zentralisiertes maschinelles Lernen (BA/PA/MA)

Ausgangssituation:

Datenbasierte Methoden zur Optimierung von Fertigungs- und Prüfprozessen finden zunehmend Anwendung in der Elektronikproduktion. Um die Performance dieser Methoden weiterhin zu verbessern, ist die Vergrößerung der zur Verfügung stehenden Datenmenge essentiell. Eine Möglichkeit dafür stellt die Kollaboration mehrerer Unternehmen dar, welche ihre gesammelten Produktionsdaten gemeinschaftlich nutzen. Aufgrund der Heterogenität von Daten unterschiedlicher Unternehmen ist bei einer Zusammenführung meist neben einer initialen Datenanlyse und -bereinigung auch eine Homogenisierung nötig. Zudem kann zur Einhaltung von Datenschutzaspekten eine Anonymisierung gefordert sein.

Aufgabenstellung:

Ziel dieser Arbeit ist die Implementierung einer Pipeline zur automatisierten Analyse, Homogenisierung und Anonymisierung von Daten. Diese sollen in einer zentralen Datenbasis gesammelt werden und somit als Grundlage für diverse ML Use Cases dienen können.

Mögliche Schwerpunkte der Arbeit können sein:

  • Erstellung einer Pipeline zur automatisierten Datenvorverarbeitung für zentralisiertes ML
  • Nutzung automatisierbarer, generalisierbarer und konfigurierbarer Ansätze
  • Identifikation und Entfernung fehlerhafter und unvollständiger Daten
  • Anonymisierung der Daten
  • Kombination und Vereinheitlichung der Datensätze
  • Vergleich von manueller Datenaufbereitung mit speziellen Softwaretools
  • Anwendung von ML auf dem zentralisierten Datensatz
  • Vergleich der ML-Performance mit und ohne Anonymisierung

Benefits:

  • Theoretisch 100%-Remote-Work möglich
  • Umfassender Einblick in Data Science Methoden als Grundlage für ML-Ansätze
  • Nach Wunsch praktische Implementierung identifizierter Methoden

Vorkenntnisse / Voraussetzungen:

  • Sehr gute Kenntnisse der deutschen oder englischen Sprache
  • Strukturierte und selbstständige Arbeitsweise
  • Vorkenntnisse in Python-Programmierung und Data Science wünschenswert, aber nicht erforderlich

Bewerbung:

Bewerbungen bitte mit Lebenslauf und aktueller Fächerübersicht per E-Mail an Ben.Rachinger@faps.fau.de. Für weitere Informationen über Umfang und genaue Ausrichtung der Arbeit stehe ich gerne für ein persönliches Gespräch zur Verfügung.

Kategorien:

Forschungsbereich:

Elektronikproduktion

Art der Arbeit:

Bachelorarbeit, Masterarbeit, Projektarbeit

Kontakt:

Ben Rachinger, M.Sc.

Department Maschinenbau (MB)
Lehrstuhl für Fertigungsautomatisierung und Produktionssystematik (FAPS, Prof. Franke)