Ausgangssituation:
Vision Language Action (VLA)-Modell- und World-Modell-basierte Ansätze versprechen einen Paradigmenwechsel beim Training von Robotersystemen für komplexe Manipulationsaufgaben mit variablen Randbedingungen. Eine wesentliche Herausforderung ist jedoch der enorme Datenbedarf, insbesondere die Generierung hochwertiger Trainingsdaten. Die oft als optimal angesehene Datenerfassung durch direkte Teleoperation des Endsystems ist extrem zeit- und kostenintensiv sowie durch menschliche Fähigkeiten limitiert. Simulationsbasierte Daten leiden wiederum oft unter mangelnder Übertragbarkeit auf reale Systeme. Es besteht ein dringender Bedarf, effizientere Wege zur Trainingsdatenerfassung für VLA-basierte Systeme im industriellen Umfeld zu finden und zu evaluieren.
Zielsetzung:
Ziel dieser Arbeit ist die Entwicklung einer Methodik zur effizienten Generierung von Trainingsdaten für VLA-basierte Robotersysteme in einem industriellen Fertigungsumfeld. Im Rahmen der Arbeit sollen verschiedene Ansätze zur Datengenerierung wie simulationsbasierte Daten, Lernen aus First-Person-View-Videos und Mischformen implementiert, analysiert und deren Einsetzbarkeit sowie Effektivität bewertet werden. Hieraus soll abschließend eine Methodik abgeleitet werden, die die effiziente Datenerzeugung für industrialisierbare VLA-basierte Ansätze ermöglicht.
- Einarbeitung in den Stand der Technik zu VLA-Modellen, Trainingsdatengenerierung und industrieller Robotik
- Strukturierte Literaturrecherche zu bestehenden Ansätzen zur Trainingsdatengenerierung sowie zu relevanten Benchmarks zur Bewertung der Effektivität verschiedener Datenerfassungsmethoden
- Umsetzung und Analyse der Einsetzbarkeit verschiedener Trainingsdatenerfassungsansätze in industriellen Prozessen
- Durchführung eines strukturierten Versuchsplans zur Erfassung von Trainingsdaten aus unterschiedlichen Quellen und anschließendes Finetuning eines VLA-Modells mit verschiedenen Datensätzen für einen exemplarischen Prozess
- Vergleich der erzielten Ergebnisse und Untersuchung des Einflusses verschiedener Datenmischstrategien auf die Modellperformanz
- Ableitung einer Methodik zur effizienten Generierung von Trainingsdaten für VLA-modellbasierte Robotermanipulation
- Strukturierte Dokumentation der Arbeit und Präsentation der Ergebnisse
Vorkenntnisse:
- Interesse an industrieller Robotik und künstlicher Intelligenz
- Grundlegende Programmierkenntnisse in Python von Vorteil, aber nicht erforderlich
- Sehr gute Deutsch- und Englisch-Kenntnisse
Der Arbeitsumfang kann entsprechend der Art der Abschlussarbeit angepasst werden.
Bewerbungen ausschließlich per E-Mail mit aussagekräftigen Unterlagen (Lebenslauf, vollständige Notenübersicht)
Kategorien:
Forschungsbereich:
RobotikArt der Arbeit:
Bachelorarbeit, MasterarbeitStudiengang:
IPEM, Maschinenbau, Mechatronik, Medizintechnik, WirtschaftsingenieurwesenTechnologiefeld:
Additive Mechatronics, Künstliche Intelligenz und Maschinelles Lernen, Medizintechnik, Autonome Mobile SystemeKontakt:
Patrick Ziegler, M.Sc.
Department Maschinenbau (MB)
Lehrstuhl für Fertigungsautomatisierung und Produktionssystematik (FAPS, Prof. Franke)
- Telefon: +491622039759
- E-Mail: patrick.ziegler@faps.fau.de

![Siemens AG [BA/MA Extern]: Entwicklung einer Methodik zur effizienten Generierung von Trainingsdaten für Vision Language Action (VLA) Modell-basierte Robotermanipulation](/wp-content/uploads/2026/03/Symbolbild.png)