Masterprojekt: Data Mining beim Widerstandsschweißen
Anwendungsbeispiel zur Klassifikation von Wertereihen bei industriellen Daten
Widerstandspunktschweißen ist das im Stahl-Karosseriebau am häufigsten verwendete Fügeverfahren. Dabei spielt der richtige Zeitpunkt des Elektrodenwechsels eine kritische Rolle. Um haltbare Schweißpunkte zu garantieren, werden die Elektroden anhand pessimistischer, empirisch bestimmter Heuristiken in der Praxis sehr früh gewechselt. Insbesondere beim Schweißen hochfester beschichteter Bleche mit hohen Strömen erreichen die Heuristiken ihre Grenzen. Könnte die Standzeit der Elektroden anhand eines Prognosemodells optimiert werden, sind jährliche volkswirtschaftliche Einsparungen an den Elektroden-Rohstoffen (überwiegend Kupfer) in Millionenhöhe zu erwarten.
Die Arbeitsgruppe Thermisches Fügen der TU Dresden untersucht die Verschleißmechanismen der Elektrodenkappen mit dem Ziel neue zerstörungsfreie Prüfverfahren für das Widerstandspunktschweißen zu entwickeln. In Kooperation mit dem Masterprojekt Data Mining der FH Brandenburg erfolgt eine Untersuchung, mit welcher Güte sich der für die Stabilität eines Schweißpunktes relevante Punktdurchmesser aus Verlaufsgrößen des Schweißvorganges bestimmen lässt. Die besondere Schwierigkeit der Data Mining-Aufgabe besteht in der Definition geeigneter Merkmale aus Wertereihen und der Schätzung der Modellgüte bei dem vorliegenden geringen Umfang der klassifizierten Stichprobe. Der Prozess selbst ist nach Ansicht der Technologen schwierig zu modellieren, da beim Schweißen hochfester Stähle mit hohen Stromstärken Spritzer flüssigen Materials auftreten können.
Daten
Die Rohdaten wurden im Schweißlabor der TU Dresden experimentell erhoben und liegen pro Schweißvorgang in Form multivariater Zeitreihen als TDMS-File vor. Hierzu wurden mit sechs Elektroden je 2000 Schweißpunkte geschweißt und dabei 10 Prozessgrößen (sog. Kanäle), wie bspw. Spannung, im Kilohertz-Bereich aufgezeichnet. An 400 Schweißpunkten dieser Stichprobe wurde die Zielgröße Punktdurchmesser manuell bestimmt. Die Daten sind nicht öffentlich.
Data Cleaning und Explorative Analyse
Die Daten enthielten fehlende Werte, Triggerfehler, Ausreißer, Fehlmessungen sowie Störungen durch nicht erfasste Einflussgrößen, wie parallele Nutzung von Kühlkreisläufen durch andere Projekte. Die explorative Analyse half Datenfehler aufzudecken und zeigte deutlich die Prozessphasen des Schweißprozesses, führte jedoch zu keinen offensichtlichen Merkmalen.
Modellierung
Zur Merkmalsdefinition wurden die Prozessgrößenmit einer parameterfreien Methode [Wit83] kanalweise segmentiert und segmentweise deskriptive statistische Merkmale berechnet. Zusätzlich wurden neue Kanäle durch Verknüpfung bestehender Kanäle erzeugt [AH12]. Aus der damit definierten Menge von mehr als 1000 Merkmalen wurde anhand von klassenbasierten Filtermethoden eine geeignete Untermenge relevanter Merkmalen bestimmt. Bei der Evaluation linearer Modelle [Fah09] und Modellbäumen erwiesen sich Modellbäume [Qui92] als bessere und zudem transparente Wissensrepräsentation [MM12].
Als Erfolg wurde eine Prognose des Punktdurchmessers in einem 10%-Intervall um den echten Wert definiert (Erfolgsrate) und zur Modellauswahl der mittlere quadratische Fehler verwendet. Die Datenmenge wurde im Holdout-Verfahren disjunkt in 90% Trainings- und 10% Testdaten geteilt. Die Modellauswahl erfolgte auf den Trainingsdaten mit 10-facher Kreuzvalidierung. Die Analyseskripte und Zwischendatenmengen wurden versioniert, somit sind alle Ergebnisse mit den Originaldaten reproduzierbar.
Erste Ergebnisse
Der gewählte Ansatz konnte den echten Punktdurchmesser in 75% der Testfälle im 10%-Intervall korrekt vorhersagen. Dies ist unter Berücksichtigung der technologischen Schwierigkeiten ein gutes Ergebnis. Das finale Modell ist menschenlesbar und seine Plausibilität kann mit den Prozessexperten diskutiert werden. Die Datenverarbeitungswerkzeuge wurden entwickelt und können für ähnliche Analysen verwendet und erweitert werden. Ein nächstes Projekt wird das Analyse-Verfahren auf einen technologisch einfacheren Schweißprozess anwenden und um strukturbasierte Merkmale erweitern.
[AH12] Benjamin Arndt and Benjamin Hoffmann. Segmentierung und Merkmalsdefinition mehrkanaliger Messdaten zur Prognose bei einem punktförmigen Fügeverfahren. In 14. Nachwuchswissenschaftlerkonferenz, Brandenburg, 18.04.2013.
[Fah09] Fahrmeir, L., Künstler, R., Pigeot, I. and Tutz, G. (2009, 5., verb. Aufl.). Statistik - Der Weg zur Datenanalyse. Springer Verlag, 2009
[MM12] Curtis Mosters and Josef Mögelin. Merkmalsselektion und transparente Modellierung zur Prognose einer Zielgröße bei einem punktförmigen Fügeverfahren. In 14. Nachwuchswissenschaftlerkonferenz, Brandenburg, 18.04.2013.
[Qui92] Ross J. Quinlan. Learning with Continuous Classes. In: 5th Australian Joint Conference on Artificial Intelligence, pages 343–348. Singapore, 1992.
[Wit83] Andrew P. Witkin. Scale-space filtering. In Proceedings of the Eighth international joint conference on Artificial intelligence - Volume 2, IJCAI’83, pages 1019–1022, San Francisco, CA, USA, 1983. Morgan Kaufmann Publishers Inc.
Abb 1: Das vorsichtige Öffnen eines Schweißpunktes ist aufwändig, aber zur korrekten Vermessung des Punktdurchmessers notwendig