Masterprojekt: Data Mining Cup 2013 "Kauft sie oder kauft sie nicht?"

Montag, Juli 15, 2013

Data Mining Cup 2013 - "Kauft sie oder kauft sie nicht?"

Vier Studenten des Masterprojektes Data Mining nahmen am diesjährigen Data Mining Cup teil und erreichten den Platz 22 von 66 eingereichten Lösungen.

Folgendes Szenario sollte modelliert werden: Ein Webshop beobachtet seine Besucher (überwiegend Frauen), während sie sich auf der Webseite bewegen. Es soll die Frage beantwortet werden, ob der Besucher seinen Warenkorb letztendlich bestellt oder nicht. Die Trainingsdaten umfassen 50.000 Sessions mit Kundendaten (Alter, Adresscode, Zahlungsanzahl, Acountlebensdauer, Datum der letzten Bestellung, Score, ...) und Sessiondaten (Dauer der Session, Preisverlauf angesehener Artikel, Preise in den Warenkorb gelegter Artikel, Zustandsverlauf im Bestellprozess, ...). Die Klasse ist dann "Session endet mit Bestellung" oder "Session endet ohne Bestellung". Hintergrund der Aufgabe ist das gewünschte automatische Anbieten von Rabatten oder Upselling-Möglichkeiten während einer Session.

Das Team legte im Data Mining-Prozess besonderen Wert auf die zuverlässige Schätzung des zu erwartenden Generalisierungsfehlers, dessen Größenordnung durch die endgültigen Fehlerwerte bestätigt wurde. Es gelang dem Team 93.8% der unbekannten Kundensessions richtig zu klassifizieren (zum Vergleich erreichte das Gewinnerteam der Uni Dortmund eine Erfolgsrate von 97.2%). Eine Übersicht aller teilnehmenden Teams im nebenstehenden Poster.

Es ist also mit Data Mining möglich, das Nutzerverhalten in diesem Szenario sicher vorherzusagen, wahrscheinlich sogar, bevor dem Nutzer selbst seine Entscheidung bewusst wird.