Churn prediction — So funktioniert der Booster für Ihr Business!

September 8, 2019
Masiar Ighani

Dieser Artikel richtet sich sowohl an technisch versierte als auch businessorientierte LeserInnen, die gerne verstehen möchten, was genau Churn Prediction ist, und warum es für digital aufgestellte Unternehmen (oder solche, die es werden wollen) zum essentiellen Werkzeug wird. Wir werden zunächst eine Definition erstellen, anschließend den geschäftlichen Wert der Churn Prediction an einem interaktiven Beispiel erläutern, und zum Schluss die zugrundeliegenden Modelle beleuchten.

Was ist Churn Prediction?

Aus der Perspektive eines Unternehmens bezeichnet man die Abwanderung von Kunden als churn — und deren Vorhersage auf der Ebene einzelner Kunden als churn prediction. Es geht also darum die Abwandung von Kunden vorherzusagen um frühzeitig entsprechende Gegenmaßnahmen treffen zu können. Je nach Geschäftsmodell ist dieses Phänomen mehr oder weniger einfach zu messen: Für einen Netzbetreiber (Telko, Stromnetz) oder einen Streaming-Anbieter lässt es sich leicht feststellen — nämlich anhand davon, welche Kunden ihre Verträge nach Ablauf nicht erneuern. Aber woran macht Amazon fest, welche Kunden churnen – also zukünftig keine Bestellung mehr aufgeben werden? Ist es ein unterschrittener Schwellenwert in der Transaktionsfrequenz? Oder eine Unterschreitung des Durchschnittsumsatzes innerhalb eines bestimmten Zeitfensters? Die genaue Definition von churn hängt also maßgeblich vom geschäftlichen Kontext ab, und sollte je nach Zielsetzung gewählt werden. Die gute Nachricht ist: sobald man für den eigenen Geschäftskontext den churn definiert hat, ist man grundsätzlich in der Position, Vorhersagen errechnen zu können.

Wieso braucht mein Business Churn Prediction?

Sicherlich sind Unternehmen/r daran interessiert, möglichst viele umsatzrelevante Informationen über ihre Kunden zu sammeln um Produkte und Dienstleistung noch besser auf diese zuzuschneiden. Die womöglich relevanteste solcher Informationen ist die Wahrscheinlichkeit, mit der der Kunde abwandert. Ist man in der Lage, für die Vergangenheit zu bestimmen, welche Kunden gechurnt haben (z.B. aus Transaktionsaufzeichnungen), kann man diese Daten zunächst mit weiteren Informationen über den Kunden kombinieren. Diese können sowohl intern vorhanden sein (Nutzungsverhalten, soziodemografische Daten, Umfragen, etc.) als auch extern zugekauft werden (finanzielle Daten für B2B Geschäfte, Konsumentenverhalten, weitere soziodemografische Daten, etc.). Es gibt zwei entscheidende Gründe, warum sich dieser Aufwand lohnt.

Erstens ist es möglich, die abwandernden Kunden bestmöglich zu verstehen, sprich herauszufinden, in welchen Dimensionen sie sich von den restlichen Kunden unterscheiden. Clever visualisiert stellen diese Erkenntnisse großen Wert für die strategische Planung dar.

Zweitens lassen sich diese Muster nutzen, um Vorhersagen zu treffen, welche Kunden besonders churn-gefährdet sind. So lassen sich teure Kundenbindungsmaßnahmen auf individuelle Kunden abzielen und maßschneidern, um deren Effizienz (z.B.: die Anzahl Vertragsverlängerungen pro investiertem Euro) zu maximieren. Diesen zweiten, potenziell sehr lukrativen Bereich, werden wir nun anhand eines interaktiven Beispiels ausführlich beleuchten.

Ein interaktives Beispiel

Der Einfachheit halber bleiben wir bei einem fiktiven Beispiel eines Streaming-Dienstes—nennen wir ihn NetPrime. NetPrime verkauft aktuell einer Million Nutzern für 20 Euro pro Monat Abonnements (Das geschäftsrelevante Zeitintervall für die Churn Prediction ist in diesem Beispiel also ein Monat.)

NetPrime beobachtet leider, dass obwohl die Gesamtanzahl der Kunden konstant bleibt, jeden Monat 20 % der Kunden abwandern. Dies bedeutet also einen Umsatzverlust von 200 000 Euro pro Monat. NetPrime hat allerdings die Möglichkeit, churn-gefährdeten Kunden Spezialangebote zu machen, die mit einer gewissen Erfolgsrate (diese kann empirisch bestimmt werden, wir nehmen der Einfachheit halber 70 % an) den Churn verhindern können. Diese Kundenbindungsmaßnahme schlägt allerdings mit 10 Euro pro Kunde zu Buche. Nehmen wir an, NetPrime hat kann sich Spezialangebote für 10 000 Euro leisten, sprich 1000 Kunden ansprechen. Die Frage ist nun, welchen Kunden dieses Spezialangebot unterbreitet werden soll. Es wäre natürlich höchst ineffizient, sie an 1000 zufällig ausgewählte Kunden zu richten, schließlich würde NetPrime in diesem Fall nur durch Zufall 200 churner treffen; im Idealfall richtet NetPrime die Kundenbindungsmaßnahmen ausschließlich an churn-gefährdete Kunden. Ein Churn Prediction Modell schafft hier Abhilfe, indem es churn-Wahrscheinlichkeiten einzelner Kunden berechnet. Man bewertet die Güte eines solchen Modells mit der so genannten Präzision, sprich der Anteil an angesprochenen Kunden, die tatsächlich churnen würden. Betrachten wir für dieses Beispiel die Formeln für Kosten und Umsätze:

Kosten = Anzahl angesprochener Kunden * Kosten pro Kunde

Umsatz = Anzahl angesprochener Kunden * Präzision * Erfolgsrate * Umsatz pro Kunde

Es wird also ersichtlich, dass unsere Rendite, also die Differenz zwischen Umsatz und Kosten, maßgeblich davon abhängt, wie gezielt wir die Churn Präventionsmaßnahmen einsetzen können, und wie hoch deren Erfolgsrate ist. Um diesen Zusammenhang bestmöglich greifbar zu machen finden Sie nachfolgend eine interaktive Grafik, die den Profit je nach Präzision veranschaulicht. Sie haben die Möglichkeit, die verschiedenen Parameter zu verändern und so ein Gefühl dafür zu bekommen, ab welcher Modellgüte (Präzision) die Implementierung eines solchen Churn Prediction Modells rentabel wird.

Falls Sie sich an dieser Stelle fragen, warum sich hier alles um die Präzision dreht, und wie man diese denn überhaupt im Vorhinein bestimmen kann, kann ich Sie beruhigen: Dieser Frage widmen wir nämlich den letzten Teil dieses Artikels.

Wie funktionieren Churn Prediction Modelle?

Versetzen Sie sich für den Moment in die Lage der Modellierer bzw. der Data Scientists. In einem ersten Schritt geht es uns darum, alle verfügbaren Datenquellen zusammenzuführen. Wie zu Beginn angesprochen kann es sich hier um Transaktions- oder Nutzungsdaten, aber auch soziodemografische, finanzielle Daten oder auch Informationen zur Kundenzufriedenheit handeln. Danach wird für das relevante Transaktionsintervall (im obigen Beispiel 1 Monat) bestimmt, welche Kunden churnen. Das Ergebnis ist eine Reihe von monatlichen Tabellen, die für jeden Kunden (Reihen) alle möglichen Daten (Spalten), sowie einen churn-Wert (typischerweise Ja oder Nein) enthalten.

Im zweiten Schritt wird nun ein mathematisches Modell darauf trainiert, den Zusammenhang zwischen den Daten und dem churn-Wert zu lernen. Dazu wird der Datensatz zufällig in Trainingsdaten und einen Testdaten unterteilt (typischerweise ca. 80:20). Gängige Klassifikationsmodelle — die der technisch versierte Leser sicherlich erkennen wird — sind hier die logistische Regression, die Support Vector Maschine oder der Decision Tree (dt. Entscheidungsbaum), oder eine Kombination derselben (sog. „ensembles“). Es wird beim trainieren des Modells besonders darauf geachtet, dass es nur die nötigsten Muster in den Daten erkennt, und nicht einfach die Daten „auswendig lernt“ — eine wichtige Voraussetzung dafür, dass das Modell auf zukünftigen Daten gute Ergebnisse liefert (im Jargon nennt man das „generalisieren“).

Im dritten und letzten Schritt wird das Modell evaluiert. An dieser Stelle kann auch die Präzision geschätzt werden. Das Modell wurde zunächst auf den Trainingsdaten trainiert, um nun auf den Testdaten getestet zu werden. Unter „Testen“ versteht man in diesem Kontext das gegenüberstellen der Modellvorhersagen mit den tatsächlichen churn-Werten. Für die Vorhersagen auf den Testdaten kann dann die so genannte Confusion Matrix ausgewertet werden.

Die Präzision errechnet sich dann folgendermaßen:

Präzision = True positives / True positives + False positives

Weil das Modell die Testdaten zuvor noch nie gesehen hat, dient diese Präzision als Schätzung dafür, wie zuverlässig die Prognosen des Modells auf zukünftigen Daten sein werden. Die hier errechnete Präzision kann also mit der interaktiven Grafik verglichen werden, um zu ermitteln, ob ein gegebenes Modell gut genug funktioniert, um in der Praxis eine profitable Churn Prediction zu ermöglichen.

Was ist mit False negatives?

Dem aufmerksamen Leser ist sicherlich aufgefallen, dass wir die false negatives, also die Churner, die unserem Modell entgehen, komplett außer Acht lassen. Es gibt selbstverständlich Mittel und Wege, auch diese Fehler in den Griff zu bekommen. Das Stichwort hier heißt „Recall“, und errechnet sich folgendermaßen:

Recall = True positives / True positives + False Negatives

Der Recall ist also der Anteil an tatsächlichen Churnern, die unser Modell als solche entdeckt. In der Praxis können wir unser Modell so tunen, dass es einen guten Kompromiss zwischen Präzision und Recall verkörpert.

Wie verwendet man ein Churn Prediction Modell in der Praxis?

Ist ein Modell einmal trainiert, kann man es vor Ende eines Transaktionsintervalls auf alle Kundendaten anwenden, und erhält somit eine Liste von Kunden, die dem Modell zufolge churnen, also ihr Abonnement voraussichtlich kündigen, werden. Diese „Risikokunden“ können nun profiliert werden, sodass man sie mittels maßgeschneiderter Kundenbindungsmaßnahmen bestmöglich vom churnen abhalten kann.

Zusammenfassung

Was ist Churn Prediction?

Die Vorhersage der Wahrscheinlichkeit, mit der ein Kunde abwandern wird.

Wozu brauche ich die Churn Prediction?

Um abwandernde Kunden besser zu verstehen und um teure Kundenbindungsmaßnahmen gezielt und maßgeschneidert einsetzen zu können.

Was brauche ich dazu für Daten?

Prinzipiell reichen Informationen zu Kundeninteraktionen (z.B. „Anruf beim Kundendienst am 1.1.2020 um 12:34“, oder „Kauf von XYZ am 3.4.2020 um 17:10“). Generell gilt jedoch: je mehr Informationen, desto besser bzw. desto präziser lassen sich „Risikokunden“ identifizieren.

Wie kann ich im Vorhinein bestimmen, ob meine Daten ausreichend sind?

Anhand der Kosten und Effizienz meiner Kundenbindungsmaßnahmen lässt sich eine minimale Modellgüte bestimmen (siehe interaktive Grafik). Wenn auf den Daten ein Modell mit dieser Güte trainiert werden kann, sind sie ausreichend.

Wir hoffen wir konnten Ihnen einen umfassenden Eindruck über das Thema Churn Prediction vermitteln. Wir sind gespannt darauf, welche Erfahrungen Sie gemacht haben und welche Methoden und Werkzeuge Sie verwenden. Senden Sie uns ihre Erfolgsrezepte, Fragen oder weitere Anregungen gerne per E-Mail an [email protected]

Masiar Ighani

Senior Java Engineer, Senior DevOps Engineer, Kubernetes & OpenShift Engineer and Security Expert.

Relevante Artikel

KI in der Logistik: Revolutionierung der Branche

April 24, 2024 AI-Integration | Künstliche Intelligenz

Einleitung Die fortschrittliche Technologie der Künstlichen Intelligenz (KI) hat eine enorme Bedeutung für die Logistikbranche erlangt. Ein dynamisches und komplexes Umfeld wie die Logistik kann

Lesen

Wie Generative AI die Effizienz in der Versicherungsbranche steigert

April 17, 2024 AI-Integration

Der Einzug der Generative AI im Versicherungswesen markiert einen signifikanten Wendepunkt in der Art und Weise, wie Versicherungen Geschäftsprozesse abwickeln, Risiken bewerten und Kundeninteraktionen gestalten.

Lesen

Advanced AI applications for the insurance domain

März 10, 2024 AI-Integration | Künstliche Intelligenz

Has an automobile accident ever happened to you? You are probably aware of the difficulties associated with filing an auto insurance claim if you have

Lesen