Prophetische Bäume
und Machine Learning

Wie Daten dabei helfen, das Verhalten Ihrer Spender vorauszusagen

Was treibt gemeinnützige Organisationen eigentlich voran? Neben der Motivation, neue und bessere Wege zu finden, unsere Welt in einen besseren Ort zu verwandeln, müssen gemeinnützige Organisationen auch dafür sorgen, dass sie ihre Aktivitäten finanzieren können. Sie sind ständig auf der Suche nach neuen Spender*innen und müssen gleichzeitig dafür sorgen, dass bereits existierende Spender*innen ebenfalls angemessen betreut werden. Viele Organisationen übersehen dabei ein wichtiges Gut, das sich bereits in ihrem Besitz befindet: Daten. Bereits vorhandene Spenderdaten können in Zusammenhang mit Machine Learning dazu beitragen, dass Organisationen ihre bereits existierenden Spender*innen besser betreuen können. Dies ist dank datengetriebener Prognose möglich, denn sie erleichtert den Organisationen ihre Zukunftsplanung. Der folgende Artikel veranschaulicht, wie Machine Learning (maschinelles Lernen) Spenderverhalten vorhersagen kann und somit Organisationen hilft, erfolgreicher zu planen.

Johanna, die perfekte Spenderin

Johanna ist jung, voller Energie, smart und daran interessiert, was in der Welt um sie herum passiert. Doch da gibt es eine Sache, die ihr Sorgen bereitet: Umweltverschmutzung. Insbesondere die Verschmutzung der weltweiten Wasservorräte. Eines Tages entscheidet sie, dass sie dagegen angehen und ihren Beitrag leisten will. Während ihrer Recherchen im Netz findet sie eine Organisation, die sich speziell mit der Bekämpfung der Verschmutzung der Ozeane befasst. Beeindruckt vom Profil und der Online-Präsenz der Organisation, meldet sie sich für den Newsletter an. Über die kommenden Wochen hinweg erhält sie via E-Mail mehr Einsicht in die Arbeit der Organisation. Auch die Organisation lernt Johanna besser kennen. Aus diesem Grund erhält Johanna E-Mails, die besser an ihre individuellen, persönlichen Interessen angepasst sind. Weil die Kommunikation der Organisation sie überzeugt und Johanna ihren Beitrag leisten möchte, entscheidet sie sich, die Organisation finanziell zu unterstützen. Da Dauerspender ein planbares und zuverlässiges Einkommen garantieren, fordert die Organisation sie nach der dritten Einzelspende auf, auch regelmäßig zu spenden. Johanna wird Dauerspenderin.

Bis hierher hört sich der ganze Prozess einfach genug an. Die Kommunikationsstrategie der Organisation hat es ermöglicht, eine neue Dauerspenderin zu akquirieren. Doch was geschieht, sobald Johanna einem langfristigen Engagement zustimmt? Wie kann sie davon überzeugt werden, ihr Engagement aufrechtzuerhalten, und noch wichtiger, wie erkennt man, dass sie sich in Zukunft vielleicht nicht mehr engagieren möchte?

Auf diese Fragen bietet Machine Learning Antworten. Denn durch die Sammlung und Kategorisierung von Spenderdaten ist es möglich, das Verhalten von Spender*innen, auch Johannas Verhalten, vorauszusagen. Machine Learning kann für Organisationen errechnen, mit welcher Wahrscheinlichkeit sich ein/e Spender*in entscheidet, weiterhin zu spenden oder seine/ihre Unterstützung zu beenden. Anders gesagt: Machine Learning kann die mögliche Abwanderungsrate von Spender*innen voraussagen.

Wie können wir maschinelles Lernen nutzen, um die Abwanderung von Spendern vorherzusagen? 

Eines der am weitesten verbreiteten und erfolgreichsten Modelle für Machine Learning ist das sogenannte “random forest”-Modell, das auf Entscheidungsbäumen basiert.

Stellen wir uns vor, dass Johanna vor einem besonderen, prophetischen Baum steht. Dieser Baum kann vorhersagen, ob Johanna der Organisation als Spenderin erhalten bleiben wird oder nicht. Um seine Prophezeiung abgeben zu können, graben sich seine Wurzeln tief in Johannas Datensammlung und nähren sich davon. Sobald die Nahrung aufgenommen ist, wandert sie durch den ganzen Baum und seine verschiedenen Äste, wobei die einzelnen Äste einzelne Informationsblöcke aus dem Datensatz analysieren. So untersucht zum Beispiel ein Ast, wie oft Johanna in den letzten drei Monaten die gesendeten E-Mails der Organisation geöffnet hat. Ein anderer Ast checkt, ob ihre Kreditkarte in den kommenden sechs Monaten ablaufen wird. Je mehr Daten der Baum als Nahrung erhält, desto kräftigere Äste bilden sich in dessen Krone und desto präziser ist die Analyse. Schließlich sprießen auch Blätter aus den Ästen des Baums. Da unser Baum prophetische Kräfte besitzt, sprießen an diesem Baum (zu jeder Jahreszeit) verschiedenfarbige Blätter. Ein grünes Blatt symbolisiert eine positive Antwort, in unserem Fall, dass Johanna der Organisation als Spenderin erhalten bleibt. Ein rotes Blatt hingegen steht für eine negative Antwort, also dafür, dass Johanna aufhören wird, die Organisation finanziell zu unterstützen. Als Antwort auf unsere Spender*innen-Abwanderungsfrage lässt der prophetische Baum ein einzelnes Blatt fallen, grün oder rot.

Nun sind prophetische Bäume in der Welt der Daten keine besondere Ausnahme. Eine Vielzahl von ihnen kann zu jedem Zeitpunkt aus dem Boden sprießen, um einen Wald zu bilden. Ein Phänomen, das wir “random forest” nennen. Tatsächlich können sich mehrere Bäume von der Menge an Johannas Daten ernähren und demnach auch gleichzeitig die verschiedensten Informationsblöcke zu ihrer Person analysieren.

Um daher eine möglich exakte Prophezeiung zu Johannas zukünftigem Verhalten zu erhalten, müssen alle einzelnen abgefallenen Blätter der Bäume im Wald eingesammelt werden. Sobald alle Blätter von allen Bäumen gesammelt wurden, können diese zu einer endgültigen prophetischen Entscheidung aggregiert werden. Diese ist besonders exakt, da sie eine Vielzahl an möglichen Alternativen gegeneinander aufwiegt.

Prophetische Bäume und Blätter? Wie wahrscheinlich ist es denn jetzt, dass Johanna als Spenderin erhalten bleibt? 

Dieses Konzept der prophetischen Bäume kann in eine prozentuale Darstellung umgeschrieben werden. Tatsächlich definiert Machine Learning anhand der gesammelten Daten über Johanna selbst, welche und wie viele Bäume nötig sind, um Johannas spezifisch-repräsentativen “random forest” abzubilden. All die gesammelten Blätter transformiert Machine Learning dann in eine finale Wahrscheinlichkeitsrechnung. Wichtig ist hier noch anzumerken, dass Machine Learning nicht nur punktuell angewendet wird. Machine Learning sammelt, analysiert und evaluiert Daten kontinuierlich und in Echtzeit.

Das Ergebnis des Machine Learning kann dann eingesetzt werden, um die Spender*innen-Kommunikation so zu verändern, dass jede*r individuelle Spender*in die richtige Botschaft zum richtigen Zeitpunkt und über den erfolgversprechendsten Kanal erhält. Die besten Ergebnisse erzielt man, wenn Machine Learning mit Marketing Automation kombiniert wird. So lassen sich die Ergebnisse des Machine-Learning-Prozesses in ein Marketing-Automation-Tool einspeisen, was wiederum automatisiert die Kommunikation triggert, welche den/die Spender*in vor dem Absprung bewahrt.

Kommen wir einmal zurück zu Johanna: Mittlerweile wurden alle Blätter aufgesammelt, die Auskunft darüber geben, ob sie der Organisation als Spenderin erhalten bleiben wird oder nicht. Es stellt sich heraus, dass der Haufen an roten Blättern größer ist als der Haufen an grünen Blättern. Das bedeutet, dass das Risiko für ihren Absprung relativ hoch ist. In diesem Fall würde Machine Learning diese Wahrscheinlichkeit an das Marketing-Automation-Tool weitergeben, welches daraufhin eine automatisierte E-Mail mit einer Danksagung bezüglich ihres Engagements verschicken würde.

Dieses Konzept der automatisierten Kommunikation, basierend auf Wahrscheinlichkeitsrechnung, wird besonders interessant, wenn man erkennt, wie vielfältig es eingesetzt werden kann. Denn anders als bei Menschen erreicht Machine Learning nie das Niveau, auf dem es vor lauter Bäumen den Wald nicht mehr sieht. Im Gegenteil, einmal eingesetzt, wächst es mit seinen Aufgaben. So kann man neben dem Spendenverhalten auch errechnen, wie hoch die wahrscheinlichen Spendeneinnahmen sein werden oder wer ein hohes Potenzial bietet, Großspender zu werden. Die Anwendungsmöglichkeiten sind nahezu unendlich.   

Nun liegt es an Ihnen: Sind sie bereit, sich in Ihren eigenen (Daten-) Wald zu begeben und neue Schätze zu heben?

Daniel Barco

Daniel Barco, Junior Data Scientist

Haben Sie Fragen oder wollen Sie mehr über getunik, die Dienstleistungen oder Tools erfahren?

Schreiben Sie uns