Sind Datenschätze einem anorganischen Wachstum entsprungen und können wir sie mit dem richtigen Wissen abtragen? Eine Reflektion des Begriffs Data Mining.

Data Mining ist der Begriff für einen Prozess, der etwa Ende der 1990er Jahre in der Statistik entwickelt wurde. Grundsätzlich beschreibt er  die Analyse von Daten aus verschiedenen Perspektiven, die nützliche Informationen zur Optimierung von Vorgängen generiert. Besonders die Kategorisierung, Zusammenfassung und Identifizierung von Verbindungen gehören zu den Hauptzielen dieser Analysen.

Doch ist Data Mining überhaupt noch aktuell im Jahr 2016, fast 20 Jahre nach seiner Entstehung?

Abgesehen von seinen prozessualen Abläufen ist die Namensgebung in diesem Kontext wichtig, da sie Hinweise auf die Vorstellung von Datenanalysen gibt: Irgendwo zwischen den sich überlagernden Sedimenten und erodierenden Schichten, lassen sich kostbare Business Informationen schürfen, deren goldene Ader nur entdeckt werden muss. Gibt es also einen versteckten Nutzen in jeder Datenbank, der nur darauf wartet, aufgespürt zu werden? Sind Datenschätze einem anorganischen Wachstum entsprungen und können wir sie mit dem richtigen Wissen abtragen?

Shopping IconData Mining – Was dahinter steckt

Um die Fragen nach Aktualität und Wert des Begriffs Data Mining klären zu können, müssen zunächst Hintergrund und Wirkungsweise klar sein. Der erste Anwendungsfall für Data Mining war die Marktforschung für Lebensmittelläden, die durch technische Neuerungen mehr Möglichkeiten zur Optimierung ihres Umsatzes bekamen. Hier wurden operationale Daten wie Verkaufszahlen, Kostenaufwand und Gehaltsabrechnungen, nichtoperationale Daten wie Industrienormen, Prognosen und Ökonomiezusammenhänge und Meta Daten, sprich Daten über die Daten selbst, gemeinsam zu Informationen verarbeitet und so Wissen über Vergangenheit und Zukunft gewonnen.
Einige der Parameter, die durch die Analysen sichtbar wurden, sind:

  • Zusammenhänge
  • Reihenfolgen
  • Klassifizierungen
  • Gruppierungen
  • Prognosen

Das Herzstück von Data Mining ist das Data Warehouse, eine zentrale Anlaufstelle, an der alle Daten gespeichert und den jeweiligen Mitarbeitern zur Verfügung gestellt werden. Dieses Warehouse wird von einer Data Mining Software über komplexe Prozesse analysiert. Was zur Entstehungszeit noch mehr Idee als Realität war, ist heute bei vielen Unternehmen Alltag – etwa 45% aller deutschen Unternehmen nutzen derzeit ein CRM System. Auch, wenn Marketing Automation damals noch kein Stichwort war und heute eher der Begriff Datenbank statt Data Warehouse verwendet wird, so steckt doch derselbe Gedanke hinter der Sache: Demografische Daten und im Besonderen Informationen über die Verhaltensweisen der Kunden werden so genutzt, dass Kunden eine spezifisch abgestimmte Produktauswahl bereitgestellt wird. Das ist es, was Data Mining auch heute noch aktuell macht.

BeerVon Windeln und Bier

Eine berühmte urbane Marketing Legende ist die von den Windeln und dem Bier. Demnach fand ein Supermarkt heraus, dass an den Tagen, an denen Männer Windeln kauften, der Verkauf von  Bier gleichsam anstieg. Über Data Mining konnte man sowohl diesen Zusammenhang, als auch die genauen Wochentage identifizieren, um sicherzustellen, dass genau dann Windeln und Bier immer zum vollen Preis angeboten werden und nahe beieinander stehen. Die Idee des Data Minings wies in diesem Aspekt schon vor fast 20 Jahren eine Parallele zu heutigen Big Data Technologien auf: Datenanalysen sollen bestehende Zusammenhänge aufzeigen und Mehrwert dadurch generieren, dass sie Antworten auf Fragen finden, die bisher noch niemand gestellt hatte.

Data Mining erlaubt Unternehmen nach dem Weshalb zu fragen, um das Verhalten der Kunden besser zu verstehen und Effektivität zu bewerten. Diese Grundlage für proaktive Business Entscheidungen, die auf spezifischem Wissen basieren, ist auch heute noch fundamental für den Geschäftserfolg. In gewisser Weise hat Data Mining schon damals Prozesse automatisiert, die zu Targeted Marketing geführt haben und die sich organisch an wachsende Datenmengen anpassen konnten .

Dabei eignet sich Data Mining nicht nur für den Einzelhandel, sondern für jedes Unternehmen, das seine Kundenbeziehungen und seine Datenbank besser managen will. Zwei Faktoren sind besonders wichtig: die Beschaffenheit des Data Warehouses muss gepflegt, sowie in alle anderen Kundendatensysteme, wie Marketing Automation Plattformen, integriert sein, und das Unternehmen muss seine Business Prozesse, in denen Data Mining angewendet werden soll, genau definieren  und verstehen. Sich diese zwei Voraussetzungen vor Augen zu führen verhindert, dass der Eindruck entsteht, Data Mining funktioniere von ganz alleine und ohne weiteres Zutun. Es erfordert immer noch die Mitarbeit und das Verständnis der Verantwortlichen, die das Business, die Daten und die analytischen Methoden kennen müssen. Denn der Wert der Informationen, die über Data Mining gewonnen werden, kann nicht von Maschinen bewertet werden.

Die richtigen Fragen zu stellen ist eine Aufgabe, die nicht von heute auf morgen erlernbar ist. Aussagefähige Erkenntnisse und konkrete Bedeutungsbezüge spielen sich jedoch nach einer Zeit ein und sind für Unternehmen, die eigene Arbeitsweisen optimieren und nicht in starren Mustern denken, ein realistisches Ziel.

KohlebauKohleabbau oder doch eher Gartenpflege?

Data Mining ist gerade heute, zu Zeiten der Marketing Automation, so aktuell wie eh und je. Auch, wenn einige Begriffe sich geändert haben und Informationskanäle hinzugekommen sind, sind Grundgedanke und Vorgehensweisen wichtig für moderne Datenanalysen.

Doch gleicht dieser Prozess noch immer dem Bergbau? Einem Bereich, in dem Ressourcen in groben Stücken abgebaut werden, jedoch auch viel Unbrauchbares entsteht und in dem früher oder später die wertvolle Quelle erschöpft ist? Einem Bereich, in dem zwar strukturiert und mit vielen Hilfsmitteln vorgegangen wird, bei dem der Erfolg letztendlich jedoch Glückssache bleibt?

Unsere Antwort lautet: Nein. Viel näher liegt doch der Begriff Data Gardening: Bestimmte Daten werden in einem vorbereiteten Bereich gepflanzt und gepflegt, die gelegentlich auftauchenden schlechten Daten werden ausgerupft und auf regelmäßiger Basis kann die Ernte eingebracht  werden. Selbstverständlich funktioniert nicht jeder Datensamen gleich gut, doch mit der Erfahrung kommt das Wissen über diese Metadaten und auch der Samen selbst wird kräftiger. Gelegentlich kann der Ertrag einer besonders gelungenen Ernte für andere zur Schau gestellt werden, um Expertenwissen zu transferieren und sich auszutauschen. Eine derart nachhaltige Datenpflege erschöpft sich nicht, je öfter man sie betreibt, sondern wächst und erweitert sich organisch zu einem prächtigen Garten. Die zyklische Arbeit des Gärtners, die auf jahrelange Tradition und Kenntnisse gestützt ist, bezeugt, dass Unternehmen sich um ihre Daten kümmern müssen, um sie zu Goldschätzen heranzuziehen.

Was denken Sie über Data Mining und Data Gardening? Sehen Sie die Unterschiede ähnlich?