Der Artikel von Thomas C. Redman zu den Folgen schlechter Datenqualität stach mir sofort ins Auge. Vermutlich, weil ich in letzter Zeit selber öfter mit dem Thema zu tun habe, sei es in Kundenprojekten oder in der täglichen Arbeit mit Kunden- oder Mitgliederdaten. 

In dem Beitrag der MIT Sloan Review schreibt Redman davon, dass für manche Unternehmen bis zu 25% ihres Umsatzes durch die schlechte Qualität der Firmendaten auf dem Spiel stünden. Die Abschätzung ist schnell nachvollziehbar: Schlechte Datenqualität müsste durch Anwender ausgeglichen werden, in dem sie Fehler korrigierten, Bestätigung in anderen Datenquellen suchten und mit den Folgefehlern zu tun hätten, die sich daraus ergäben.

Weniger Fehler in den Daten würden hingegen niedrigere Kosten bedeuten und der Schlüssel zu weniger Fehler läge im Verständnis der Fehlerquellen und Ursachen für falsche Daten. Redman beschreibt, wie sich in der jüngeren Vergangenheit die lange gängige Praxis, schlechte Daten als gegeben zu akzeptieren, allmählich wandelt.  Projekte zur Steigerung würden sich aus folgenden Einflussgrößen rechtfertigen lassen: dem aktuellen Zustand der Datenqualität, den unmittelbaren Folgen schlechter Daten, den damit verbundenen Kosten und den Vorteilen, die sich aus der Datenqualität ergäben.

In einer Studie mit Führungskräfte wurden die Arbeitsergebnisse von deren Abteilungen untersucht. Nur 3% der gefundenen Fehler fielen demnach in die Kategorie „akzeptabel, weil nicht vermeidbar“. Fast 50% der neu erstellten Datensätze hingegen hatten kritische Fehler und seien einfach inakzeptabel. Bis zum Beweis des Gegenteils müsse man daher davon ausgehen, dass  die eigenen Unternehmensdaten in ähnlicher Form vorlägen. Eine Folge davon sei, dass Wissensarbeiter bis zu 50% ihrer Zeit damit verschwendeten, alltägliche Datenqualitätsprobleme zu behandeln. Für „Data Scientists“, also Menschen die berufsmäßig Daten im Unternehmen analysieren und aufbereiten, könne diese Zahl bis zu 80% betragen.

Eine weitere Konsequenz seien Fehler, z.B. Fehler bei Operationen, schlechte Entscheidungen auf der Grundlage falscher Daten, schlechter Analytik und schlechter Algorithmen.  Die bislang lapidar benutzte Redewendung „garbage in, garbage out“ müsse angesichts der großen betroffenen Datenmengen umformuliert werden in „big garbage in, big garbage out“. Oder, einfach um das Zitat wieder einmal zu strapazieren: „Wenn Sie einen Scheißprozess digitalisieren, haben Sie einen scheiß digitalen Prozess„.

Weithin unterschätzt seien die Folgen des aus der Datenqualität resultierenden Vertrauensverlustes. Anders ausgedrückt, schlechte Daten erodieren das Vertrauen. Tatsächlich vertrauten nur 16% der an der Studie beteiligten Manager voll und ganz den Daten, die sie für wichtige Entscheidungen verwenden. Offensichtlich sind die Fehler, die verschwendete Zeit und der Mangel an Vertrauen, die durch schlechte Daten entstehen, mit hohen Kosten verbunden. Das alles aufaddiert, führt zu enormen Summen.

Angesichts der vielen Digitalisierungsprojekte in deutschen Unternehmen scheinen mir an manchen Orten die Prioritäten falsch gesetzt. Schließlich ist es viel schwieriger, datengetriebene Dienstleistungen zu vermarkten, wenn sich ein Unternehmen nicht auf seine Daten verlassen kann. Wenn es um Daten geht, beginnt und endet alles mit Qualität. Inwiefern können Kunden einem Unternehmen vertrauen, das schlechte Daten verkauft oder lizenziert? Wie kann man den Analysen vertrauen, wenn man schon den zugrunde liegenden Daten nicht vertrauen mag?.

Geradezu unbedarft erscheint der reaktive Ansatz, den die meisten Unternehmen heute verfolgen. In den meisten Fällen sollte es darum gehen, die Datenqualität vorbeugend aufrecht zu erhalten, z.B. indem die Ursachen von Fehlern gesucht und beseitigt werden. An der Tagesordnung ist hingegen oft, Fehler in den Daten zunächst hinzunehmen und sie dann kostspielig wieder zu korrigieren. Hier müsste das Management klar Verantwortung übernehmen und Maßnahmen ergreifen. Es geht um Führung, nicht um Technologie! Datenqualität ist ein Geschäftsproblem, kein IT-Problem.