Datenbereinigung – der Frühjahrsputz für die Datenoptimierung

Veröffentlicht am 7.8.2019 von Ines Bahr und Thomas LaMonte

Wir haben es schon oft geschrieben: Daten sind die wichtigste Ressource für Unternehmen und wer die Datensicherheit vernachlässigt, bringt sich schnell in die Bredouille.

Doch bei der Datenpflege geht es nicht nur um die Sicherheit: Auch die Datenbereinigung spielt eine enorm wichtige Rolle.

Datenbereinigung – der Frühjahrsputz für die Datenoptimierung

An dieser Stelle taucht bei vielen die Frage auf: „Was ist Datenbereinigung eigentlich?“ Bei der Datenbereinigung, auch Data Scrubbing oder Data Cleansing genannt, geht es darum, Unternehmensdaten auf Ungenauigkeiten, Duplikate sowie veraltete und unvollständige Einträge zu überprüfen. Dabei werden Datenfehler entfernt und korrigiert und alles behoben, was die Daten für die Nutzung in Business Intelligence (BI)-Software unbrauchbar macht.

Daten müssen genauso regelmäßig gereinigt werden wie andere Dinge im Alltag, wie das Spülbecken oder der Hund, der sich mal wieder im Komposthaufen gewälzt hat – und der Vergleicht hinkt gar nicht mal allzu sehr, denn genau wie der Hund tun Daten alles, um die gründliche Wäsche zu vermeiden, und genau wie beim Spülbecken wartet man vergeblich darauf, dass sie sich von selbst putzen.

Während ein schmutziges Spülbecken allerdings wenig Konsequenzen nach sich zieht, sieht das bei vernachlässigten Unternehmensdaten schon ganz anders aus: Schlimmstenfalls können sie das ganze Geschäft gefährden.

Chaos ist nicht immer kreativ – Wettbewerbsvorteil dank gut organisierter Daten

Kissmetrics schätzt, dass Unternehmen aufgrund von schlechter Datenqualität mindestens 20 Prozent ihres Umsatzes verlieren. 41 % der Unternehmen nennen inkonsistente (und damit „schmutzige“) Daten als ihre größte Herausforderung, und das in den unterschiedlichsten Technologien – darunter CRM, Marketing-Tools und BI.

Werden unsaubere Daten zur Datenanalyse verwendet, ist das in etwa so, als würde man einen Benziner mit Diesel fahren. Nicht nur läuft das Unternehmen nicht rund, man riskiert auch, dauerhaft den Motor zu schädigen.

Datenanalysen, die auf Grundlage minderwertiger Daten erfolgen, können zu falschen Entscheidungen mit häufig teuren Konsequenzen führen.

Ein fehlender Datenbereinigungsplan sollte Unternehmen also genauso in Sorge versetzen wie hygienisch bedenkliche Zustände in der Kantine – doch nur 16 Prozent der Unternehmen beschreiben die von ihnen genutzten Daten als „sehr gut“, sprich: als Daten, die auf Integrität, Genauigkeit und Sicherheit basieren.

Die Datenbereinigung zur Verbesserung der Datenqualität ist nicht selten die anstrengendste und schwierigste Aufgabe bei der Datenanalyse, doch sie ist gleichzeitig die wichtigste.

Die erfolgreichsten Unternehmen, deren Geschäft auf Daten basiert, sind häufig geradezu davon besessen, ihre Daten makellos zu pflegen. Beim Aufrechterhalten der Datenqualität geht es schließlich nicht nur darum, negative Auswirkungen zu vermeiden, sondern auch um all das, was man dank sauberer Daten an Erkenntnissen für Geschäftsinnovationen gewinnen kann.

An dieser Stelle ist die Rede vom „kreativen Chaos“ einfach nicht angebracht: Unternehmen mit gut gepflegten und strukturierten Daten haben einen eindeutigen Wettbewerbsvorteil.

Was ist Datenbereinigung bzw. Data Scrubbing?

Nahezu jedes Unternehmen hat Daten, die eine Bereinigung gebrauchen könnten. Wie fangen wir also damit an?

Es gibt verschiedene Verfahren, die zur Datenbereinigung verwendet werden, doch letztendlich laufen sie auf dasselbe hinaus:

1. Das Modifizieren, Berichtigen, Zusammenfügen und Entfernen korrupter, unvollständiger, veralteter oder ungenauer Daten.

2. Das Entwickeln von Strategien zur Verbesserung von Datensicherheit und Compliance, sodass das Unternehmen durch qualitativ hochwertigere Daten einen großen Mehrwert schafft.

Warum ist die Datenbereinigung so wichtig?

Es  kostet im Durchschnitt …

  • 1 $, ein Duplikat zu vermeiden
  • 10 $, ein Duplikat zu korrigieren
  • 100 $, Datenduplikate unverändert zu speichern und keine Maßnahmen zu ergreifen

Damit wird deutlich: Es ist schlicht und einfach eine Sache des guten Geschäftssinns, die eigenen Daten zu bereinigen, bevor das Chaos immer größer wird. Aktuell geben Unternehmen immerhin durchschnittlich 50 Prozent ihres IT-Budgets für die Datenwiederherstellung aus.

Ein weiteres Problem liegt darin, dass die meisten Menschen ständig Unmengen an Daten generieren. Besonders das Internet of Things (IoT) trägt dazu wesentlich bei. Wer einmal versucht, einen Tag lang keinerlei Geräte oder Services zu nutzen, die persönliche Daten teilen könnten, wird feststellen, dass das gar nicht so einfach ist: Wir haben uns schon längst daran gewöhnt, Essen online zu bestellen, Musik per Streaming-App zu hören oder unsere Heizung per Smart Home-Gerät zu steuern.

Natürlich fallen in Unternehmen noch viel mehr Daten an als in einem Privathaushalt, weshalb eine Data-Governance-Strategie, die festlegt, wie Daten verarbeitet und verwaltet werden, für Unternehmen jeder Größe unverzichtbar sind.

Data-Governance-Strategien verbessern die Datenqualität

Ideal ist es, wenn Unternehmen mithilfe entsprechender Datenverwaltungsrichtlinien zuverlässig dafür sorgen, dass die eigenen Daten regelmäßig bereinigt werden. Diese Richtlinien müssen dann natürlich auch wirklich umgesetzt werden.

Daher empfehle ich, die Datenbereinigung als ständig laufenden Hintergrundprozess zu etablieren, der genauso sorgfältig gepflegt wird wie die Hygiene im Alltagsleben.

EMPFEHLUNG:  Die folgende Checkliste für die Datenbereinigung soll dabei helfen, Data-Governance-Initiativen voranzutreiben, eine gute Datenqualität für Geschäftsprozesse zu gewährleisten und sicherzustellen, dass sich keine Daten an schwer zugänglichen Stellen im Unternehmen verstecken.

Eine Checkliste zur Datenbereinigung

Dieser Artikel kann auf Produkte, Programme oder Dienstleistungen verweisen, die in deiner Region nicht verfügbar sind oder die durch die Gesetze oder Vorschriften des Landes eingeschränkt sein können. Wir empfehlen, sich direkt an den Softwareanbieter zu wenden, um Informationen über die Produktverfügbarkeit und Rechtskonformität zu erhalten. Gender Hinweis: Aus Gründen der besseren Lesbarkeit wird bei Personenbezeichnungen und personenbezogenen Hauptwörtern auf dieser Website die männliche Form verwendet. Entsprechende Begriffe gelten im Sinne der Gleichbehandlung grundsätzlich für alle Geschlechter. Die verkürzte Sprachform hat nur redaktionelle Gründe und beinhaltet keine Wertung.

Über die Autoren

Ines ist Senior Content Analyst für GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt in Barcelona.

Ines ist Senior Content Analyst für GetApp. Spezialisiert auf Studien und Digitalisierungs-Tipps für KMU. Masterstudium in Medien und Kommunikation, lebt in Barcelona.


Thomas war Content Analyst für GetApp.

Thomas war Content Analyst für GetApp.