Datenqualität – warum mehr Daten keine bessere Wahrheit liefern
Kurze Definition (Prüfgegenstand)
Dieser Proof‑Artikel prüft die verbreitete Annahme, dass steigende Datenmengen und technische Verfügbarkeit automatisch die Qualität von Erkenntnissen erhöhen. Die Analyse zeigt, dass Datenmenge Wahrheitsgehalt nicht garantiert und mangelnde Datenqualität Fehlentscheidungen systematisch verstärken kann.
1. Die verbreitete Quantitätslogik
In vielen Organisationen wird implizit angenommen:
mehr Daten schaffen mehr Genauigkeit,
mehr Quellen erhöhen Objektivität,
technische Integration verbessert Wahrheit.
Typische Aussagen sind:
„Wir brauchen noch mehr Daten.“
„Die Zahlen widersprechen sich – wir sammeln weiter.“
Dabei wird Quantität mit Qualität gleichgesetzt.
2. Warum diese Logik zunächst plausibel wirkt
Die Annahme erscheint nachvollziehbar, weil:
Statistik Präzision suggeriert,
Daten technisch skalierbar sind,
Unschärfe als Datenlücke interpretiert wird.
Mehr Daten wirken fundierter – unabhängig von ihrem Ursprung oder ihrer Konsistenz.
3. Wo die Logik systemisch bricht
Der Bruch entsteht, wenn unsichere Daten vervielfältigt werden.
Datenmenge kann:
Rauschen erhöhen,
Widersprüche verschleiern,
Scheingenauigkeit erzeugen.
Ohne klare Definition von:
Kontext,
Erhebungslogik,
Entscheidungsrelevanz
wird aus Information keine Erkenntnis. Das System sieht mehr – versteht aber nicht besser.
4. Typische Folgen datengetriebener Scheingenauigkeit
Wird Datenmenge über Qualität priorisiert, zeigen sich regelmäßig:
zunehmende Unsicherheit trotz hoher Informationsdichte,
widersprüchliche Entscheidungsgrundlagen,
sinkende Handlungsfähigkeit.
Daten werden gesammelt, nicht geprüft.
5. Die notwendige Trennung der Logiken
Eine konsistente Datenlogik erfordert die klare Unterscheidung:
Datenmenge beantwortet die Frage: Wie viele Informationen sind verfügbar?
Datenqualität beantwortet die Frage: Welche Informationen sind verlässlich, relevant und entscheidungsfähig?
Ohne definierte Qualitäts‑ und Relevanzkriterien erhöht jede zusätzliche Datenquelle die Komplexität – nicht die Wahrheit.
Relevant im Kontext von Data Governance, Entscheidungsfindung, Management Control Systems und KI‑Einsatz.
