Wasser – die ideale Metapher für Daten

Heraklit hat vor über zweieinhalb Jahrtausenden mit Panta rhei (griechisch: Alles fließt) die Grundlage für ein neues Weltverständnis geschaffen. Man kann nicht zweimal in den gleichen Fluss steigen. Die simple Erkenntnis, die sich daraus ergibt, ist, dass sich alles in permanentem Werden und Vergehen befindet. Es ist vordergründig immer Wasser, das im Fluss fließt – jedoch immer anderes. Ähnlich verhält es sich mit unseren heutigen, virtuellen Flüssen, die mit Daten gefüllt sind. Das macht Wasser zur idealen Metapher für Daten.

Betrachten wir einige Eigenschaften von Wasser und Daten.

  • Aggregatzustand
    Wasser findet sich in drei Zuständen: fest, flüssig und gasförmig. Der Schmelzpunkt ist der Übergang von fest zu flüssig und der Siedepunkt zwischen flüssig und gasförmig. Daten prägen sich ähnlich aus. Solange sich etwas nicht als Nullen und Einsen ausdrücken lassen, weil sie noch nicht ermittelt oder formuliert wurden, gibt es nichts, das fließen kann – wie beim Eis. Daten erreichen ihren Schmelzpunkt, sobald jemand seine Gedanken in Form von Sprache, Bildern oder Klang ausdrückt, oder ein Sensor Messdaten geliefert hat. Jetzt können die Daten fließen – verbreitet, ausgetauscht oder empfangen werden. Erhöht sich die Temperatur weiter, so erreicht man irgendwann den Siedepunkt. Die Daten werden fuzzy – wie Wasserdampf. Die Sensoren erzeugen in diesem Fall ein unbestimmtes Rauschen, das sich im virtuellen Raum nicht erfassen lässt.
    Um brauchbare Daten zu erhalten, müssen sie, wie Wasser, in den flüssigen Zustand gebracht werden. Entweder muss man sie erhitzen, damit sie sichtbar werden – durch Messen oder Fragen. Oder man muss sie abkühlen, damit sie sich verdichten zu verarbeitbaren Daten.
  • Qualität
    Beschränken wir uns auf die einfache Unterscheidung von reinem, im Sinne von trinkbarem, versus kontaminiertem, im Sinne von giftigem, Wasser. Wir unterscheiden zwischen objektiven und falschen Daten. Im Allgemeinen glauben wir an reine Daten, wenn sie aus vertrauensvollen Quellen stammen. Offensichtlich kontaminierte Daten werden von Quellen geliefert, die verdächtig sind – Forschungsergebnisse, weil sie von einer befangenen Quelle stammen; Nachrichten, weil sie von einer politisch abhängigen Presse publiziert wurden.
    Leider beruht die Qualität oft auf einer Bewertung durch Dritte, die an sich zweifelhaft ist – wenn beispielsweise eine Nachrichtenagentur eine andere als politisch gesteuert bezichtigt. Andererseits werden kontaminierte Daten genutzt – sogar stärker als man bis zu einem gewissen Grad vergiftetes Wasser trinken kann.
  • Kanäle
    Das Wasser befindet sich in einem fortwährenden Kreislauf – über dem Meer verdunstetes Wasser regnet an den Bergen ab, erzeugt Bäche, Flüsse und Ströme, die manchmal über Wasserfälle, zurück ins Meer fließen. Das Meer der Daten befindet sich im öffentlichen und geschützten virtuellen Raum. Mit dem Internet der Dinge bilden sich im World Wide Web Wolken, die in Programmen gesammelt werden, mit neuen Daten im Zuge von Abläufen vermischt werden, und über Schnittstellen, den Wasserfällen, wieder im virtuellen Raum landen.
    Mit dem Cloud-Computing nähern wir uns immer mehr diesem Zustand – auch wenn derzeit noch viele, aufgrund von starken Zweifeln an der Sicherheit, ihre Daten nicht der Cloud anvertrauen. Diese internen Dämme bieten jedoch langfristig keinen Schutz mehr, da alle Daten immer mal wieder durch den Cyberspace fließen müssen.
  • Gefahren
    Eine naheliegende Gefahr besteht aus so stark kontaminiertem Wasser, dass es die Nutzer in kürzester Zeit vergiftet. In den letzten Jahren wird uns jedoch auch die unvorstellbare Macht von Wasserfluten durch Tsunamis oder Dammbrüchen nach starken Regenfällen vor Augen geführt. Dabei vergessen wir schnell, dass kein Wasser eine noch schlimmere Bedrohung darstellt – vor allem, wenn sich Länder gegenseitig das Wasser abgraben, wie man an den Verteilungsproblemen im Westjordanland, an den Dämmen des Mekong in China oder am Aralsee sehen kann. Die Verbreitung von falschen Informationen kontaminiert ebenfalls die Einstellungen und Erkenntnisse des Publikums. Gleichzeitig fluten immer mehr Daten durch das Internet. Der Versuch diese Daten zu sortieren führt einerseits zu Filterblasen, die einen großen Teil der Daten ausblenden. Andererseits schaffen die Filter Möglichkeiten die öffentliche Meinung durch das unmerkliche Herausfiltern von kritischen Inhalten zu manipulieren, wie beispielsweise durch die Zensur des „embedded” Journalismus. Und schließlich führen fehlende Daten zu gefährlichen Fehleinschätzungen.

Verschiedene Denker haben sich der Frage gewidmet „Wie wirklich ist die Wirklichkeit?” Und trotzdem argumentieren viele noch mit Kategorien wie „Richtig“ und „Falsch“. Dabei liegt die Wahrheit immer im Auge des Betrachters. Mit dem neuen Aufflammen von Propaganda müssen wir wohl damit Leben, dass immer neue Begriffe, wie „postfaktisch“ oder „alternative Fakten“ dieses Dilemma zu verstecken versuchen. Wir sollten nicht vergessen, dass manche Leute keine Hemmungen haben gute und schlechte Daten zu verkaufen, sowie arglose sie ohne sie zu hinterfragen konsumieren – wie Wasser.

Fazit: Daten verhalten sich offensichtlich wie Wasser – es gibt ähnliche Aggregatzustände, Qualitäten, Kanäle und Gefahren. Datenflüsse, Datenströme und Datenfluten lassen sich durch speziell angelegte Flussbetten und Dämme sowie durch Filter steuern. Damit ist Wasser die ideale Metapher für Daten.