Spring GDS 25. Jubiläum
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Ein Data Warehouse ist ein zentraler Speicher strukturierter Daten, organisiert und für die Analyse optimiert. Es führt Daten aus vielen Systemen (Vertrieb, Support, Finanzen, Marketing) an einem konsistenten Ort zusammen, wo Fragen schnell beantwortet werden. Anders als die Datenbanken, die eine Anwendung betreiben, ist ein Warehouse darauf ausgelegt, große Mengen historischer Daten zu lesen und zu aggregieren, nicht Tausende kleiner Transaktionen pro Sekunde zu verarbeiten.
Das Schlüsselwort ist strukturiert. Daten landen in einem Warehouse bereits in Tabellen mit definierten Spalten und Typen geformt, meist nachdem ein Transformationsschritt sie bereinigt hat. Das ist der wesentliche Unterschied zu einem Data Lake, der Rohdaten in ihrer ursprünglichen Form hält und die Struktur später festlegt. Ein Warehouse tauscht Flexibilität gegen Geschwindigkeit und Vertrauen. Wenn ein Finanzteam den Vorjahresumsatz nach Region abfragt, will es eine saubere, geregelte Antwort, keinen Haufen Rohlogs. Cloud-Plattformen wie Snowflake, BigQuery und Redshift machten Warehouses günstiger im Betrieb und leichter skalierbar, weshalb die meisten Unternehmen heute eines haben.
Ein Warehouse ist der Ort, an dem Business Intelligence und Reporting leben. Dashboards, geplante Berichte und Ad-hoc-Analysen zeigen meist alle auf dasselbe Warehouse, damit alle aus einer Version der Zahlen arbeiten.
Wir entwerfen Warehouses rund um die Fragen, die ein Unternehmen wirklich stellt, nicht um ein abstraktes Ideal sauberer Architektur. Das heißt zu verstehen, welche Kennzahlen zählen, wie Teams sie definieren und wo die bestehenden Definitionen auseinandergehen, bevor wir eine einzige Tabelle modellieren. Ein gutes Warehouse beendet Streitereien darüber, wessen Zahl stimmt.
Unsere Warehouse-Arbeit speist meist Business Intelligence und Reporting, also bauen wir mit den Menschen im Raum, die es abfragen werden. Wir modellieren das Schema für die echten Reporting-Muster, richten die Ladeprozesse ein, die es frisch halten, und setzen Governance auf, damit die Zahlen vertrauenswürdig bleiben, während das Unternehmen wächst. Das Ziel ist eine einzige Quelle der Wahrheit, die der Prüfung standhält.
Müde, dass jedes Team eine andere Zahl meldet? Bauen wir eine einzige Quelle der Wahrheit.
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Eine Marke in ein funktionierendes Geschäft verwandeln.
Eine halbe Million Menschen. Eine App. Null Chaos.















