Spring GDS 25è Aniversari
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
Un data warehouse és un magatzem central de dades estructurades, organitzat i optimitzat per a l'anàlisi. Reuneix dades de molts sistemes (vendes, suport, finances, màrqueting) en un únic lloc consistent on les preguntes es responen ràpid. A diferència de les bases de dades que fan funcionar una aplicació, un warehouse està fet per llegir i agregar grans volums de dades històriques, no per manejar milers de transaccions petites per segon.
La paraula clau és estructurades. Les dades aterren en un warehouse ja modelades en taules amb columnes i tipus definits, normalment després que un pas de transformació les hagi netejades. Aquesta és la distinció principal davant d'un data lake, que guarda les dades en cru en la seva forma original i decideix l'estructura més tard. Un warehouse canvia flexibilitat per velocitat i confiança. Quan un equip financer consulta els ingressos de l'any passat per regió, vol una resposta neta i governada, no un munt de registres en cru. Plataformes al núvol com Snowflake, BigQuery i Redshift van abaratir els warehouses i els van fer més fàcils d'escalar, i per això ara la majoria d'empreses en tenen un.
Un warehouse és on viuen el business intelligence i el reporting. Dashboards, informes programats i anàlisis ad hoc solen apuntar tots al mateix warehouse, perquè tothom treballi des d'una única versió dels números.
Dissenyem warehouses al voltant de les preguntes que una empresa fa de debò, no al voltant d'un ideal abstracte d'arquitectura neta. Això vol dir entendre quines mètriques importen, com les defineixen els equips i on discrepen les definicions existents abans de modelar una sola taula. Un bon warehouse acaba amb les discussions sobre el número de qui és el correcte.
La nostra feina de warehouse sol alimentar el business intelligence i el reporting, així que construïm amb la gent que el consultarà asseguda a la sala. Modelem l'esquema per als patrons reals de reporting, muntem els treballs de càrrega que el mantenen fresc i posem governance perquè els números segueixin sent fiables a mesura que l'empresa creix. La meta és una única font de veritat que aguanti l'escrutini.
Cansat que cada equip reporti un número diferent? Construïm una sola font de veritat.
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
Convertir una marca en un negoci que funciona.
Mig milió de persones. Una app. Zero caos.















