Logo de Dallonses

dbt (data build tool)

¿Qué es dbt?

dbt es una herramienta para transformar datos dentro de un warehouse. Entran tablas en bruto, salen tablas limpias y modeladas, y la lógica intermedia se escribe como sentencias SQL select que dbt convierte en las tablas y vistas de las que dependen tus analistas y dashboards. Se ocupa de la T en ELT, el paso de transformación, después de que los datos ya se han cargado.

Lo que lo distingue es que aporta disciplina de ingeniería de software a ese trabajo. Las transformaciones viven en control de versiones. Los modelos pueden referenciarse entre sí, y dbt deduce el orden en que ejecutarlos. Escribes tests que afirman cosas como «esta columna nunca es nula» o «este id es único», y la documentación se genera a partir del propio código. Un equipo de finanzas cuyas cifras de ingresos salen de un modelo dbt versionado y testeado, en lugar de una hoja de cálculo que alguien edita a mano, es justo de lo que se trata. dbt no almacena ni mueve datos; orquesta transformaciones encima de warehouses como Snowflake, BigQuery o Redshift.

El resultado es una capa de transformación que puedes revisar, testear y en la que confiar, en lugar de una maraña de scripts SQL puntuales que nadie recuerda haber escrito.

dbt en Dallonses

Cuando construimos el data warehouse de un cliente, dbt suele ser cómo mantenemos cuerda la capa de transformación. Modelamos los datos en SQL versionado, añadimos tests para que los datos malos fallen a gritos en lugar de envenenar un dashboard en silencio, y documentamos los modelos para que la siguiente persona los entienda sin una reunión. Las transformaciones limpias son la razón poco glamurosa por la que se puede confiar en las cifras de abajo.

Este trabajo conecta nuestros data lakes y data warehouses con el análisis y la visualización de datos, ya que las tablas que produce dbt son exactamente lo que leen los dashboards. Montamos el pipeline para que corra en un horario, avise cuando un test se rompe y siga siendo legible a medida que el modelo crece. Las marcas globales nos traen reporting que tiene que estar bien, y dbt es buena parte de cómo lo mantenemos así.

¿Cansado de dashboards montados sobre SQL en el que nadie confía? Reconstruyamos la capa de debajo.

Hablemos de datos

Servicios relacionados


¿Listo para trabajar juntos?

Reservar una reunión
Aymón sosteniendo una revista Tools frente a su cara
Ari trabajando en una laptop al aire libre rodeado de plantas
Vista superior de un escritorio de madera con teclado, ratón y auriculares
Ilustración dibujada a mano de una mano chasqueando los dedos
Nico recostado contra un dispensador de agua junto a un extintor de incendios
Primer plano de una computadora abierta con placa de circuito y componentes en un escritorio de madera
Bernat y Andreu colaborando en un escritorio con monitores y una laptop
Ilustración dibujada a mano de una mano abierta saludando
Aymón sosteniendo una revista Tools frente a su cara
Ari trabajando en una laptop al aire libre rodeado de plantas
Vista superior de un escritorio de madera con teclado, ratón y auriculares
Ilustración dibujada a mano de una mano chasqueando los dedos
Nico recostado contra un dispensador de agua junto a un extintor de incendios
Primer plano de una computadora abierta con placa de circuito y componentes en un escritorio de madera
Bernat y Andreu colaborando en un escritorio con monitores y una laptop
Ilustración dibujada a mano de una mano abierta saludando