Spring GDS 25 Aniversario
Una empresa de logística que envía a 190 países construyó algo para enviarse a sí misma.
Una red neuronal es un tipo de modelo de machine learning inspirado vagamente en cómo se conectan las neuronas en el cerebro. Se construye con capas de unidades simples, cada una recibiendo números, ponderándolos y pasando un resultado a la capa siguiente. Ajustando esos pesos contra millones de ejemplos, la red aprende a mapear una entrada, como una imagen o una frase, a una salida, como una etiqueta o una predicción.
La potencia viene de la profundidad. Una red con muchas capas, lo que la gente entiende por deep learning, puede aprender características en niveles de abstracción crecientes. Las primeras capas de una red de imágenes podrían detectar bordes, las siguientes formas enteras, y las finales una cara. El entrenamiento funciona mostrándole a la red un ejemplo, midiendo cuánto se equivocó en su suposición y empujando cada peso un poco para hacerlo mejor la próxima vez, un proceso repetido a lo largo de todo el conjunto de datos. La arquitectura transformer detrás de los modelos de lenguaje de hoy es una red neuronal, igual que el modelo de visión que reconoce objetos en una foto.
Las redes neuronales no son magia y no siempre son la elección correcta. Necesitan muchos datos y cómputo, y son difíciles de interpretar, lo que importa cuando tienes que explicar una decisión. Para muchos problemas un modelo más simple es más rápido, barato y claro.
Recurrimos a las redes neuronales cuando el problema las necesita de verdad, imágenes, lenguaje, patrones complejos que ningún modelo simple captura, y lo decimos sin rodeos cuando no es así. Una red neuronal que no puedes explicar ni permitirte reentrenar es un lastre, así que decidir usarla es parte de la ingeniería, no algo dado.
Cuando una red es la herramienta adecuada, nuestras soluciones de machine learning se centran en las partes que deciden si funciona en producción: datos de calidad suficientes, una evaluación honesta y monitoreo para cuando el modelo empiece a desviarse. Construimos, medimos y desplegamos, y luego seguimos vigilando, porque una red neuronal que parecía afilada con los datos del año pasado puede degradarse en silencio a medida que el mundo avanza.
¿Te preguntas si tu problema necesita de verdad deep learning? Resolvámoslo juntos.
Una empresa de logística que envía a 190 países construyó algo para enviarse a sí misma.
Convertir una marca en un negocio que funciona.
Medio millón de personas. Una app. Cero caos.















