Visión por computador

¿Qué es la visión por computador?

La visión por computador es el campo de la IA que permite a las máquinas interpretar imágenes y vídeo. Donde una persona echa un vistazo a una foto y ve al instante un perro, una señal de tráfico o un defecto en una pieza, un ordenador ve una cuadrícula de valores de píxel. La visión por computador es el conjunto de técnicas que convierten esos píxeles en bruto en algo con significado: una etiqueta, una ubicación, un recuento, una decisión.

Entre las tareas habituales están la clasificación (qué hay en esta imagen), la detección de objetos (qué hay y dónde), la segmentación (qué píxeles exactos pertenecen a cada objeto) y el seguimiento de objetos a lo largo de los fotogramas de un vídeo. La mayoría de la visión por computador moderna corre sobre redes neuronales entrenadas con grandes conjuntos de imágenes etiquetadas, donde el modelo aprende los rasgos visuales que distinguen una cosa de otra. Una cámara de fábrica que inspecciona cada producto de una línea y señala los rayados es visión por computador haciendo control de calidad más rápido y con más constancia de lo que podría un humano.

Las aplicaciones van desde la imagen médica y los coches autónomos hasta el cobro en tienda, el escaneo de documentos y la moderación de contenido. Lo que comparten es un paso donde los datos visuales, los más difíciles de manejar para el software, se convierten en información estructurada sobre la que un sistema puede actuar.

La visión por computador en Dallonses

Integramos la visión por computador en productos donde una cámara puede sustituir un paso manual lento o propenso al error, inspeccionar, contar, clasificar, leer. La parte honesta de este trabajo son los datos. Un modelo de visión necesita suficientes ejemplos etiquetados de los casos raros, los defectos y las condiciones límite, y reunirlos suele ser el proyecto de verdad.

Las marcas globales nos traen problemas donde la señal visual es obvia para una persona y sorprendentemente difícil para una máquina, y ahí es donde la cosa se pone interesante. Nuestras soluciones de inteligencia artificial emparejan aquí el modelo adecuado con las restricciones del entorno real, una luz que cambia, ángulos que se mueven, objetos que se solapan. Lo construimos, lo probamos contra los casos sucios y lanzamos algo que aguanta en la línea de producción y no solo en el laboratorio.

¿Una tarea visual que una persona hace despacio mil veces al día? Vamos a automatizarla.

Hablemos de IA