Spring GDS 25è Aniversari
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
La visió per computador és el camp de la IA que permet a les màquines interpretar imatges i vídeo. Allà on una persona fa un cop d'ull a una foto i veu a l'instant un gos, un senyal de trànsit o un defecte en una peça, un ordinador veu una quadrícula de valors de píxel. La visió per computador és el conjunt de tècniques que converteixen aquests píxels en brut en alguna cosa amb significat: una etiqueta, una ubicació, un recompte, una decisió.
Entre les tasques habituals hi ha la classificació (què hi ha en aquesta imatge), la detecció d'objectes (què hi ha i on), la segmentació (quins píxels exactes pertanyen a cada objecte) i el seguiment d'objectes al llarg dels fotogrames d'un vídeo. La majoria de la visió per computador moderna corre sobre xarxes neuronals entrenades amb grans conjunts d'imatges etiquetades, on el model aprèn els trets visuals que distingeixen una cosa d'una altra. Una càmera de fàbrica que inspecciona cada producte d'una línia i assenyala els ratllats és visió per computador fent control de qualitat més de pressa i amb més constància del que podria un humà.
Les aplicacions van des de la imatge mèdica i els cotxes autònoms fins al cobrament a botiga, l'escaneig de documents i la moderació de contingut. El que comparteixen és un pas on les dades visuals, les més difícils de manejar per al programari, es converteixen en informació estructurada sobre la qual un sistema pot actuar.
Integrem la visió per computador en productes on una càmera pot substituir un pas manual lent o propens a l'error, inspeccionar, comptar, classificar, llegir. La part honesta d'aquesta feina són les dades. Un model de visió necessita prou exemples etiquetats dels casos rars, els defectes i les condicions límit, i reunir-los sol ser el projecte de veritat.
Les marques globals ens porten problemes on el senyal visual és obvi per a una persona i sorprenentment difícil per a una màquina, i és aquí on la cosa es posa interessant. Les nostres solucions d'intel·ligència artificial emparellen aquí el model adequat amb les restriccions de l'entorn real, una llum que canvia, angles que es mouen, objectes que se solapen. Ho construïm, ho provem contra els casos bruts i llancem una cosa que aguanta a la línia de producció i no només al laboratori.
Una tasca visual que una persona fa a poc a poc mil cops al dia? Automatitzem-la.
Una empresa de logística que envia a 190 països va construir alguna cosa per enviar-se a si mateixa.
Convertir una marca en un negoci que funciona.
Mig milió de persones. Una app. Zero caos.















