Spring GDS 25. Jubiläum
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Computer Vision ist das Feld der KI, das Maschinen Bilder und Video interpretieren lässt. Wo ein Mensch auf ein Foto blickt und sofort einen Hund, ein Verkehrsschild oder einen Defekt an einem Teil erkennt, sieht ein Computer ein Raster aus Pixelwerten. Computer Vision ist die Menge der Techniken, die aus diesen rohen Pixeln etwas Bedeutsames machen: ein Label, eine Position, eine Zählung, eine Entscheidung.
Häufige Aufgaben sind Klassifikation (was ist auf diesem Bild), Objekterkennung (was ist darauf und wo), Segmentierung (welche genauen Pixel gehören zu welchem Objekt) und das Verfolgen von Objekten über die Einzelbilder eines Videos. Die meiste moderne Computer Vision läuft auf neuronalen Netzen, die mit großen Mengen gelabelter Bilder trainiert werden. Das Modell lernt die visuellen Merkmale, die eine Sache von einer anderen unterscheiden. Eine Fabrikkamera, die jedes Produkt auf einer Linie prüft und die zerkratzten meldet, ist Computer Vision in der Qualitätskontrolle, schneller und gleichmäßiger als ein Mensch es könnte.
Die Anwendungen reichen von medizinischer Bildgebung und selbstfahrenden Autos bis zum Kassenvorgang im Handel, dem Scannen von Dokumenten und der Inhaltsmoderation. Ihnen gemeinsam ist ein Schritt, in dem visuelle Daten, die für Software schwierigste Art, zu strukturierter Information werden, auf die ein System reagieren kann.
Wir bauen Computer Vision in Produkte ein, wo eine Kamera einen langsamen oder fehleranfälligen manuellen Schritt ersetzen kann, prüfen, zählen, sortieren, lesen. Der ehrliche Teil dieser Arbeit sind die Daten. Ein Vision-Modell braucht genügend gelabelte Beispiele der seltenen Fälle, der Defekte und Grenzbedingungen. Diese zusammenzutragen ist meist das eigentliche Projekt.
Globale Marken bringen uns Probleme, bei denen das visuelle Signal für einen Menschen offensichtlich und für eine Maschine überraschend schwer ist. Genau dort wird es interessant. Unsere KI-Lösungen verbinden hier das passende Modell mit den Bedingungen der echten Umgebung, wechselndes Licht, verschobene Winkel, überlappende Objekte. Wir bauen es, testen es gegen die unsauberen Fälle und liefern etwas, das an der Linie standhält und nicht nur im Labor.
Eine visuelle Aufgabe, die ein Mensch tausendmal am Tag langsam erledigt? Automatisieren wir sie.
Ein Logistikunternehmen, das in 190 Länder versendet, hat etwas gebaut, um an sich selbst zu liefern.
Eine Marke in ein funktionierendes Geschäft verwandeln.
Eine halbe Million Menschen. Eine App. Null Chaos.















