© SCS
Das Team um Christof Bühler von der Supercomputing Systems AG hatte die Idee, die KI-Lösung der Drohne hybrid zu trainieren – mit Bildern von in echte Swisstopo-Karten «gestürzten» IR-Avataren.In der Rega-Drohne sucht ein selbstlernender Algorithmus in den von den Kameras gelieferten Bildern nach Umrissen menschlicher Körper. Für das Training dieser als «Human Detection Pipeline» bezeichneten KI-Lösung nutzten die Spezialisten*innen der Zürcher Firma Supercomputing Systems AG unter anderem Gamingtechnologie.
Computer sind leistungsstark, werden nie müde, lassen sich nicht ablenken und verpassen nie etwas. Das macht sie bei Suchaufgaben dem Menschen überlegen. Allerdings müssen auch Maschinen zuerst lernen, wie Dinge aussehen, ehe sie gezielt nach diesen suchen können. Dazu wird «supervised machine learning» eingesetzt: Das KI-Netz lernt anhand von Bildern, auf denen die zu erkennenden Objekte – im Fall der Rega-Drohne menschliche Körper – klar markiert (gelabelt) sind, um diese von anderen Objekten wie Bäumen, Häusern, Autos, Steinen oder Felsen zu unterscheiden. «Erst nach intensivem Training mit Zigtausenden gelabelten Bildern kann der Algorithmus in den von den beiden Kameras aufgenommenen Videostreams mit hoher Wahrscheinlichkeit jene Bilder und Pixelmuster detektieren, die eine Person zeigen», erklärt Christof Bühler, KI-Spezialist und Leiter der Abteilung Life Science & Physics bei der Supercomputing Systems AG. «Dabei ist es wichtig, dass die für das Training verwendeten gelabelten Bilder möglichst unterschiedlich sind. Sie müssen Menschen in unterschiedlicher Kleidung, in diversen Positionen und Situationen, bei verschiedenen Temperaturen und Lichtverhältnissen zeigen – sowohl zur Gänze als auch halb verdeckt im Gelände, etwa unter einem Baum. Je höher die Variation der Trainingsbilder, umso besser kann die KI-Lösung generalisieren und umso zuverlässiger und präziser gelingt ihr die Detektion menschlicher Körper.»
Das freilich ist aufwendig und zeitintensiv. Zwar gibt es, wie Christof Bühler erklärt, öffentlich zugängliche Datenbanken mit Unmengen gelabelter Bilder. Allerdings handelt es sich dabei vorwiegend um Tageslichtbilder und eher selten um Infrarotbilder, wie sie für das Training der Rega-Lösung nötig waren.
© SCSUm KI-Lösungen zu trainieren, braucht es Unmengen möglichst unterschiedlicher Bilder, in denen das zu suchende Objekt klar markiert (gelabelt) ist.© SCS
Oben einige IR-Bilder von Menschen, darunter einige hybride Trainingsbilder von IR-Avataren in Swisstopo-Umgebung.Folglich hätte die Rega selbst eine enorme Zahl von Videos drehen, in diesen die IR-Fotos mit Menschen in unterschiedlichsten Positionen und Situationen aufspüren und anschliessend labeln müssen. «Das ist natürlich mühsam und braucht enorm viel Zeit-, Personal- und Ressourcenaufwand», sagt Christof Bühler. «Doch zum Glück gibt es die Gamingindustrie! Diese generiert Avatare, also digital erzeugte menschliche Körper mit sehr hochwertiger Darstellung der Biomechanik von Gliedmassen und Gelenken – und stellt sie zu Tausenden in frei zugänglichen Open-Source-Bibliotheken zur Verfügung. Wir nutzten daher solche Avatare als Sparringpartner*innen für die KI-Lösung. Dazu wandelten wir die Avatare zunächst in IR-Bilder um – und liessen diese dann in echte 3D-Karten von Swisstopo . So konnten wir – übrigens im Rahmen der Masterarbeit eines Studenten der ETH Zürich – vergleichsweise einfach und schnell einen grossen Fundus sehr vielfältiger hybrider – also aus künstlichen und realen Daten komponierter – Trainingsbilder fü die KI-Lösung generieren.»
Mit ihrer Erfahrung im Bereich industrialisiertes maschinelles Lernen (sog. Machine Learning Operations) integrierte das SCS-Team von Christof Bühler diese hybriden Trainingsdaten in den Algorithmus und lancierte eine neue, robuste Softwareversion, die dann auf den embedded Computer an Bord der Drohne aufgespielt wurde. «Dank des Avatar-Trainings erhöhte sich die Erkennungsrate um 30 Prozent. Zudem stieg die Confidence des KI-Algorithmus um 60 Prozent, was wiederum erlaubt, die Zahl der falsch - positiven Meldungen zu reduzieren», sagt Christof Bühler – und verhehlt nicht die in ihm brodelnde Spannung, zu erfahren, wie sich das mit Gaming-Avataren geschulte Hightech-Suchgerät im ersten Ernsteinsatz bei der Personensuche bewähren wird.