KI sehen und verstehen (Stand Nr. 41)
Hochschule Mainz – Fachbereich Technik – i3mainz Institut für Raumbezogene Informations- und Messtechnik
Ein erklärbarer Ansatz für Tiefenberechnung aus Stereobildern in neuronalen Netzen
Tiefenberechnung aus Bildern erfolgt in vielen Bereichen der Technik. Ob aus Luftbildern mit Drohnen in der Bau-Wirtschaft, als Qualitätskontrolle in der Industrie oder im maschinellen sehen im Bereich der Robotik. Für den Übergang vom Bild zur Tiefe gibt es verschiedene Ansätze. Einige funktionieren klassisch über Geometrie in Verbindung mit verständlichen Algorithmen. In diesem Prozess kann jedes Einzelstück von der Bildentstehung bis zur interpretierten Tiefe begriffen und Analysiert werden.
Ein sehr moderner Ansatz ist die Berechnung der Tiefe mit Hilfe künstlicher Intelligenz in Neuronalen Netzen. Hier werden einzelne Bilder mit ihren bereits vorhandenen Tiefenwerten dazu genutzt um die Tiefenentstehung aus Bildern zu „erlernen“.
Dafür wird immer wieder ein Prozess durchlaufen, der aus sehr vielen bestimmten Rechenoperationen besteht. Kleine Änderungen an den Werten in diesem Rechenprozess sollen ihn definieren. Die Ergebnisse sind je nach Anwendung oft zufriedenstellend, können aber aufgrund der Masse an einzelnen Berechnungen nicht mehr nachvollzogen werden.
In unserem Projekt wurden die Erkenntnisse und Methoden aus klassischen Ansätzen der Tiefenberechnung als neuronales Netz formuliert. In die Entwicklung des Netzes wurde also bereits bekanntes Vorwissen erfolgreich übernommen um die Auswirkungen auf den Trainingsprozess zu untersuchen
INTERAKTION
Verschiedene Methoden der 3D Datenerfassung mit Kameras ausprobieren und Unterschiede selbst feststellen.
ZIELGRUPPE
Ab Sekundarstufe I (ab ca. 10 Jahre)