Microsoft hat auf der Grafikmesse SIGGRAPH eine neue Software präsentiert, mit der die Positionsbestimmung eines Pixels im Raum vereinfacht werden soll. Interessant dabei ist, dass keine 3D Kamera zum Einsatz kommt.
Wie Microsoft auf seiner Forschungswebseite erklärt, könne damit jede handelsübliche Handylinse oder Webcam mit wenigen Handgriffen in eine 3D-Kamera verwandelt werden. Dieses neue System werde es Nutzern von PCs und Smartphones ermöglichen, ihre Geräte mithilfe von Gesten zu kontrollieren.
Für die Umsetzung setzt Microsoft auf lernfähige Software: Dieser wird ein echtes 3-D-Bild gezeigt, das mit einer 3-D-Kamera aufgenommen wurde. Danach wird die Software mit der gleichen Szene in 2-D-Optik gefüttert. Das Programm errechnet - lernt also sozusagen - welche Tiefeninformationen in 2-D-Bildern wo zu finden sind.
Nach nur einigen Fotoreihen konnte das Programm im Testlauf bereits relativ sicher die ungefähre Position eines Objekts im Raum einschätzen.
Learning to Be a Depth Camera for Close-Range Human Capture and Interaction