Une nouvelle technique d'imagerie computationnelle, mise au point par des chercheurs de l'Université Rice et de l'Université de l'Arizona, transforme les surfaces mates du quotidien — murs, meubles, vêtements — en écrans d'affichage virtuels. Publiée dans Nature Communications, cette méthode permet aux machines de reconstruire des scènes tridimensionnelles avec une rapidité et une exactitude exceptionnelles. Elle répond à une faiblesse majeure de la vision artificielle actuelle : l'incapacité à capturer fidèlement des environnements dynamiques mêlant objets mats et réfléchissants. En projetant un faisceau laser sur des surfaces non réfléchissantes et en utilisant une caméra neuromorphique à haute vitesse, le système enregistre les variations d'intensité lumineuse plutôt que des images complètes, ce qui améliore considérablement les performances sous un éclairage difficile et avec des sujets en mouvement.
Une méthode qui surmonte les limites de la vision artificielle
La plupart des systèmes d'imagerie 3D existants reposent sur la lumière structurée, qui projette des motifs sur une scène et mesure leur déformation sur les surfaces pour créer des cartes de profondeur. Bien que largement utilisés, ces systèmes échouent souvent face au mouvement, à un éclairage agressif ou à des scènes contenant un mélange de matériaux mats et réfléchissants. Dans ces environnements à réflectance mixte, la lumière qui rebondit entre les surfaces fausse les mesures et dégrade la qualité de l'image. La nouvelle approche surmonte ces obstacles en réutilisant les surfaces mêmes qui posent problème — murs mats, vêtements, meubles — comme écrans virtuels qui réfléchissent les points laser projetés sur les objets brillants.
Le principe de la déflectométrie réinventé
Ashok Veeraraghavan, titulaire de la chaire du département de génie électrique et informatique à la George R. Brown School of Engineering and Computing de Rice, explique que l'équipe a exploité une technique bien connue en vision par ordinateur : la déflectométrie. Celle-ci mesure la forme des surfaces brillantes en observant comment les motifs lumineux projetés se déforment lors de la réflexion. Traditionnellement, la déflectométrie nécessite de grands écrans soigneusement positionnés, ce qui rend le processus coûteux et peu flexible. En projetant la lumière laser sur des surfaces mates déjà présentes dans la scène, les chercheurs ont éliminé le besoin d'équipement spécialisé, transformant n'importe quelle pièce en un environnement d'imagerie fonctionnel.
Fonctionnement : lasers et caméra neuromorphique
Le processus d'imagerie se déroule en deux étapes. D'abord, un laser balaie les surfaces mates — murs, vêtements, meubles — pour créer des cartes 3D précises de ces surfaces. Lorsque les points laser se réfléchissent sur des objets brillants, le système réutilise efficacement les surfaces mates environnantes comme écrans d'affichage virtuels, comme le décrit Aniket Dashpute, étudiant diplômé dans le laboratoire de Veeraraghavan et premier auteur de l'étude. Ensuite, une caméra neuromorphique — qui enregistre les changements d'intensité lumineuse plutôt que des images complètes — reconstruit des vidéos 3D à haute vitesse. Cette caméra peut gérer des niveaux de lumière très variés, de très faible à extrêmement brillant, permettant de mesurer toutes les surfaces d'une scène avec une précision et une vitesse égales, quelles que soient les variations de réflectivité, note Jiazhang Wang, associé de recherche postdoctoral au Wyant College of Optical Sciences de l'Université de l'Arizona et second auteur de l'article.
La combinaison du balayage laser et de l'imagerie par événements représente une rupture significative avec la détection 3D conventionnelle. Là où les caméras standard seraient submergées par un mouvement rapide ou des contrastes lumineux extrêmes, la caméra événementielle ne capture que les changements, réduisant la charge de données et augmentant la résolution temporelle. Cela rend le système particulièrement adapté aux applications en temps réel où chaque milliseconde compte.
Des applications prometteuses dans de nombreux secteurs
Cette avancée pourrait transformer la vision artificielle dans plusieurs domaines à forts enjeux. Pour les véhicules autonomes, la capacité à percevoir avec précision les piétons, les autres voitures et les surfaces routières dans des conditions d'éclairage mixte et de réflectance complexe est cruciale pour une navigation sûre. Dans l'inspection industrielle, les fabricants pourraient utiliser la technique pour détecter des défauts sur des pièces métalliques brillantes ou des surfaces transparentes qui échappent actuellement aux scanners standards. Les systèmes de reconnaissance faciale pourraient bénéficier d'une détection de profondeur plus robuste dans des environnements variés, tandis que les applications de détection humaine — comme la reconnaissance gestuelle ou la surveillance de la santé — gagneraient en vitesse et en précision.
Une évolutivité de l'échelle microscopique à architecturale
Bien que la technologie n'ait pour l'instant été démontrée que dans un environnement de laboratoire sur table, les chercheurs insistent sur le fait que l'approche est intrinsèquement évolutive. Comme l'explique Florian Willomitzer, professeur associé au Wyant College of Optical Sciences et collaborateur de l'étude, l'évolutivité est une exigence cruciale pour l'imagerie 3D. La même méthode pourrait être adaptée pour mesurer de minuscules vaisseaux sanguins réfléchissants pendant une chirurgie ou pour numériser des pièces et des bâtiments entiers, offrant la flexibilité de fonctionner à des échelles et dans des environnements très différents. Cette polyvalence suggère que la technique pourrait à terme être miniaturisée pour des appareils portables ou étendue pour le balayage architectural à grande échelle.
