Una innovadora técnica de imagen computacional, desarrollada por investigadores de la Universidad Rice y la Universidad de Arizona, transforma superficies mates cotidianas —como paredes, muebles y ropa— en pantallas virtuales que permiten a las máquinas reconstruir escenas tridimensionales con velocidad y precisión excepcionales. Publicado en Nature Communications, el método aborda una debilidad crítica de la visión artificial actual: la incapacidad de capturar con exactitud entornos dinámicos que contienen tanto objetos mates como reflectantes. Al proyectar luz láser sobre superficies no reflectantes y utilizar una cámara neuromórfica de alta velocidad, el sistema registra cambios rápidos en la intensidad lumínica en lugar de fotogramas completos, mejorando drásticamente el rendimiento en condiciones de iluminación difíciles y con sujetos en movimiento. Este avance podría impulsar aplicaciones que van desde la conducción autónoma hasta la inspección industrial y el reconocimiento facial.
Superando las limitaciones de la visión artificial tradicional
La mayoría de los sistemas de imagen 3D existentes se basan en luz estructurada, que proyecta patrones sobre una escena y mide cómo se deforman al interactuar con las superficies. Sin embargo, estos sistemas suelen fallar ante el movimiento, la iluminación intensa o escenas que combinan materiales mates y reflectantes. En entornos de reflectancia mixta, la luz que rebota entre superficies distorsiona las mediciones y degrada la calidad de la imagen. La nueva metodología supera estos obstáculos al reutilizar las mismas superficies que causaban problemas —paredes, ropa y muebles mates— convirtiéndolas en pantallas virtuales que reflejan los puntos láser proyectados sobre objetos brillantes.
Deflectometría reinventada para entornos reales
Ashok Veeraraghavan, presidente del Departamento de Ingeniería Eléctrica y Computación de la Escuela de Ingeniería y Computación George R. Brown de Rice, explicó que el equipo aprovechó una técnica conocida como deflectometría, que mide la forma de superficies brillantes observando cómo se distorsionan los patrones de luz al reflejarse. Tradicionalmente, la deflectometría requiere pantallas grandes y cuidadosamente posicionadas, lo que resulta costoso y poco flexible. Al proyectar luz láser sobre superficies mates ya presentes en la escena, los investigadores eliminaron la necesidad de equipos especializados, convirtiendo cualquier habitación en un entorno funcional de imagen. Este cambio no solo reduce costos, sino que también permite adaptar el sistema a cualquier espacio sin necesidad de infraestructura previa.
El proceso de imagen en dos etapas
El proceso de captura se desarrolla en dos fases. Primero, un láser escanea superficies mates como paredes, ropa y muebles para crear mapas 3D precisos de esas superficies. Cuando los puntos láser se reflejan en objetos brillantes, el sistema reutiliza las superficies mates circundantes como pantallas virtuales, según explicó Aniket Dashpute, estudiante de posgrado en el laboratorio de Veeraraghavan y primer autor del estudio. En la segunda etapa, una cámara neuromórfica —que registra cambios en la intensidad lumínica en lugar de fotogramas completos— reconstruye videos 3D de alta velocidad. Jiazhang Wang, investigador postdoctoral asociado en el Wyant College of Optical Sciences de la Universidad de Arizona y segundo autor del artículo, señaló que esta cámara puede manejar niveles de luz muy diferentes, desde muy tenue hasta extremadamente brillante, permitiendo medir todas las superficies de una escena con igual precisión y velocidad, independientemente de su reflectividad.
Una combinación que supera a los sensores convencionales
La combinación de escaneo láser e imagen basada en eventos representa una desviación significativa respecto a la detección 3D convencional. Mientras que las cámaras estándar se verían abrumadas por el movimiento rápido o los contrastes lumínicos extremos, la cámara de eventos captura solo los cambios, reduciendo la carga de datos y aumentando la resolución temporal. Además, este enfoque evita el deslumbramiento y la saturación que afectan a las cámaras tradicionales en condiciones de iluminación extrema. Esto hace que el sistema sea particularmente adecuado para aplicaciones en tiempo real, donde cada milisegundo cuenta.
Aplicaciones y escalabilidad del sistema
Este avance podría transformar la visión artificial en varios campos de alto riesgo. Para los vehículos autónomos, la capacidad de percibir con precisión peatones, otros automóviles y superficies de carretera en condiciones de iluminación mixta y reflectancia compleja es fundamental para una navegación segura. En la inspección industrial, los fabricantes podrían utilizar la técnica para detectar defectos en piezas metálicas brillantes o superficies transparentes que actualmente escapan a los escáneres estándar. Los sistemas de reconocimiento facial podrían beneficiarse de una detección de profundidad más robusta en entornos variados, mientras que las aplicaciones de detección humana —como el reconocimiento de gestos o la monitorización de la salud— podrían ganar en velocidad y precisión.
Aunque la tecnología hasta ahora solo se ha demostrado en un entorno de laboratorio de mesa, los investigadores destacan que el enfoque es inherentemente escalable. Florian Willomitzer, profesor asociado del Wyant College of Optical Sciences y colaborador del estudio, explicó que la escalabilidad es un requisito crucial para la imagen 3D. El mismo método podría adaptarse para medir pequeños vasos sanguíneos reflectantes durante una cirugía o para digitalizar habitaciones y edificios enteros, ofreciendo la flexibilidad de operar a escalas y entornos muy diferentes. Esta versatilidad sugiere que la técnica podría eventualmente miniaturizarse para dispositivos portátiles o ampliarse para escaneos arquitectónicos de gran escala.
