The Premise News
Tecnología

Nueva técnica de imagen convierte paredes y muebles en pantallas virtuales para visión 3D

Victória dos Santos de Sá
Nueva técnica de imagen convierte paredes y muebles en pantallas virtuales para visión 3D PHOTO BY The Premise News

Una innovadora técnica de imagen computacional, desarrollada por investigadores de la Universidad Rice y la Universidad de Arizona, transforma superficies mates cotidianas —como paredes, muebles y ropa— en pantallas virtuales que permiten a las máquinas reconstruir escenas tridimensionales con velocidad y precisión excepcionales. Publicado en Nature Communications, el método aborda una debilidad crítica de la visión artificial actual: la incapacidad de capturar con exactitud entornos dinámicos que contienen tanto objetos mates como reflectantes. Al proyectar luz láser sobre superficies no reflectantes y utilizar una cámara neuromórfica de alta velocidad, el sistema registra cambios rápidos en la intensidad lumínica en lugar de fotogramas completos, mejorando drásticamente el rendimiento en condiciones de iluminación difíciles y con sujetos en movimiento. Este avance podría impulsar aplicaciones que van desde la conducción autónoma hasta la inspección industrial y el reconocimiento facial.

Superando las limitaciones de la visión artificial tradicional

La mayoría de los sistemas de imagen 3D existentes se basan en luz estructurada, que proyecta patrones sobre una escena y mide cómo se deforman al interactuar con las superficies. Sin embargo, estos sistemas suelen fallar ante el movimiento, la iluminación intensa o escenas que combinan materiales mates y reflectantes. En entornos de reflectancia mixta, la luz que rebota entre superficies distorsiona las mediciones y degrada la calidad de la imagen. La nueva metodología supera estos obstáculos al reutilizar las mismas superficies que causaban problemas —paredes, ropa y muebles mates— convirtiéndolas en pantallas virtuales que reflejan los puntos láser proyectados sobre objetos brillantes.

Deflectometría reinventada para entornos reales

Ashok Veeraraghavan, presidente del Departamento de Ingeniería Eléctrica y Computación de la Escuela de Ingeniería y Computación George R. Brown de Rice, explicó que el equipo aprovechó una técnica conocida como deflectometría, que mide la forma de superficies brillantes observando cómo se distorsionan los patrones de luz al reflejarse. Tradicionalmente, la deflectometría requiere pantallas grandes y cuidadosamente posicionadas, lo que resulta costoso y poco flexible. Al proyectar luz láser sobre superficies mates ya presentes en la escena, los investigadores eliminaron la necesidad de equipos especializados, convirtiendo cualquier habitación en un entorno funcional de imagen. Este cambio no solo reduce costos, sino que también permite adaptar el sistema a cualquier espacio sin necesidad de infraestructura previa.

El proceso de imagen en dos etapas

El proceso de captura se desarrolla en dos fases. Primero, un láser escanea superficies mates como paredes, ropa y muebles para crear mapas 3D precisos de esas superficies. Cuando los puntos láser se reflejan en objetos brillantes, el sistema reutiliza las superficies mates circundantes como pantallas virtuales, según explicó Aniket Dashpute, estudiante de posgrado en el laboratorio de Veeraraghavan y primer autor del estudio. En la segunda etapa, una cámara neuromórfica —que registra cambios en la intensidad lumínica en lugar de fotogramas completos— reconstruye videos 3D de alta velocidad. Jiazhang Wang, investigador postdoctoral asociado en el Wyant College of Optical Sciences de la Universidad de Arizona y segundo autor del artículo, señaló que esta cámara puede manejar niveles de luz muy diferentes, desde muy tenue hasta extremadamente brillante, permitiendo medir todas las superficies de una escena con igual precisión y velocidad, independientemente de su reflectividad.

Una combinación que supera a los sensores convencionales

La combinación de escaneo láser e imagen basada en eventos representa una desviación significativa respecto a la detección 3D convencional. Mientras que las cámaras estándar se verían abrumadas por el movimiento rápido o los contrastes lumínicos extremos, la cámara de eventos captura solo los cambios, reduciendo la carga de datos y aumentando la resolución temporal. Además, este enfoque evita el deslumbramiento y la saturación que afectan a las cámaras tradicionales en condiciones de iluminación extrema. Esto hace que el sistema sea particularmente adecuado para aplicaciones en tiempo real, donde cada milisegundo cuenta.

Aplicaciones y escalabilidad del sistema

Este avance podría transformar la visión artificial en varios campos de alto riesgo. Para los vehículos autónomos, la capacidad de percibir con precisión peatones, otros automóviles y superficies de carretera en condiciones de iluminación mixta y reflectancia compleja es fundamental para una navegación segura. En la inspección industrial, los fabricantes podrían utilizar la técnica para detectar defectos en piezas metálicas brillantes o superficies transparentes que actualmente escapan a los escáneres estándar. Los sistemas de reconocimiento facial podrían beneficiarse de una detección de profundidad más robusta en entornos variados, mientras que las aplicaciones de detección humana —como el reconocimiento de gestos o la monitorización de la salud— podrían ganar en velocidad y precisión.

Aunque la tecnología hasta ahora solo se ha demostrado en un entorno de laboratorio de mesa, los investigadores destacan que el enfoque es inherentemente escalable. Florian Willomitzer, profesor asociado del Wyant College of Optical Sciences y colaborador del estudio, explicó que la escalabilidad es un requisito crucial para la imagen 3D. El mismo método podría adaptarse para medir pequeños vasos sanguíneos reflectantes durante una cirugía o para digitalizar habitaciones y edificios enteros, ofreciendo la flexibilidad de operar a escalas y entornos muy diferentes. Esta versatilidad sugiere que la técnica podría eventualmente miniaturizarse para dispositivos portátiles o ampliarse para escaneos arquitectónicos de gran escala.

Nuestra perspectiva — The Premise News: Este avance representa más que un ingenioso logro técnico: señala un cambio fundamental en cómo las máquinas perciben el mundo físico. Al convertir los mismos obstáculos que afectaban a sistemas anteriores en activos, los investigadores han abierto un camino hacia una visión 3D verdaderamente robusta y en tiempo real. Lo que está en juego es la fiabilidad de los sistemas autónomos que deben operar en entornos humanos impredecibles, desde coches autónomos hasta robots quirúrgicos. La tensión clave reside entre la precisión de laboratorio y el caos del mundo real; este método cierra esa brecha al utilizar el caos mismo como herramienta. Los lectores deben estar atentos a las demostraciones del concepto fuera del laboratorio, particularmente en escenarios exteriores o de alto movimiento, así como a los esfuerzos por comercializar la tecnología. El hecho de que el equipo incluya miembros tanto de una destacada escuela de ingeniería como de un centro líder en ciencias ópticas subraya la colaboración interdisciplinaria necesaria para impulsar la visión artificial. En última instancia, este trabajo nos recuerda que a veces las soluciones más poderosas no provienen de añadir nuevo hardware, sino de ver el entorno con ojos nuevos.

¿Qué te pareció?