The Premise News
Tecnologia

Nova técnica transforma paredes e móveis em ecrãs virtuais para visão 3D

Victória dos Santos de Sá
Nova técnica transforma paredes e móveis em ecrãs virtuais para visão 3D PHOTO BY The Premise News

Uma nova técnica de imagiologia computacional desenvolvida por cientistas da Rice University e da Universidade do Arizona transforma superfícies foscas do quotidiano — como paredes, móveis e vestuário — em ecrãs virtuais, permitindo que máquinas reconstruam cenas tridimensionais com excecional rapidez e precisão. Publicado na Nature Communications, o método aborda uma fragilidade crítica da visão artificial atual: a incapacidade de captar com exatidão ambientes dinâmicos que contenham objetos mates e refletivos. Ao projetar luz laser em superfícies não refletoras e ao utilizar uma câmara neuromórfica de eventos de alta velocidade, o sistema regista mudanças rápidas na intensidade luminosa em vez de fotogramas completos, melhorando drasticamente o desempenho em condições de iluminação difíceis e com sujeitos em movimento. Este avanço poderá impulsionar aplicações desde a condução autónoma até à inspeção industrial, passando pelo reconhecimento facial e pela deteção de presença humana.

Abordagem inovadora ataca um desafio de longa data na visão artificial

A maioria dos sistemas de imagiologia 3D atuais recorre a luz estruturada, que projeta padrões sobre uma cena e mede como esses padrões se deformam nas superfícies dos objetos para criar mapas de profundidade. Embora amplamente utilizados, estes sistemas falham frequentemente perante movimento, iluminação intensa ou cenários que combinam materiais mates e refletivos. Em ambientes de refletância mista, a luz que salta entre superfícies distorce as medições e degrada a qualidade da imagem. O novo método supera estes obstáculos ao reaproveitar precisamente as superfícies que causam problemas — paredes foscas, vestuário e móveis — como ecrãs virtuais que refletem pontos laser projetados sobre objetos brilhantes.

Deflectometria reinventada

Ashok Veeraraghavan, diretor do Departamento de Engenharia Elétrica e de Computação da George R. Brown School of Engineering and Computing da Rice, explicou que a equipa recorreu a uma técnica bem conhecida em visão computacional chamada deflectometria, que mede a forma de superfícies brilhantes ao observar como os padrões de luz projetados se distorcem ao refletir. Tradicionalmente, a deflectometria exige ecrãs grandes e cuidadosamente posicionados, tornando o processo caro e pouco flexível. Ao projetar luz laser em superfícies foscas já existentes na cena, os investigadores eliminaram a necessidade de equipamento especializado, transformando qualquer sala num ambiente funcional de imagiologia.

Como funciona o sistema: lasers e deteção neuromórfica

O processo de imagiologia desenrola-se em duas etapas. Primeiro, um laser analisa superfícies foscas — paredes, vestuário, móveis — para criar mapas 3D precisos dessas superfícies. Quando os pontos laser refletem em objetos brilhantes, o sistema reaproveita as superfícies foscas circundantes como ecrãs virtuais, conforme descrito por Aniket Dashpute, estudante de pós-graduação no laboratório de Veeraraghavan e primeiro autor do estudo. Em segundo lugar, uma câmara neuromórfica de eventos — que regista alterações na intensidade luminosa em vez de capturar fotogramas completos — reconstrói vídeos 3D de alta velocidade. Esta câmara consegue lidar com níveis de luz muito diversos, desde muito fracos até extremamente brilhantes, permitindo que todas as superfícies de uma cena sejam medidas com igual precisão e rapidez, independentemente das variações de refletância, salientou Jiazhang Wang, investigador de pós-doutoramento no Wyant College of Optical Sciences da Universidade do Arizona e segundo autor do artigo.

A combinação da análise laser com a imagiologia baseada em eventos representa um afastamento significativo da deteção 3D convencional. Enquanto as câmaras normais seriam sobrecarregadas por movimentos rápidos ou contrastes de luz extremos, a câmara de eventos capta apenas as mudanças, reduzindo a carga de dados e aumentando a resolução temporal. Isto torna o sistema particularmente adequado para aplicações em tempo real, onde cada milésimo de segundo conta.

Aplicações potenciais em múltiplos setores

O avanço pode transformar a visão artificial em várias áreas de alto risco. Para veículos autónomos, a capacidade de perceber com exatidão peões, outros carros e superfícies da estrada em condições de iluminação mista e de refletância complexa é fundamental para uma navegação segura. Na inspeção industrial, os fabricantes poderão usar a técnica para detetar defeitos em peças metálicas brilhantes ou superfícies transparentes que atualmente escapam aos scanners padrão. Os sistemas de reconhecimento facial poderão beneficiar de uma deteção de profundidade mais robusta em ambientes variados, enquanto as aplicações de deteção humana — como reconhecimento de gestos ou monitorização da saúde — poderão ganhar com a velocidade e precisão do método.

Escalabilidade desde escalas microscópicas até arquitetónicas

Embora a tecnologia tenha sido demonstrada apenas num ambiente laboratorial de bancada, os investigadores sublinham que a abordagem é intrinsecamente escalável. Como explicou Florian Willomitzer, professor associado do Wyant College of Optical Sciences e colaborador no estudo, a escalabilidade é um requisito crucial para a imagiologia 3D. O mesmo método poderia ser adaptado para medir minúsculos vasos sanguíneos refletivos durante cirurgias ou para digitalizar salas e edifícios inteiros, oferecendo a flexibilidade de operar a escalas e ambientes muito diferentes. Esta versatilidade sugere que a técnica poderá eventualmente ser miniaturizada para dispositivos portáteis ou expandida para a digitalização arquitetónica de grandes dimensões.

A nossa análise — The Premise News: Este avanço representa mais do que uma mera proeza de engenharia — sinaliza uma mudança fundamental na forma como as máquinas podem perceber o mundo físico. Ao transformar os próprios obstáculos que afligiam sistemas anteriores em ativos, os investigadores abriram um caminho para uma visão 3D verdadeiramente robusta e em tempo real. O que está em jogo é a fiabilidade de sistemas autónomos que têm de operar em ambientes humanos imprevisíveis, desde carros autónomos a robôs cirúrgicos. A tensão central reside entre a precisão laboratorial e o caos do mundo real; este método colmata essa lacuna ao usar o próprio caos como ferramenta. Os leitores devem estar atentos a demonstrações de conceito fora do laboratório, especialmente em cenários exteriores ou de alto movimento, bem como aos esforços para comercializar a tecnologia. O facto de a equipa incluir membros de uma das principais escolas de engenharia e de um centro de ótica de topo sublinha a colaboração interdisciplinar necessária para impulsionar a visão artificial. No final, este trabalho recorda-nos que, por vezes, as soluções mais poderosas não vêm da adição de novo hardware, mas sim de olhar para o ambiente com novos olhos.

O que achou?