The Premise News
Tecnologia

Pareti e mobili diventano schermi 3D: ecco la nuova frontiera della visione artificiale

Victória dos Santos de Sá
Pareti e mobili diventano schermi 3D: ecco la nuova frontiera della visione artificiale PHOTO BY The Premise News

Un team di ricerca della Rice University e dell'Università dell'Arizona ha sviluppato una tecnica di imaging computazionale che trasforma superfici opache di uso quotidiano – pareti, mobili e persino indumenti – in schermi virtuali per la visione tridimensionale. Il metodo, pubblicato su Nature Communications, affronta una debolezza fondamentale dei sistemi di visione artificiale attuali: l'incapacità di catturare con precisione ambienti dinamici che contengono oggetti sia opachi che riflettenti. Proiettando luce laser su superfici non riflettenti e utilizzando una telecamera neuromorfa ad alta velocità, il sistema registra i rapidi cambiamenti di intensità luminosa anziché fotogrammi completi. Questo approccio migliora drasticamente le prestazioni in condizioni di illuminazione difficili e con soggetti in movimento, spiega la ricerca.

Un salto oltre i limiti della visione strutturata

La maggior parte dei sistemi 3D esistenti si basa sulla luce strutturata, che proietta pattern su una scena e misura come si deformano sulle superfici per creare mappe di profondità. Questi sistemi, però, spesso falliscono in presenza di movimento, illuminazione estrema o scene con materiali misti. In ambienti a riflettanza mista, la luce che rimbalza tra le superfici distorce le misurazioni e degrada la qualità dell'immagine. Il nuovo metodo supera queste difficoltà sfruttando proprio quelle superfici che causano problemi – pareti opache, vestiti e mobili – come schermi virtuali che riflettono i punti laser sugli oggetti lucidi. I ricercatori hanno così trasformato un limite in un vantaggio operativo.

Deflettometria senza schermi specializzati

Ashok Veeraraghavan, direttore del Dipartimento di Ingegneria Elettrica e Informatica presso la Rice University, ha spiegato che il team ha ripreso una tecnica nota come deflettometria, usata per misurare la forma di superfici lucide osservando come i pattern di luce proiettati si distorcono al riflesso. Tradizionalmente, la deflettometria richiede grandi schermi posizionati con cura, il che rende il processo costoso e poco flessibile. Proiettando luce laser su superfici opache già presenti nella scena, i ricercatori hanno eliminato la necessità di attrezzature specializzate, trasformando qualsiasi stanza in un ambiente di imaging funzionale. Questo significa che qualsiasi ambiente può diventare un laboratorio di visione 3D, senza installazioni predefinite, ampliando le possibilità applicative.

Il funzionamento: laser e telecamera neuromorfa in sinergia

Il processo di imaging si articola in due fasi principali. Nella prima, un laser scansiona le superfici opache come pareti, vestiti e mobili per creare mappe 3D precise. Quando i punti laser si riflettono su oggetti lucidi, le superfici opache circostanti fungono da schermi virtuali, come ha descritto Aniket Dashpute, studente laureato nel laboratorio di Veeraraghavan e primo autore dello studio. Nella seconda fase, una telecamera neuromorfa – che registra le variazioni di intensità luminosa invece di catturare fotogrammi completi – ricostruisce video 3D ad alta velocità. Jiazhang Wang, ricercatore post-dottorato presso l'Università dell'Arizona, ha osservato che questa telecamera può gestire livelli di luce molto diversi, dal buio all'estrema luminosità, consentendo di misurare tutte le superfici con uguale precisione indipendentemente dalla loro riflettanza. La combinazione di laser e sensori neuromorfi riduce il carico di dati e aumenta la risoluzione temporale, rendendo il sistema ideale per applicazioni in tempo reale.

Dalla robotica alla chirurgia: le potenziali applicazioni

Il nuovo metodo potrebbe rivoluzionare la visione artificiale in settori ad alta criticità. Per i veicoli autonomi, la capacità di percepire pedoni, altri veicoli e superfici stradali in condizioni di illuminazione variabile e con riflessi complessi è essenziale per una navigazione sicura. Nell'ispezione industriale, i produttori potrebbero rilevare difetti su parti metalliche lucide o superfici trasparenti che attualmente sfuggono agli scanner tradizionali. I sistemi di riconoscimento facciale potrebbero beneficiare di una percezione della profondità più robusta in ambienti diversi, mentre applicazioni come il riconoscimento dei gesti o il monitoraggio sanitario potrebbero sfruttare la velocità e la precisione del metodo. Gli autori sottolineano che il sistema è stato finora testato solo in ambiente di laboratorio su banco, ma le implicazioni per la sicurezza e l'efficienza sono vaste.

Scalabilità: dai microscopi agli edifici

Sebbene la tecnologia sia stata dimostrata solo in un contesto di laboratorio su banco, i ricercatori sottolineano che l'approccio è intrinsecamente scalabile. Come ha spiegato Florian Willomitzer, professore associato all'Università dell'Arizona e collaboratore dello studio, la scalabilità è un requisito cruciale per l'imaging 3D. Lo stesso metodo potrebbe essere adattato per misurare piccoli vasi sanguigni riflettenti durante un intervento chirurgico o per digitalizzare intere stanze ed edifici. Questa versatilità suggerisce che la tecnica potrebbe essere miniaturizzata per dispositivi portatili o ampliata per la scansione architettonica su larga scala. Il potenziale di applicazione su scale così diverse rende la scoperta particolarmente promettente per il futuro della visione artificiale.

Il punto di vista di The Premise News: Questo avanzamento non è solo un abile risultato ingegneristico: segna un cambiamento fondamentale nel modo in cui le macchine percepiscono il mondo fisico. Trasformando gli ostacoli che affliggevano i sistemi precedenti in risorse, i ricercatori hanno aperto la strada a una visione 3D robusta e in tempo reale. In gioco c'è l'affidabilità dei sistemi autonomi che devono operare in ambienti umani imprevedibili, dalle auto a guida autonoma ai robot chirurgici. La tensione principale è tra la precisione del laboratorio e il caos del mondo reale; questo metodo colma quel divario usando il caos stesso come strumento. I lettori dovrebbero seguire con attenzione le dimostrazioni fuori dal laboratorio, specialmente in scenari esterni o ad alto movimento, e gli sforzi per commercializzare la tecnologia. Il fatto che il team includa membri di una scuola di ingegneria di prim'ordine e di un centro di scienze ottiche leader sottolinea la collaborazione interdisciplinare necessaria per far progredire la visione artificiale. In definitiva, questo lavoro ci ricorda che a volte le soluzioni più potenti non derivano dall'aggiunta di nuovo hardware, ma dal guardare l'ambiente con occhi nuovi.

Cosa ne pensi?