Alessandro Sambini & Gilberto Decaro

Alessandro Sambini & Gilberto Decaro

Una conversazione non conclusa sulla visione dei robot

Gilberto Decaro, ritratto di Alessandro Sambini & Giorgina, 2016

Gilberto Decaro è un programmatore di robot. Ho deciso di rivolgergli alcune domande sul tema della “visione” e dello “sguardo” provando a capire come questi termini si adattino al mondo dei robot. Invece di proporvi un testo finito vi propongo una chiacchierata in fase di costruzione. Avrò sicuramente altre domande da proporgli e non ho intenzione di chiudere questa questione in queste poche righe.

A – Guardare deriva dal tedesco wardōn che significa “guardare” ma che incorpora anche l’accezione “stare in guardia”. Vedere è una capacità innata che abbiamo noi uomini e che è connaturata all’apparato visivo: apriamo gli occhi e vediamo. Quando osserviamo o scrutiamo, invece, attiviamo un livello di attenzione maggiore su oggetti, animali, persone o scenari (o porzioni di essi) che per qualche ragione (salvaguardia personale, studio, ricerca antropologica, ecc.) ci sembrano meritevoli. In che maniera queste tre caratteristiche si adattano al mondo dei robot?

G – Queste caratteristiche presuppongono la presenza di una visione evoluta, in parte sovra-sfruttata. Il nostro apparato visivo fornisce immagini attraverso uno strumento molto potente come gli occhi, ma le informazioni che queste immagini generano sono sensibilmente superiori ai dati in esse contenute sia grazie alla nostra conoscenza a priori, che arricchisce il dato di infinite associazioni aggiuntive, sia per le capacità di calcolo imprecise, ma molto efficaci del nostro cervello; l’equilibrio, per esempio, è in buona parte influenzato dalla vista. A vari livelli tutte queste caratteristiche sono presenti nell’atto della vista. Il robot non ha innata alcuna capacità visiva ed elabora le immagini ricevute con il solo scopo di risolvere il problema per cui è stato creato, di conseguenza ha una visione molto specializzata che in alcuni casi può essere superiore a quella umana (i.e. il riconoscere il minimo movimento, il riconoscere difetti infinitesimi o il vedere al buio), ma che soffre di un deficit nella percezione.

A – Per quanto riguarda le immagini invece che vengono incorporate nella nostra memoria, in che modo il materiale visivo oggetto di attenzione (minore, maggiore, attiva o passiva) degli “occhi” di un robot viene conservato, registrato, tralasciato, scartato o dimenticato?

G – Dipende molto dal tipo di visione implementata. Al di la della capacità di registrazione di alcuni robot di sorveglianza o simili, una capacità che sebbene molto evoluta è paragonabile a quella di un video registratore, alcune tecniche come per esempio le reti neurali applicate alla visione, apprendono direttamente dalle immagini l’informazione di interesse. Vengono addestrate con grosse quantità di immagini a riconoscere determinati aspetti come oggetti o volti e sebbene non abbiano memoria delle figure vere e proprie imparano da esse le caratteristiche da ricercare per poterle riconoscere. Non è una vera e propria memoria, ma una struttura logica che rappresenta, in un certo senso, le esperienze vissute.

A – Chi decide questo, il programmatore o il robot?

G – E’ il programmatore che costruisce le capacità di percezione del robot e il comportamento da avere in base agli stimoli ricevuti, anche attraverso tecniche legate all’auto apprendimento che rendono il robot più indipendente dalla mano del programmatore.

A – Quando di fronte a noi qualcosa cambia improvvisamente traiettoria, ci allarmiamo. Una persona che cade, un oggetto che accelera, un movimento imprevisto. Degli improvvisi cambi di direzione accompagnati da una accelerazione, ci spaventano e ci portano a distogliere immediatamente lo sguardo: ci spaventiamo alla vista di incongruenze rispetto a quanto siamo soliti vedere. Come associare l’idea di spavento ai robot? Quando sentono il bisogno di distogliere lo sguardo? 

G -La paura è una sensazione primordiale, istintiva, legata strettamente alla sopravvivenza di un essere vivente; non credo che esistano robot che implementino tale sensazione forse anche a causa della nostra visione dei robot come “macchine per svolgere un lavoro”, non è molto utile che una macchina abbia paura. Per assurdo in una situazione di paura, per esempio il rilevamento di un incendio o di un intruso spingerebbe il robot ad osservare la scena con insistenza rispetto al distogliere lo sguardo. L’incongruenza nella visione è frutto della contestualizzazione della scena, i robot allo stato attuale contestualizzano poco, essendo un compito particolarmente complesso e quindi difficilmente rilevano incongruenze nell’osservazione. Un robot potrebbe rilevare un’incongruenza nell’immagine, come non rilevare nulla di anomalo sebbene ci sia a causa della non contestualizzazione della scena, in entrambi i casi tenderà probabilmente ad osservare l’oggetto e lo sguardo non verrebbe distolto.

Tags from the story
, , ,