Video

Il robot umanoide Alter3 con la mente di GPT-4 suona il rock e si scatta i selfie

di |

Sviluppato dall'Università di Tokyo, il nuovo robot è in grado di assumere differenti pose durante una conversazione con l'utente. Imitando in modo realistico vari comportamenti umani.

È in grado di assumere numerose pose durante una conversazione con l’utente, imitando in modo realistico il comportamento dell’uomo. Il robot umanoide Alter3, sviluppato dall’Università di Tokyo, utilizza il modello linguistico GPT-4 di OpenAI, migliorando così (in modo sensibile) la propria comunicazione non verbale.

Certo, da un punto di vista estetico Alter3 non è “piacevole” al pari del robot umanoide di Tesla (che non piega la maglietta in modo autonomo, come Elon Musk aveva anticipato, ma replica i movimenti di un umano). Né è “combattivo” Nadia, il robot lottatore che funge da sparring partner sul ring. Ma è indubbio che ha alle spalle un approccio unico allo sviluppo che verrà, con l’obiettivo di rendere i robot sempre più umani, adattandoli alla vita in società.

Intanto Alter3 – che ricorre a OpenAI per riprodurre dinamicamente una varietà di pose senza la necessità di pre-programmare ogni singolo movimento nel database (tutto avviene quasi in tempo reale) – simula di suonare la chitarra, di scattarsi un selfie, di muoversi come un serpente, di “camminare” come un fantasma.

Applicazioni del LLM nella robotica

Secondo il report di ricerca del team pubblicato all’interno arXiv – l’archivio per bozze definitive (“pre-prints”) di articoli scientifici in informatica, fisica, matematica e biologia accessibile online – “la capacità di Alter3 di rispondere ai contenuti conversazionali attraverso espressioni facciali e gesti rappresenta un progresso significativo nel campo dei robot umanoidi“.

Le applicazioni dei modelli linguistici di grandi dimensioni nei robot convogliano, soprattutto, su due aspetti: il miglioramento delle capacità comunicative di base e la simulazione di risposte realistiche. Nell’ambito della robotica, infatti, l’uso dei Large Language Models è ancora in fase di esplorazione (ma i ricercatori esplorano il potenziale della tecnologia per aiutare i robot a comprendente e compiere istruzioni complesse) e già adesso tali modelli sono usati per creare interfacce utente naturali per i robot, consentendo un’interazione con gli utenti molto più naturale e intuitiva.

Robot che imitano gli esseri umani

Allo stato attuale il robot sviluppato all’Università di Tokyo riesce a controllare esclusivamente la parte superiore del corpo (la parte inferiore, infatti, resta immobile). Come ben esplicita il nome, questo robot costituisce la terza iterazione della serie Alter di robot umanoidi dal 2016 e detiene 43 attuatori per il controllo del moto (dunque sia delle espressioni facciali sia dei movimenti degli arti).

In studi precedenti, Alter3 è stato capace di dimostrare la capacità di replicare le pose umane usando una fotocamera e la struttura OpenPose (una rete capace di individuare la postura di persone differenti all’interno di un’immagine), regolando le proprie articolazioni per riprodurre i movimenti osservati.