“Lo sviluppo degli algoritmi generativi sta avendo un’accelerazione senza precedenti” scrive Alessio Pomaro, ingegnere informatico. Dopo le immagini generate da un’IA a partire da una frase, la tecnologia è andata addirittura oltre: la creazione di video e audio, partendo da un input testuale. In questo articolo, vengono portate ad esempio alcune compagnie che hanno iniziato ad introdurre questa novità.

La prima è Meta, che ha presentato da poco Make-a-Video un sistema in grado di generare un video partendo da un contenuto testuale, da un’immagine o da un altro video. Purtroppo, il programma non è ancora disponibile al pubblico, ma di seguito siamo in grado di offrire un esempio di cosa può produrre l’intelligenza artificiale digitando la frase “a teddy bear painting a portrait” (un orsetto di peluche che dipinge un ritratto).

Il fondatore di Meta, Mark Zuckerberg, ha detto a proposito del progetto: “è un procedimento davvero interessante. È molto più complesso generare un video che una foto, perché il sistema deve predire come i pixel che genera cambieranno via via”.

Oltre ad un generatore di video, Meta ha presentato anche un generatore di file audio, AudioGen: un modello di intelligenza artificiale basato su Transformer. Il sistema è in grado di separare e riprodurre suoni di diversa origine, nonché di creare nuovi audio partendo da un indizio testuale.

Anche Google si è cimentata nello sviluppo di IA generative, come Imagen Video e AudioLM. Il primo, come Make-a-Video di Meta, è in grado di produrre, tramite input testuale, un video che viene prima generato in dimensioni molto ridotte per poi venire ingrandito tramite algoritmi specifici. Il secondo riesce a replicare e continuare il parlato di un individuo o il suono di un oggetto, mantenendone le caratteristiche, come si può notare qui di seguito:

Si è già iniziato a generare piccoli film con l’ausilio dell’IA e ne è un esempio Glenn Marshall, vincitore del premio “miglior cortometraggio” al festival di Cannes, a testimonianza di come l’innovazione venga accolta positivamente.

Come scrive Pomaro: “La via della crescita è proprio questa: non solo modelli sempre più grandi, ma nuovi approcci e paradigmi.”