Tecnologia

IA per lo sviluppo di nuove proteine grazie al software RosettaFold

di |

Progettare da zero proteine che non sono presenti in natura. È il nuovo traguardo raggiunto dall’intelligenza artificiale, facendo leva su un nuovo metodo pubblicato sulla rivista Nature.

Sull’affascinante tema dell’IA per lo sviluppo di nuove proteine, queste parole sono eloquenti: “È un rilevante passo in avanti rispetto a quel che si era appreso a fare finora“. Questo il commento di Marco Marcia, del Laboratorio Europeo di Biologia Molecolare (European Molecular Biology Laboratory). Si tratta dell’istituto di ricerca che – ricorrendo all’algoritmo della struttura AlphaFold sviluppato in collaborazione con DeepMind – aveva consentito, un anno fa, di prevedere la struttura tridimensionale della maggior parte delle proteine di ogni organismo vivente, circa 215 milioni. Ciò permette di conoscere la struttura di (quasi) ogni proteina.

Adesso c’è uno step in più. La nuova metodologia resa nota sulla rivista Nature – titolo del contributo: “De novo design of protein structure and function with RFdiffusion” –, messa a punto da un team di ricercatori con a capo David Baker, biochimico e biologo computazionale dell’Università di Washington a Seattle, consente di creare in tempi veloci una serie di molecole utili in svariati comparti: da biomarcatori per individuare sostanze inquinanti e patologie fino alla realizzazione di nanomacchine e persino per creare vaccini e farmaci. Di fatto, diviene possibile disegnare nuove proteine, molecole in 3D fino a questo momento inesistenti.

L’intelligenza artificiale genera proteine da zero

IA per lo sviluppo di nuove proteine, progettandole da zero. È realtà grazie all’algoritmo di RosettaFold Diffusion, nuova versione di RosettaFold, algoritmo analogo ad AlphaFold che sfrutta una differente tipologia di approccio in rimando ai modelli di diffusione usati per applicazioni nella generazione di testi o immagini. Per comprendere la portata dell’algoritmo di deep learning AlphaFold, è sufficiente pensare che riesce a prevedere – nell’arco di poche ore e partendo da un database sconfinato – una serie di strutture proteiche note, nuove strutture proteiche e il loro sviluppo a livello atomico con un dettaglio senza precedenti.

Molecole per individuare virus e inquinanti

Tra i primi risultati emersi, c’è quello di disegnare una nuova proteina in grado di legarsi alla superficie di un virus influenzale. Con le metodologie precedenti, sarebbero occorse decine di migliaia di molecole prima di individuare quelle che si legano alle molecole bersaglio. Ora, invece, è sufficiente provarne solo qualcuna.

Grazie al nuovo algoritmo, inoltre, c’è la concreta possibilità di realizzare, in maniera semplice, molecole “ad hoc” per scoprire inquinanti presenti nell’acqua o nell’aria, spesso complicati da individuare. In un futuro tutt’altro che distante, insomma, sarà possibile pensare di utilizzare questi nuovi strumenti per realizzare, solo per fare un esempio, delle vere e proprie macchine molecolari fino a oggi impossibili.