medicina e algoritmi

Guida all’halicina, l’antibiotico scoperto grazie all’IA e al machine learning

di |

Siamo di fronte ad un nuovo modo di fare ricerca farmaceutica, che verrà sicuramente utilizzato in altre occasioni. Non solo: la validità del risultato è stata dimostrata mediante la tradizionale sperimentazione in vitro della molecola.

Halicina: un nuovo antibiotico

L’halicina è un nuovo antibiotico, recentemente scoperto mediante un processo di ricerca basato quasi interamente sul Machine Learning, una tecnica per lo sviluppo di algoritmi di Intelligenza Artificiale. Il nome della sostanza è stato scelto in onore di HAL 9000, mitico e sfortunato elaboratore di “2001 Odissea nello Spazio”.

La ricerca è stata condotta in modalità tabula rasa dal Prof. James Collins (docente di Ingegneria Medica al Massachusetts Institute of Technology, MIT)  e dal suo team. Non è stata fornita all’algoritmo alcuna ipotesi di partenza, ed oggetto dell’elaborazione sono state delle fonti informative (big data) di uso comune in farmacologia.

HAL 900 e Halicin

Secondo il Prof. Jacob Durrant (docente di progettazione di farmaci assistita da computer all’Università di Pittsburgh, Penn.) siamo di fronte ad un nuovo modo di fare ricerca farmaceutica, che verrà sicuramente utilizzato in altre occasioni. Non solo: la validità del risultato è stata dimostrata mediante la tradizionale sperimentazione in vitro della molecola.

Algoritmi di machine learning

Prima di descrivere il procedimento, occorre ricordare che questi algoritmi di machine learning sono degli specialisti. Purtroppo non c’è nessuna formula magica: un algoritmo che produce risultati utili in un’applicazione, come il riconoscimento di testi letterari, di solito fallisce miseramente se viene applicato ad un altro problema (ad es. riconoscimento facciale). Si tratta di una conseguenza del teorema NFL (No Free Lunch, qui non si pranza gratis) dimostrato nel 1997 da Wolpert e Macready.

Per l’appunto, le prime ricerche di Intelligenza Artificiale (tra l’altro, iniziate proprio nell’anno 2001 citato nel film) ricercavano analogie tra le molecole elaborando i testi delle loro descrizioni. Chiaramente, i risultati lasciavano un pò a desiderare: una molecola assomiglia alla sua descrizione in lingua inglese meno di quanto noi possiamo assomigliare alla foto sul nostro passaporto. Invece, il team del MIT è partito dalle formule di struttura: un composto chimico viene descritto come una collezione di atomi, legati tra loro da una rete di legami chimici. Sebbene si tratti ancora di descrizioni approssimate (per analizzare le proprietà di una singola molecola oggi si utilizzano modelli solidi, a tre dimensioni), si tratta di un’innovazione notevole, favorita dalla disponibilità di reti neurali in grado di trovare le analogie tra strutture complesse.

Methilcobalamin

Le fasi

La prima fase nello sviluppo di un algoritmo è il processo di apprendimento: il funzionamento di una rete neurale dipende da numerosi parametri in grado di influenzarne le decisioni. Per determinare i valori da assegnare a questi parametri è stata utilizzata una libreria di 2.335 molecole che hanno dimostrato di bloccare lo sviluppo del famoso Escherichia coli. Questo batterio è per lo più innocuo, ma viene molto maltrattato dalla moltitudine di biologi, farmacologi ed ingegneri genetici che lo scelgono come oggetto dei loro esperimenti. La libreria contiene le strutture di 300 antibiotici approvati dalla farmacopea FDA (Food and Drug Administration) e di altre 800 sostanze di origine animale, vegetale e microbiale. Alla fine del processo di apprendimento, l’algoritmo era in grado di riconoscere i 120 antibiotici più potenti (molecole in grado di impedire lo sviluppo di batteri per almeno l’80%).

Dopo aver addestrato il loro algoritmo, i ricercatori lo hanno utilizzato per verificare le proprietà antibiotiche delle 6.125 molecole del “Drug Repurposing Hub”. Si tratta di un catalogo (gestito dal Broad Institute, una collaborazione tra l’Università di Harvard, il MIT e la rete ospedaliera di Boston) che raccoglie le molecole di cui sono state scoperte proprietà curative ma per cui è ancora in corso la valutazione nei vari contesti clinici (es. giovane-anziano, uomo-donna, magro-obeso).

L’halicina

Una volta selezionale le 99 molecole che secondo il modello avevano la maggiore predisposizione al ruolo di antibiotico, è stata avviata la sperimentazione in vitro, aizzandole contro il povero Escherichia coli. Solo 51 di esse (quasi la metà) hanno riportato qualche successo, ma tra queste la molecola SU3327 ha mostrato risultati sorprendenti, superiori a quelli raggiunti dalle sostanze attualmente in uso. Il composto (subito ribattezzato halicina) si è mostrato in grado di aggredire numerosi batteri di altre specie, quali S. aureus, A. baumannii, C. difficile, M. tuberculosis.

Inoltre, l’halicina ha dimostrato un’altra caratteristica importante: come sappiamo, alcuni ceppi di questi batteri hanno sviluppato notevoli capacità di mutazione, ovvero si sono evoluti al punto di modificare le loro caratteristiche per difendersi dagli antibiotici più comuni. Il nuovo antibiotico, però, ha impedito sul nascere questi tentativi di polimorfismo, riportando una vittoria anche contro i cosiddetti ceppi resistenti.

Questioni di proprietà intellettuale

Qual’è il ruolo degli avvocati in storie come questa? Scoperte ed invenzioni di questo tipo mettono in discussione alcuni concetti di proprietà intellettuale, che sono stati definiti quarant’anni addietro in un contesto culturale molto differente. E l’esperienza ci mostra che affrontare un problema con categorie inappropriate può portare ad incongruenze ed assurdità. Anche da una descrizione molto sintetica del progetto, come quella sopra riportata, si possono ricavare alcune considerazioni sul caso in esame.

La molecola era stata già ampiamente descritta, e quindi si tratta della sola scoperta delle sue proprietà terapeutiche (indipendentemente dal fatto che fosse stata inventata o che fosse già presente in natura). L’algoritmo sviluppato ha sicuramente le caratteristiche di un’invenzione, come appare evidente dal carattere soggettivo delle scelte effettuate dal team nelle fasi di analisi, codifica ed apprendimento. Affermare che la scoperta sia stata effettuata da una Intelligenza Artificiale è una semplificazione inaccettabile, ma è evidente come l’invenzione (dell’algoritmo) e la scoperta (delle proprietà antibiotiche) siano intimamente collegate: cercare di tutelarne la proprietà intellettuale come se si trattasse di due oggetti distinti sembra molto difficile.

Ma, proseguendo in questa ipotesi, qualora qualcuno ri-utilizzasse lo stesso algoritmo in un altro contesto, il suo sviluppatore non riceverebbe alcuna tutela. Come visto sopra, la riutilizzazione, più che una eventualità, è una certezza. D’altronde, come potremmo brevettare un algoritmo senza definirne lo scopo?

Infine, anche le fonti di informazione, i cosiddetti big data, hanno avuto nella scoperta un ruolo non secondario. La fase di apprendimento dell’algoritmo è stata svolta su un campione di sostanze di dichiarato valore antibiotico, e la successiva fase di ricerca è stata effettuata su un catalogo di molecole di cui erano già note alcune proprietà terapeutiche. Certamente chi ha raccolto tali informazioni non poteva prevedere l’uso che ne è stato fatto: in mancanza di una specifica clausola liberatoria, possiamo ritenere che chi detiene i diritti sui cataloghi possa avanzarne qualcuno anche sull’invenzione e sulla relativa scoperta?

Cosa dice l’Unione Europea

La settimana scorsa, l’Unione Europea ha presentato le sue strategie per la gestione dei dati, l’intelligenza artificiale e la supervisione delle piattaforme di comunicazione. Purtroppo, il documento sull’intelligenza artificiale ha attirato l’attenzione di tutti, mentre quello sulla gestione dei dati è rimasto in secondo piano. Al contrario, si tratta di una proposta estremamente importante, che testimonia il passaggio dall’approccio prescrittivo del GDPR (General Data Protection Regulation) ad un punto di vista più costruttivo, riconoscendo in sostanza il valore scientifico e commerciale dei big data.

Il documento ha riscosso notevole interesse negli Stati Uniti, dove iniziative scientifico-commerciali come Nebula Genomics, già presentata in un articolo precedente, mostrano che si inizia a comprendere l’importanza del problema, sebbene (almeno a livello federale) non esista una precisa strategia di intervento nel settore.

Anche le organizzazioni di tutela della proprietà intellettuale hanno seguito finora la politica di ignorare il problema, negando ai big data ed alle Intelligenze Artificiali qualsiasi ruolo nelle attività di scoperta e di invenzione. Come unica attenuante, occorre ricordare che il dialogo su questo tipo di problemi è stato penalizzato da un approccio estremamente empirico.

A questo proposito è sempre interessante citare la motivazione con cui l’Ufficio del Regno Unito per la Proprietà Intellettuale (UKIPO) ha rifiutato una richiesta di brevetto presentata dal Dr. Stephen Thaler, Ph.D. Il richiedente dichiarava che l’invenzione era stata prodotta da un’Intelligenza Artificiale (DABUS) di sua proprietà e ne domandava il riconoscimento a nome di quest’ultima. Pur accettando la dichiarazione che DABUS avesse effettivamente creato l’invenzione, l’ufficio ha rifiutato la richiesta in quanto “ai sensi delle leggi vigenti non esiste alcuna disciplina sul trasferimento della proprietà intellettuale dal creatore dell’invenzione al suo possessore, in quanto un’Intelligenza Artificiale non può detenere alcun tipo di proprietà”.

Ora sembra che siano tutti d’accordo nell’auspicare un livello giuridico più adeguato per queste discussioni. Lo scorso 14 febbraio si è chiusa una consultazione pubblica sui problemi di “Intelligenza Artificiale e proprietà intellettuale: quali sono le richieste più urgenti ai responsabili della politica?”. La consultazione, promossa dalla Organizzazione Mondiale per la Proprietà Intellettuale (World Intellectual Property Organization – WIPO) ha ricevuto più di 250 proposte.