Culturomics: un supercomputer può predire le rivoluzioni?

di |

Uno studio americano dimostra che analizzando le notizie si possono prevedere eventi come le sommosse popolari che hanno caratterizzato la cosiddetta ‘primavera araba’, ma anche stabilire la posizione di un ‘ricercato eccellente’ come Bin Laden.

Stati Uniti


Culturomics

Dall’esame delle notizie che compaiono sulla stampa e su internet, è possibile prevedere una rivoluzione? Sembrerebbe di si, grazie a un nuovo software che, analizzando le notizie degli ultimi 30 anni, ha mostrato picchi proprio in concomitanza delle recenti rivoluzioni in Egitto e in Libia ed è stato anche in grado di individuare la posizione di Osama Bin Laden.

Si tratta del primo software in grado di dimostrare che la copertura delle notizie può essere usata per predire eventi futuri.

 

Sviluppato da Kalev Leetaru dell’Institute for Computing in the Humanities, Arts and Social Science dell’Università dell’Illinois, il software ha passato al setaccio le notizie contenute nei database di informazioni globali – quali l’Open Source Center americano o l’archivio del New York Times che risale al 1945 – per un totale di circa 100 milioni di articoli.

Gli elementi storici sono stati intrecciati insieme in una sbalorditiva rete di 100,000 miliardi di relazioni utilizzando il supercomputer SGI Altix Nautilus capace di una potenza totale di elaborazione di 8,2 teraflops.

Con specifico riferimento alle notizie relative all’Egitto, alla Libia e alla Tunisia, il software ha mostrato un trend decisamente negativo nell’ultimo decennio, che ha portato alla cosiddetta ‘primavera araba’.

 

Per estrarre informazioni pertinenti dalla mole di notizie contenute nei database, sono state utilizzate due tecniche differenti: la prima, il ‘sentiment mining’ consiste nella conta del numero di parole classificabili come ‘positive’ (come ‘buono’, ‘bello’) o ‘negative’ (‘orribile’, ‘terribile’, e così via)

I cambiamenti nel tono delle notizie in queste regioni si correla con il sentimento della gente e, spiega il ricercatore, quando la frequenza di termini negativi aumenta rapidamente, significa che gli abitanti sono sempre più irrequieti.

La seconda tecnica, chiamata ‘full-text geocoding,’ collega il sentimento alla posizione geografica.

 

In Egitto, ad esempio, sono state monitorate le notizie a partire dal 1979 e – ha sottolineato Leetaru – un picco simile di negatività nel tono delle notizie riscontrato tra il 1° e il 24 gennaio 2011 si era avuto solo altre due volte negli ultime 30 anni: nel gennaio del 1991 in occasione dei bombardamenti delle truppe irachene in Kuwait da parte degli Usa e nel marzo del 2003 quando gli Stati Uniti invasero l’Iraq.

“Il solo monitoraggio del tono dei media mainstream in tutto il mondo sarebbe stato sufficiente a suggerire il pericolo di disordini in Egitto”, ha affermato Leetaru che, certo, non vuole intendere che esista una soglia al di la della quale la rivoluzione sia inevitabile, né che esista un software tanto potente da prevedere la progressione o la tempistica di un dato evento. Piuttosto, il monitoraggio dei toni può rivelare il potenziale aumento dei disordini e spingere i politici ad agire di conseguenza. Le stesse ‘curve’ negative si sono riscontrate – oltre che per l’Egitto – anche per la Tunisia, la Libia e per la guerra nei Balcani negli anni ’90.

 

Allo stesso modo, azzarda Leetaru, l’analisi delle notizie può dare indicazioni importanti per individuare la posizione di individui ricercati. Il software ha analizzato i documenti contenenti le parole ‘Bin Laden’ tra il 1979 e il 2011 e ha mappato i luoghi associati a questi documenti.

Certo, il software è ben lungi dal saper predire il futuro e questo lo ammette anche Leetaru, ma mentre in molti hanno scommesso che Bin Laden si trovasse in Afghanistan solo il 28% delle notizie analizzate lo dava in quel paese, mentre oltre la metà sostenevano si trovasse in Pakistan. Abbottabad – la località in cui è stato effettivamente trovato e ucciso – si trova in effetti a meno di 200 km dalle due città più spesso associate al leader di Al Qaeda.

 

La ricerca condotta da Leetaru estende ulteriormente il campo della ‘culturomics’ che tenta di quantificare la cultura umana “attraverso la società e attraverso i secoli”. In collaborazione con Google books, uno studio pubblicato lo scorso anno ha effettuato una scansione di una collezione di testi digitalizzati che rappresentano il 4% di tutti i libri stampati per quantificare le tendenze culturali riflesse nella lingua inglese attraverso diversi argomenti quali “l’evoluzione della grammatica, la memoria collettiva, l’adozione della tecnologia e la ricerca della fama”. Il report riconosce che il monitoraggio del tono ‘scritto’ non è un metodo tanto accurato quanto quello basato sul tono umano, ma anche la polizia di Los Angeles sta usando un sistema simile per tentare di prevenire i crimini prima che accadono.

 

La ricerca condotta da Leetaru – ha affermato Thomas Chadefaux, politologo presso l’Istituto Federale Svizzero di Tecnologia – “è una benvenuta aggiunta a un settore – quelle delle scienze politiche – che finora si è curato molto poco di fare analisi preventive”. Ma, ha aggiunto, “è ovviamente molto più facile trovare i segni precursori quando si sa dove andare a cercare piuttosto che farlo alla cieca”.