Analisi

Demografia, tracciamento e piattaforme “data driven” per il contrasto alle pandemie

di Fulvio Ananasso e Domenico Natale |

La demografia gioca un ruolo cruciale negli sviluppi epidemici. Piattaforme tecnologiche con dati aperti, “telescopici” e geo-referenziati possono rappresentare un formidabile strumento di contrasto, oltre che di ausilio al tracciamento dei contagi, tuttora estremamente carente.

  1. PIATTAFORME TECNOLOGICHE “DATA DRIVEN”  

Come sottolineato in precedenti contributi (ad es. Immuni non efficace? Meglio dati aperti, geo-referenziati, anonimi e piattaforme “data driven), dati di qualità permettono di supportare le decisioni con aderenza alla realtà dei fatti e sulla base delle esigenze, consentendo alla popolazione di adeguare i propri comportamenti in funzione di auto-convincimenti (più che imposizioni dall’alto) e ai ricercatori possibilità di analisi di correlazioni spesso nascoste — ad es. tra numero di vaccini e riduzione della morbosità. Una gestione oculata della pandemia, inclusa la complessa campagna di vaccinazione di massa, richiede opportune piattaforme tecnologiche “data driven” a livello nazionale(ed europeo), capaci di integrare e inter-operare con i vari sistemi territoriali in modo da fornire una visione unica ma “granulare” a piacere, con “cruscotti” informativi basati su dati coerenti, organizzati e continuamente aggiornati per agevolare la comprensione del quadro complessivo e informarne la popolazione.

Un tale approccio consisterebbe nel pianificare la continuità e coerenza tra dati nazionali, regionali, provinciali e comunali, definendo un flusso di dati aperti tra Amministrazioni. Ogni dato nazionale dovrebbe essere derivato da dati regionali, ogni dato regionale derivato da dati provinciali, ogni dato provinciale derivato da dati comunali. Per non parlare dei dati delle città metropolitane, che dovrebbero derivare da sotto-insiemi ancora più specifici come i quartieri delle città o municipi o quant’altro, con “granularità” definibile secondo le necessità. 

E’ stata già sottolineata in precedenza (V. “Dati Bene Comune. Covid-19 e aree territoriali: i dati contano, se rac-contano bene”) l’estrema rilevanza di una visione “telescopica” dei dati, che (come il telescopio) faccia apparire vicine cose lontane, e più chiare cose apparentemente complesse e confuse. Piattaforme di analisi big data possono essere di grande aiuto per il contrasto alle epidemie, e riuscire a supportare il “contact tracing” con strumenti automatici rappresenterebbe un building block di notevole rilevanza. Tali piattaforme “data driven” sono in grado di gestire ed elaborare, attraverso soluzioni di Intelligenza Artificiale, molti più dati di quanto attualmente possibile, fornendo efficaci sistemi di supporto alle decisioni (DSS) umane.

Allo stesso tempo, sarebbe importante poter sapere se, quando e dove sono avvenuti contatti tra soggetti infetti (o a rischio) e soggetti sani (almeno sulla carta), o incontri tra persone sane (asintomatiche), per poter gestire con consapevolezza e dovizia di informazioni le politiche di gestione pandemica. La gestione del luogo è essenziale per la comprensione delle cause di contaminazione, e ciò è possibile nel rispetto della privacy individuale. In altre parole, allo stato attuale sarebbe estremamente utile conoscere statisticamente i luoghi e le circostanze dei contagi attraverso gli spostamenti nel tempo delle persone – che possono e devono rimanere anonime e i loro dati riservati. Il concetto di “contact tracing” (peraltro entrato pericolosamente in oblio) dovrebbe progredire verso un approccio di “(geo)location tracing degli eventi, per la gestione di vicende non solo epidemico-sanitarie ma anche e soprattutto economico-sociali e ambientali, generando valori rappresentativi sia assoluti che percentuali nei vari territori.

2. PANDEMIA E DEMOGRAFIA 

D’altro canto, la pandemia attuale ha risvegliato l’attenzione verso la Demografia. Il termine ha origine nel XVIII secolo, parallelamente alla Statistica, e deriva dal greco con il significato di “descrizione della popolazione” (V. Nora Federici, Lezioni di Demografia, Università di Roma, 1972). Ma attualmente il termine comprende anche il complesso di indagini fenomenologiche legate alla popolazione nella ricerca di evidenziare possibili regolarità e connessioni con altri fenomeni. Un’ottica demografica nello studio di fenomeni sociali aumenta il significato dei soli valori assoluti dei fenomeni, come nel caso del numero di contagi Covid-19 in piccole Regioni messi a paragone con quelli di grandi Regioni, orientando le ricerche verso numeri assoluti posti in proporzione alla popolazione. Si associano in genere al termine Demografia altri attributi come Demografia descrittiva e Demografia investigativa, per le quali è utile avere una visione interdisciplinare e fare attenzione alle interrelazioni tra fenomeni e ai fattori della Sociologia demografica. Alla base della dimensione della popolazione è l’equazione classica “popolazione = nati + immigrati – morti – emigrati”. Relativamente al fenomeno epidemico, si considera l’equivalente equazione “casi totali registrati (ospedalizzati / domicilio) – guariti – morti”.

Questi dati sono forniti con continuità giornaliera da marzo 2020 a cura del Ministero della Salute, Istituto Superiore di Sanità e Protezione Civile, ma solo in alcuni casi sono stati rapportati al complesso della popolazione delle Regioni e Province Autonome. Per semplicità di comunicazione, spesso ci si limita ad informare circa il numero assoluto dei nuovi casi che contribuiscono ad incrementare l’ammontare complessivo dei contagi, mentre raramente si fornisce il numero, a livello territoriale, dei “contagiati attuali viventi” rispetto alla popolazione (residente o presente) definito “indice di morbosità” — in rapporto in questo caso a 10.000 unità.

La Figura 1 mostra l’andamento dell’indice a livello nazionale da marzo 2020 a giugno 2021. Si nota (in blu) la prima ondata del Covid da marzo 2020 che raggiunge il minimo in luglio, a cui segue l’esplosione in autunno della seconda ondata, che poi nel 2021 presenta una tendenza (in arancione) che raggiunge il valore minimo nel mese di giugno. Seppur in presenza degli allarmanti numeri dei decessi e ospedalizzazioni del primo semestre 2020, i relativi valori risultano molto inferiori al 2021, presumibilmente per via del ridotto numero dei tamponi nel primo periodo pandemico 2020, con conseguente sottostima dei casi positivi (e.g. asintomatici) non riscontrati nei ricoveri in ospedale, che invece nel 2021 sono affiorati e posti in quarantena.  


Nonostante questa sottostima quantitativa del fenomeno epidemico nel primo semestre 2020, è realistico attendersi un contenimento nel prossimo autunno grazie alla campagna vaccinale, ad una maggiore consapevolezza nei comportamenti interpersonali e i miglioramenti organizzativi del sistema sanitario. L’andamento del grafico suggerisce comunque una grande prudenza da mantenere nel periodo estivo, anche perché i valori assoluti di ospedalizzazioni e decessi di un anno fa appaiono sovrapponibili a quelli attuali, nonostante la campagna di vaccinazione.


La Figura 2 mostra alcune differenziazioni fisiologiche sul territorio che probabilmente perdureranno a lungo. Pur dimostrandosi che l’epidemia è diminuita in tutte le aree territoriali considerate, si presentano inevitabilmente alcune differenze sia tra di esse che dei singoli casi rispetto alla media nazionale — indicata nel grafico dalla freccia verticale.

Si può notare che 14 Regioni e Province autonome si trovano nella coda di sinistra rispetto al valore medio dell’Italia, mentre 7 Regioni si trovano nella coda di destra della distribuzione. Dalle fonti ufficiali risulta che ~60% delle prime 14 ha effettuato un numero di vaccini superiore alla media nazionale, mentre quasi tutte le seconde 7 hanno effettuato meno vaccini della media nazionale. Ciò porta a confermare la rilevanza delle vaccinazioni nel contrasto all’epidemia.

Ulteriori e più sofisticati sistemi di monitoraggio saranno possibili attivando analisi statistiche dei fenomeni con un’ottica ‘telescopica’ (nazionale, regionale, provinciale, comunale) e, per le grandi città e aree metropolitane, anche sub-comunale, come già messo in atto da alcune best-practice pubblicate sui siti web istituzionali delle Regioni e Province Autonome.

Dal punto di vista demografico e sociale, per una più completa valutazione globale e territoriale dei fenomeni, si auspicano nuovi progetti sistematici e coordinati di monitoraggio che tengano conto del maggior numero possibile di variabili localizzate e “open data”: età media, natalità, mortalità, PIL, fattori ambientali città-campagna (inclusi pendolarismi strutturali come  elementi di possibile assembramenti), densità di popolazione e agglomerati delle costruzioni sulle superfici abitabili, mobilità interna / esterna, interregionale e internazionale, via aerea, navale, terrestre, attività dei contagiati, strutture sanitarie (posti letto, numero dei medici di base, …), numero e tipi di vaccinazioni e di tamponi, stili di vita… e così via.

3. “CONTACT TRACING” E GEOLOCALIZZAZIONE 

Come già sottolineato, piattaforme tecnologiche data-driven possono essere di grande aiuto per il contrasto alle epidemie, anche supportando con strumenti automatici il “contact tracing”, nonostante il suo apparente preoccupante accantonamento attuale. Soluzioni ICT / app di tracciamento dei contatti non avevano molto senso nel pieno dell’epidemia, con decine di migliaia di nuovi contagi al giorno, ma (ri)diventano cruciali con il progressivo incremento delle vaccinazioni e significativa riduzione dei casi positivi, che andrebbero a questo punto tracciati conprecisione geo-localizzata per identificare e delimitare focolai e ridurre sempre più le occasioni di contagio. Sarebbe cioè importante poter sapere non solo se ci siano stati contatti tra soggetti positivi (o a rischio) e soggetti sani (almeno sulla carta), ma anche dove (e quando) essi siano avvenuti. 

La gestione del luogo è essenziale per la comprensione delle cause di contaminazione, e ciò è possibile anche nel rispetto della privacy individuale. In altre parole, allo stato attuale sarebbe estremamente utile conoscere statisticamente i luoghi e le circostanze dei contagi attraverso gli spostamenti nel tempo delle persone – che possono e devono rimanere anonime, e i loro dati riservati. Il “contact tracing” dovrebbe evolvere in un approccio di “(geo)location tracing”, una geo-localizzazione sulla base di dati anonimi ed aggregati in grado di poter verificare i pericoli di contagio nelle varie situazioni operative – eventi di socialità, trasporti, scuole, …

Entrambe le tecnologie GPS e Bluetooth presenti nei nostri smartphone potrebbero essere utilizzate per tracciare i contatti a rischio e avvisare i potenziali contagiati. Il GPS identifica i percorsi degli individui che si sono incrociati, mentre il Bluetooth rileva connessioni tra device a distanza ravvicinata (fino a pochi metri), senza sapere dove. Per tali motivi, la tecnologia Bluetooth è stata considerata la meno invasiva per la privacy, permettendo agli smartphone di accorgersi se e quando siano vicini, ma senza informazioni geo-referenziate che possano far risalire in qualche modo all’identità degli utenti. D’altro canto, le mutate necessità di tracciamento “mirato” a seguito della disponibilità del vaccino anti-Covid suggerirebbero di provare a riesaminare l’intera vicenda, approfondendo i pro e contro dell’utilizzo della geo-localizzazione dei contagi. Utilizzando un tracking GPS opportunamente anonimizzato (analogamente a quanto già avviene nei navigatori per l’individuazione del traffico di autoveicoli) ad integrazione del Bluetooth per la tutela della privacy, sembrerebbe possibile tracciare efficacemente contagi e focolai con solo il 20% di utilizzo della app da parte della popolazione, rispetto ad oltre il 60% richiesto con il solo Bluetooth (Low Energy, BLE).

4. RIEPILOGO E CONCLUSIONI

La gestione delle epidemie, che si susseguono statisticamente ogni 3-5 anni, inclusa l’attuale complessa campagna di vaccinazione di massa, richiede “cruscotti” informativi immediatamente comprensibili e rappresentativi della situazione demografica territoriale. Cruscotti basati su dati aperti, affidabili, coerenti, di qualità e continuamente aggiornati (morbosità, vaccinazioni, ecc.), geo-referenziati e organizzati “telescopicamente” dal livello comunale a quelli provinciale, regionale e nazionale (e possibilmente europeo), con granularità a piacere. 

Si auspicano inoltre metodi condivisi e dati semanticamente paragonabili, anche a livello europeo e mondiale, con particolare tempestività di intervento non solo sui movimenti migratori, ma anche sulla mobilità sistematica, in particolare su trasporti pendolari. Come ribadito sia in questa sede che in precedenza, si suggerisce di valutare la possibilità di monitoraggio geo-referenziato di focolai, specie delle ultime varianti, con soluzioni digitali avanzate che possano identificare tempestivamente in modo anonimo i luoghi a rischio, più che i singoli contagi.

In ogni caso, per ogni soluzione digitale sarà opportuno stimare a priori anche l’eventuale onere organizzativo del personale di supporto richiesto. Da un lato, i servizi IT dovrebbero essere quanto più possibile automatici, non necessitando di ausilî di persone e attività manuali. D’altra parte, soluzioni di Intelligenza Artificiale, pur essendo in grado di elaborare molti più dati fornendo efficaci sistemi di supporto alle decisioni (DSS) umane, potrebbero richiedere un approccio “human-in(on)-the-loop” per la garanzia di controllo “etico” finale di specialisti umani rispetto a potenziali “bias” algoritmici e/o dei dati. 

Gli autori:

Fulvio Ananasso, Presidente di Stati Generali Innovazione, Socio onorario UNINFO e Consigliere CDTI

Domenico Natale, Presidente Commissione UNI / CT 504 “Ingegneria del software”, Socio onorario UNINFO, Consigliere CDTI e Socio SGI