dati bene comune

Epidemia e Infodemia: una sola “dashboard” per tutti i dati sul Covid-19?

di Fulvio Ananasso e Domenico Natale |

Ogni giorno vengono forniti molti dati sul Covid, che richiedono impegno e preparazione notevoli per desumerne una visione strutturata d’insieme. Si propone un cruscotto informativo che collochi i singoli dati in un quadro d’insieme significativo dell’andamento dell’epidemia.

In un periodo di pandemia sarebbe paradossale se si dovesse aggiungere una “infodemia” causata dalle molte misurazioni dei complessi fenomeni in atto, a volte ridondanti e non sempre facilmente comprensibili. Ogni giorno vengono peraltro diffusi una molteplicità di dati, nazionali o regionali, provinciali o comunali, in valori assoluti o percentuali, con serie temporali o distribuzioni territoriali. A volte si utilizzano sinonimi o gli stessi nomi per dati diversi, altre volte nomi diversi per gli stessi dati.

Spesso i dati (nuovi casi, attuali positivi, dimessi, guariti, deceduti, incrementi dei positivi, ricoveri in terapie intensive, numero tamponi effettuati, tasso di positività, indice di morbosità, RT, ecc.) sono presentati con grafica e valenza differenti, in ordine informativo diverso, a volte concentrandosi troppo su un singolo valore piuttosto che su un insieme logicamente connesso, una visione unica con modalità che aiuti a far capire il fenomeno nel suo insieme e soprattutto se le cose nel complesso stiano andando bene o male, dove e con quale gravità.

Da qui la necessità di orientarsi verso misure standardizzate inserite in un quadro di riferimento condiviso, una dashboard con i numeri essenziali che diano l’idea del loro contributo positivo o negativo alla valutazione del fenomeno e al suo andamento temporale, auspicando in tal senso una armonizzazione delle esposizioni esistenti. In altre parole, riteniamo possibile e auspicabile fornire informazioni nel modo più efficace possibile per aumentare e favorire la consapevolezza sui dati e incrementare la partecipazione di tutti nel contrasto all’epidemia.

Considerazioni di metodo

Tra le numerose misure utilizzate nelle informazioni pubbliche (Ministero della Salute, ISS, …) sull’incidenza della pandemia, alcune sono di tipo indiziario (ad es. i c.d. “indicatori”), altre di tipo deterministico (indici o tassi). Talune misure forniscono micro-informazioni con bassa incidenza sui dati complessivi (ad es. improvvisi focolai locali), pur avendo esse un grande impatto comunicativo.

D’altro canto, la comunicazione ha varie finalità. Tranquillizzante, o allarmante per stimolare l’accettazione delle contromisure, … ovvero di tipo dimensionale-quantitativo (dati ed indicatori) per agevolare la pianificazione delle risorse necessarie, ad iniziare dalla collocazione dei territori nelle varie aree di rischio — rosse, arancioni e gialle.

Come illustrato in un nostro precedente contributo (“Dati Bene Comune. Covid-19 e aree territoriali: i dati contano, se rac-contano bene”), è estremamente utile in generale predisporre misure con visione “telescopica”, con dati “esplosi” (in una sorta di zoom continuo) dal livello nazionale e regionale a quello provinciale e comunale. Inoltre. essi dovrebbero essere forniti in valore sia assoluto (ad es. numero dei tamponi effettuati o numero dei nuovi casi) che percentuale o relativo (ad es. nuovi casi rispetto alla popolazione di riferimento), distinguendo le misure giornaliere da quelle derivate da intervalli più lunghi — settimanali o altro.

E’ importante al riguardo costruire un glossario dei termini che definiscono contenuti e algoritmi delle misure e relativi indicatori, garantendo in ogni ambito, ad iniziare dalla campagna di vaccinazione, la raccolta delle informazioni con criteri che garantiscano la massima qualità dei dati, in particolare relativamente all’attualità, coerenza tra le fonti, completezza, rispondenza alla realtà, credibilità, comprensibilità. Il glossario dovrebbe includere descrizioni di concetti e misure in linea con quanto segue.

Misure predittive di incidenza ricorrenti

I fattori di incidenza, oggetto di misure ricorrenti ritenute basilari per il controllo responsabile dell’epidemia, riguardano principalmente la probabilità della sua diffusione, orientata all’osservazione della velocità del contagio e degli eventi scatenanti.

Tali misure sono dinamiche di tipo osservazionale-predittivo, come ad esempio:

  • RT, un campanello d’allarme sulla velocità e vastità dei contagi che si rifletterà in futuro sui dati effettivi (potenziale segnale di allarme nazionale o locale se concentrato su territori delimitati),  misura di prospettiva prodromica dei giorni a venire calcolata sui casi sintomatici;
  • i nuovi casi giornalieri, settimanali, bi-settimanali — le grandi regioni avranno tendenzialmente più casi se presi in valore assoluto;
  • l’indice di positività (numero dei casi positivi sui tamponi di qualsiasi tipo effettuati, disponibili a livello nazionale o meglio a livello territoriale locale), il cui impatto si riscontrerà in successive rilevazioni consuntive dell’epidemia.

Misure periodiche consuntive di prevalenza

I fattori di prevalenza quantificano il fenomeno risultante dell’evoluzione epidemica, incidendo sull’ammontare dei contagiati e sull’impatto ospedaliero, cioè il sovraccarico degli ospedali e l’aumento delle problematiche dei casi di isolamento domiciliare.

E’ essenziale in tal senso il numero degli attuali positivi, cioè i casi di contagiati circolanti nella popolazione, pari al numero totale (inclusi i casi asintomatici positivi, tema ancora irrisolto) meno i guariti e i deceduti.

Utili misure statiche della situazione esistente di tipo consuntivo-descrittivo sono, ad esempio:

  • pressione ospedaliera numero dei ricoverati con sintomi e in terapia intensiva, cioè i posti letto occupati sul totale dei posti letto disponibili;
  • percentuale dei guariti sui casi totali;
  • percentuale di mortalità sui casi totali;
  • indice di morbosità — attuali positivi rispetto a 100.000 abitanti.
    • Misure ausiliarie contestuali

Misure ausiliarie dipendono dal contesto d’uso. A seconda delle esigenze, emerge l’importanza di misure a garanzia della gestione dei rischi, assicurando la qualità dei dati. Ad es. il rischio di incidenti sugli sci è stato considerato come rischio aggiuntivo nelle zone alpine, in quanto eventuali infortunati avrebbero aumentato la pressione sugli ospedali già aggravati dal Covid. Analogamente, il rischio degli infortuni la notte di Capodanno ha rafforzato la necessità dei divieti di fuochi d’artificio.  

Misure mancanti / in costruzione

Per una efficace rappresentazione della situazione e supporto alla sistematizzazione degli interventi, è auspicabile la disponibilità di:

  • un confronto sistematico giornaliero dei dati territoriali allo scopo di individuare cause ed effetti delle variazioni;
  • il numero totale degli asintomatici positivi attraverso screening totali o stime complessive regionali coerenti tra loro;
  • dati per sesso, età, stato civile, professione degli attuali positivi, dimessi / guariti e deceduti;
  • dati di co-morbilità, connessi con i fascicoli sanitari e cartelle cliniche;
  • vaccini somministrati per tipo di vaccino, professione, età, cronologia, ecc.;
  • identificazione dei focolai (ad es. trasporti pubblici, per località e orario);
  • una ontologia da utilizzare per un cruscotto complessivo, non frammentato, che fornisca una visione unica e integrata delle varie informazioni disponibili (di incidenza e prevalenza), producendo in modo standard l’andamento del fenomeno, confrontabile negli ambiti territoriali interni e anche possibilmente a livello complessivo con i Paesi esteri;
  • maggior utilizzo di misure a garanzia della qualità dei dati, in particolare riguardo alla loro completezza, tempestività, coerenza tra le fonti, comprensibilità, disponibilità.

Sulla base di quanto sopra, riteniamo che la “Dashboard Covid-19” che qui proponiamo possa fornire una fotografia fedele della situazione giornaliera, settimanale e mensile, evidenziando i trend di andamento temporale.

Anche il calcolo di un indicatore unico territoriale (nostro obiettivo in via di realizzazione) consentirebbe un confronto delle Regioni e Province autonome di ausilio all’evidenziazione delle cause, rappresentando al tempo stesso una stima del miglioramento comparativo tra territori.

Proposta strutturale

Al momento, i dati che si propongono nella Dashboard Covid (V. figura, con riferimento alla situazione dal 17 al 23 gennaio) sono quindi:

  • Incidenza:
  • RT
  • nuovi casi su popolazione (rispetto alla settimana precedente)
  • positività dei tamponi
  • Impatto ospedaliero:
  • numero ricoveri ospedalieri, rispetto ai posti-letto disponibili
  • dimessi / guariti sul totale dei casi
  • Indice di morbosità:
  • tasso di mortalità sul totale dei casi
  • numero attualmente positivi al tempo t, rispetto alla popolazione di riferimento.

L’andamento generale (“Trend”) riassume i 7 valori citati, dandone una valutazione di miglioramento, peggioramento o stabilità. Nel caso specifico, si riscontra una diminuzione dell’RT, di nuovi casi, della positività, dell’occupazione posti-letto, dei guariti (che si auspicherebbero viceversa in aumento) e della morbosità, a fronte di una mortalità costante — che si auspicherebbe invece in diminuzione. Si rilevano quindi, in 5 casi su 7, andamenti in linea con quanto ci si attendeva (71% della tendenza auspicabile). Si precisa che, per quanto riguarda l’andamento della positività dei tamponi, al fine di consentire un confronto coerente tra l’ultima e la penultima settimana, si è tenuto conto che dal 15 gennaio è stato incluso nei conteggi governativi il numero dei tamponi transgenici, suggerendo quindi di non considerare, dal punto di vista statistico, i dati precedenti al 15 gennaio nella media della penultima settimana.

Si ritiene cruciale che  il modello di dashboard qui illustrato, in corso di affinamento e consolidamento, sia reso “telescopico”, cioè declinabile da nazionale ad almeno regionale, se non provinciale e comunale, senza tralasciare anche la possibilità di confronti internazionali. Ad esempio, relativamente ai 7 indici indicati, le Regioni e Province autonome sono state ordinate per ciascun indice, dal valore più piccolo al più grande (ad eccezione della percentuale dei guariti, ordinata dal più grande al più piccolo), in modo che le Regioni virtuose risultino ai primi posti delle graduatorie. Mediando i posti in graduatoria si ottengono le posizioni della figura, che risultano compatibili con la maggioranza dei colori attuali delle aree di rischio.

Si evidenzia infatti una prevalente compatibilità con le attuali aree di rischio con colore giallo, arancione e rosso – inclusa incidentalmente la Lombardia, di cui il modello qui descritto aveva previsto il colore arancione prima ancora delle note diatribe istituzionali. Risultano “fuori serie”, per quanto riguarda l’area gialla, la Calabria e la Basilicata, per quanto riguarda l’area rossa l’Emilia Romagna e la Puglia. La presenza di “outlier”, cioè di dati visibilmente “fuori serie”, come indicato anche dagli standard sulla misurazione del livello di qualità dei dati (UNI CEI ISO/IEC 25024), si ritiene possa essere considerata un utile indizio di approfondimento, da parte delle Autorità competenti, sia delle misure utilizzate che del contesto reale di osservazione

Conclusioni e prossimi passi

Per favorire una comunicazione efficace sulla pandemia Covid-19, si ribadisce in conclusione l’importanza di perfezionare un glossario dei dati, sia per gli addetti ai lavori che per i cittadini. Occorre altresì una maggiore uniformità tra i dati degli annunci periodici relativi all’evolversi della pandemia, per fornire una visione contestuale in cui singoli aspetti, seppur altalenanti, possano essere meglio compresi. In particolare, un cruscotto informativo (dashboard) come il modello qui proposto, associato ad una visione “telescopica” dal livello nazionale a quello territoriale, sarebbe in grado di collocare i singoli dati in un quadro d’insieme significativo dell’andamento dell’epidemia La trasparenza infine degli algoritmi potrà facilitare il confronto dialettico di opinioni differenti.

Raggiungendo una convergenza comunicativa si potrà promuovere in ogni area territoriale una confrontabile esposizione dei dati volta al massimo coinvolgimento dei cittadini. Si prevedono pertanto ulteriori prossimi contributi per:

  • il continuo aggiornamento a tutti i livelli dei dati che evolvono con grande rapidità;
  • il miglioramento e l’affinamento della dashboard;
  • il perfezionamento del glossario e delle misure quantitative, per favorire confronti nazionali e internazionali;
  • il potenziamento a scopi di ricerca e studio degli open data con dati di alta qualità, classificati ed utili, in termini di contenuto e di formato aperto;
  • l’incremento dei futuri sforzi sul piano dei vaccini, con possibilità di eseguire confronti di somministrazione, equa distribuzione, efficacia sanitaria, basi di analisi di eventuali problematiche organizzative e mediche;
  • la promozione di una coerente diffusione di dati da parte delle Province e dei Comuni attraverso una pagina standard di divulgazione delle informazioni sui siti web istituzionali centrali e locali.

Articolo di Fulvio Ananasso, Presidente Stati Generali Innovazione, Socio onorario UNINFO e Consigliere CDTI e Domenico Natale, Presidente Commissione UNI CT 504 Ingegneria del software, Socio onorario UNINFO, Consigliere CDTI e Socio SGI.