Data center

Dark data, cosa sono e quanto ci costano. Dal loro storage 5,8 milioni di tonnellate di CO2 nel 2020

di |

Accumulare enormi quantità di dati non significa automaticamente ottenere un effettivo vantaggio competitivo. Un eccesso di storage comporta rischi per l’organizzazione, un costo crescente e soprattutto un aumento dei consumi energetici e delle emissioni climalteranti.

La corsa all’accaparramento di dati ha portato le aziende (e non solo) ad ampliare al massimo la propria capacità di raccolta ed archiviazione, ma senza la necessaria distinzione tra “dati utili” e “dati inutili”.

Molti di questi, infatti, non sono utilizzabili da un’organizzazione per ricavare informazioni vantaggiose, per prendere decisioni e sfruttare opportunità.

In questo caso parliamo di “dark data”, dati in eccesso rispetto alle reali possibilità di analisi e gestione dell’azienda che ne è in possesso.

Archiviare dati privi di valore effettivo significa occupare spazio, che invece potrebbe essere liberato per altri dati molto più preziosi, consumare energia e far lievitare i costi di gestione.

I dark data costano e inquinano

Gli analisti di Veritas stimano che la quantità di dati generati nel mondo passerà dai 33 ZB del 2018 a 175 ZB entro il 20253.

Considerando che in media più del 50% di tutti i dati memorizzati dalle organizzazioni mondiali sia “dark”, si potrebbe raggiungere in pochi anni un livello di 91 ZB di dark data, quattro volte il volume attuale.

A livello di infrastrutture, invece, il peso dei dark data sui data center è valutabile come costo economico e in emissioni di biossido di carbonio (CO2).

Secondo il “Global Databerg Report”, considerando anche che il 33% dei dati è “ridondante”, i costi impliciti nell’archiviazione e gestione dei dark data sarà pari a 3.300 miliardi di dollari entro la fine del 2020.

In termini di impatto ambientale, invece, tale attività di storage & management implicherà l’emissione in atmosfera di circa 5,8 milioni di tonnellate di CO2.

Azioni da compiere

Per evitare questa deriva economica e ambientale, la cosa migliore sarebbe approfondire la conoscenza dei dati che si archiviano. Accumulare dati è facile e il cloud storage in fondo è piuttosto economico.

Il problema è che la maggioranza di questi dati non sarà più accessibile (nel tempo si dimentica il come e il perché si sono accumulati), rimanendo un costo.

Accumulare enormi quantità di dati non significa automaticamente ottenere un vantaggio competitivo rispetto ai competitor, ma sicuramente aumenterà costi, inquinamento e rischi.

Secondo gli esperti, bisogna ridurre la quantità di dati archiviati e stabilire priorità: il valore di un dato conservato deve essere direttamente correlato allo scopo per cui è stato raccolto.

Le aziende, inoltre, dovrebbero essere capaci di rendere visibili i dark data e allo stesso tempo di conoscere i propri archivi.

Azioni come il data mapping e data discovery possono aiutare a capire meglio dove sono i dati e a che tipo di informazioni sono correlati.