IA, l’importanza di privacy by design, privacy by default e accountability

di Prof. Stefano Mannoni e Ing. Andrea Tomassi |

E’ opportuno rimarcare l’importanza di privacy by default, privacy by design e accountability e come la scelta dei modelli impiegati nell’ambito del trattamento automatico dei dati possa fornire una ulteriore sostanza a tali prescrizioni.

La recente adozione della convenzione 108 riguardante le “linee guida in materia di Intelligenza Artificiale e protezione dei dati” richiama l’attenzione su: liceità, correttezza, specificazione della finalità, proporzionalità del trattamento, protezione dei dati fin dalla progettazione (privacy by design) e protezione per impostazione predefinita (privacy by default), responsabilità e dimostrazione della conformità (accountability), trasparenza, sicurezza dei dati e gestione dei rischi.

E’ opportuno rimarcare l’importanza di privacy by default, privacy by design e accountability e come la scelta dei modelli impiegati nell’ambito del trattamento automatico dei dati possa fornire una ulteriore sostanza a tali prescrizioni.

Un modello è una rappresentazione formale di idee e di conoscenze relative ad un fenomeno. La rappresentazione cattura del fenomeno una possibile struttura di eventi in linguaggio formale, raggiungendone la comprensione attraverso la compressione in formule.

Le formule sono la descrizione del modello, sulla base delle quali è possibile stabilire la logica impiegata dal modello per il trattamento dei dati. Quanto indicato rappresenta una metodologia potenzialmente oggettiva, in quanto i passaggi per la predisposizione del modello sono definiti e trasparenti, e quindi libera da possibili discriminazioni e pregiudizi che inficerebbero i requisiti di responsabilità. Altresì la definizione di modello permetterebbe potenzialmente il soddisfacimento dei requisiti di privacy, in virtù della suddetta trasparenza realizzativa.

E’ innanzitutto opportuno evidenziare che il modello risente delle idee e delle conoscenze sul fenomeno, che rappresentano un filtro fra il fenomeno osservato e il modello rappresentativo. Ciò a giustificare l’indicazione che la rappresentazione modellistica sia potenzialmente oggettiva e trasparente. Secondo poi è necessario considerare che modelli relativi ad uno stesso fenomeno possono fornire spiegazioni complete, alcuni di essi, o parziali, i rimanenti. Le formule impiegate nella costruzione del modello rappresentano una guida per discriminare fra completezza e parzialità e quindi evidenziare potenziali impatti su privacy e accountability.

Si raggiunge in questo modo l’aspetto saliente sulla modellistica. Warren Weaver evidenzia come i modelli abbiano avuto un’evoluzione passando da rappresentazioni per “Problems of Semplicity” (poche variabili coinvolte, es. Temperatura, Pressione), a rappresentazioni per “Problems of Disorganized Complexity (milioni di variabili coinvolte, es statistica: valori medi, varianza, dispersione).

Fra questi due estremi si pone la rappresentazione per “Problems of Organized Complexity” (migliaia di variabili, es: sistemi distribuiti, IoT). Quest’ultima rappresentazione è fondamento per la descrizione di fenomeni in cui un sistema è sensibile alle condizioni iniziali, è composto da agenti interagenti attraverso regole semplici, è auto organizzante (assenza di coordinamento centralizzato) e presenta comportamento emergente.

La sensibilità alle condizioni iniziali è un primo aspetto da considerare ed è l’effetto della dinamica non lineare dei fenomeni. La dinamica evidenzia la rapidità di cambiamento in un fenomeno. La dinamicità ha implicazioni per cui eventi classificati come anomalie possono rapidamente divenire i precursori di cambiamenti, le variabili a maggiore varianza e quindi più espressive possono rapidamente trasformarsi in indicatori di scarso interesse, relazioni fra stati a cui è associata probabilità trascurabile possono rapidamente raggiungere la “certezza”.

La non linearità introduce sensibilità alle condizioni iniziali e cioè piccole differenze nei valori da cui un sistema parte si rifletto in grandi differenze nei punti di arrivo implicando quindi un limitato orizzonte di previsione e quindi di prescrizione

La sensibilità alle condizioni iniziali quando non tenuta in debita considerazione nella predisposizione del modello può trasformare rapidamente un modello conforme ai requisiti di responsabilità in uno che non lo sia. Il titolare del trattamento dei dati dell’interessato compirebbe delle decisioni avvalendosi di uno strumento la cui logica rapidamente non sarebbe più aderente al fenomeno.

Un secondo aspetto da considerare nella predisposizione dei modelli è l’auto organizzazione: gli agenti componenti il sistema interagisco fra loro senza l’ausilio di un coordinamento centralizzato. A tale aspetto è necessario aggiungere quello probabilmente più rilevante: la presenza di comportamenti emergenti che originano comportamenti di insieme che il singolo agente non possiede e di cui il singolo agente può risentire (es: stormo di storni, sciami di formiche, neuroni cervicali). A tal proposito si richiama l’articolo di Alan Turing su Morfogenesi, in cui si evidenzia come si generino strutture complesse a partire da interazioni semplici (reazione-diffusione) fra cellule semplici.

L’auto organizzazione e la presenza di comportamenti emergenti quando non tenuti in considerazione nella predisposizione dei modelli possono avere conseguenze sui requisiti di privacy: i sistemi possono auto organizzarsi producendo un comportamento emergente di “esfiltrazione” che invece i singoli sistemi non avrebbero.

AI, IoT, Smart City, 5G, sono solo alcuni degli ambiti per i quali la rappresentazione modellistica di “Problems of Organized Complexity” è il miglior supporto per una data-driven decision making soddisfacente.

In tale ambito il presidio fornito da Cyber Security rappresenta una tutela per individui, aziende e stati sui quali ricadono le decisioni compiute con l’ausilio di suddetti modelli.

Nell’ultimo Security Summit, l’IA ha svolto un ruolo primario, sono stati evidenziati sia i probabili impatti negativi per la sicurezza e sia i benefici per i maggiori ambiti di impiego in Cyber Security: Incident Detection, Incident Response, Correlare informazioni e fornire in tempo reale lo stato della sicurezza, solo per citarne alcuni. Benefici che per essere tali, è opportuno che siano prodotti attraverso l’impiego di modelli in cui gli aspetti di “Problems of Organized Complexity” siano inclusi.

Altresì importante, oltre a quanto già indicato, è il presidio sui modelli al fine di limitare occorrenza e/o impatti di eventi negativi dovuti a minacce esplicite (es. inserimento di adesivi artefatti su fondo stradale che causano erronee interpretazioni dei sistemi a guida autonoma) e implicite (es: inserimento nei dati di training di valori alterati che pregiudicano il comportamento del sistema di machine learning) a cui i modelli scelti possono essere sottoposti.

Un ultimo aspetto da considerare con riferimento alla responsabilità, riguarda il requisito da soddisfare da parte del titolare del trattamento di fornire “informazioni significative sulla logica utilizzata, nonché l’importanza e le conseguenze previste di tale trattamento per l’interessato” (art. 13.2.f art. 14.2.f art  15.1.h di GDPR) La scelta del modello è quindi essenziale affinché il titolare del trattamento possa rispondere esaustivamente alle interrogazioni di spiegazione sulle modalità del trattamento. Un modello che sia facilmente spiegabile (es: Decision Tree) rispetto a uno che lo sia con più difficoltà (es: Deep Learning), avendo entrambi la stessa completezza di descrizione del fenomeno, è da preferire in quanto garantisce il titolare del trattamento per i suoi obblighi e l’interessato per i suoi diritti. Emerge quindi per la Cyber Security un ruolo di stratega per la scelta del modello rappresentativo più opportuno.

Ancorché la qualità del dato rappresenti un’esigenza essenziale da soddisfare; al fine di riportare i migliori requisiti nel contesto della privacy by default, di realizzare una adeguata privacy by design e di ottenere una accountability efficace nel contesto dell’attuale panorama tecnologico e normativo, la valutazione dei modelli rappresenta una priorità. La scelta dei modelli più appropriati può rappresentare la metodologia per mezzo della quale si possa fornire un’adeguata accezione a concetti quali: accountability, privacy by default e privacy by design. Concetti questi ultimi, la cui interpretazione molto spesso è dipendente dal dominio considerato.