Cos'è la pseudonimizzazione PII?
PII sta per "Personally Identifiable Information": dati personali come nomi, indirizzi e-mail, numeri di telefono o numeri AVS. La pseudonimizzazione consiste nel sostituire questi dati con segnaposto preservando il contesto, senza mai esporre dati personali reali.
La differenza dall'anonimizzazione: con la pseudonimizzazione, il processo è reversibile. I dati originali vengono preservati e reinseriti dopo l'elaborazione IA. Con l'anonimizzazione, i dati sarebbero irrimediabilmente perduti.
Perché pseudonimizzazione e non anonimizzazione?
Per i casi d'uso IA, la pseudonimizzazione è la soluzione ideale. Vuoi che la risposta dell'IA torni con i dati reali. Quando chiedi "Scrivi un'e-mail a Max Müller", la risposta deve contenere "Max Müller". Non "[PERSON_1]".
Allo stesso tempo, il modello IA non deve mai sapere che si tratta di Max Müller. Lavora solo con il token "[PERSON_1]" e fornisce comunque una risposta perfetta.
Come funziona in Gardeo?
Il processo si svolge in quattro fasi:
-
Rilevamento (NER): Il nostro motore PII utilizza il riconoscimento di entità nominate per identificare i dati personali nel tuo testo. Riconosce diverse categorie: nomi di persona, nomi di aziende, indirizzi e-mail, numeri di telefono, numeri AVS, indirizzi postali e numeri IBAN.
-
Sostituzione coerente: Ogni entità rilevata viene sostituita con un token coerente. Significa che "Max Müller" viene sempre sostituito dallo stesso token "[PERSON_1]", anche se il nome compare più volte. Il contesto resta comprensibile per l'IA.
-
Elaborazione IA: Il prompt pseudonimizzato viene inviato al modello IA selezionato. Il modello vede solo token, mai dati personali reali. La qualità dell'elaborazione non ne risente. L'IA comprende il contesto anche con i segnaposto.
-
Risostituzione: La risposta dell'IA viene automaticamente risostituita con i dati originali. "[PERSON_1]" torna a essere "Max Müller". Il risultato appare identico a una comunicazione diretta con l'IA. Solo che i veri dati personali non hanno mai lasciato lo spazio giuridico europeo.
Quali dati vengono rilevati?
Gardeo rileva automaticamente le seguenti categorie:
- Nomi di persona: nome e cognome, anche in diverse grafie
- Nomi di aziende: ragioni sociali e marchi
- Indirizzi e-mail: tutti i formati comuni
- Numeri di telefono: formati svizzeri e internazionali
- Numeri di previdenza sociale: il formato AVS svizzero (756.XXXX.XXXX.XX)
- Indirizzi postali: via, codice postale, città
- Numeri IBAN: conti bancari
- Entità personalizzate: con il piano Business puoi definire regole di rilevamento personalizzate (ad es. numeri di pratica, numeri di polizza, ID interni)
Trasparenza: cosa è stato pseudonimizzato?
Una funzionalità unica di Gardeo è la vista Trasparenza. Dopo ogni conversazione puoi vedere a colpo d'occhio:
- Quali entità sono state rilevate
- Da quali token sono state sostituite
- Se ci sono stati falsi positivi (che puoi segnalare)
- Se sono state perse entità (che puoi anch'esse segnalare)
Questa trasparenza è importante non solo per te come utente, ma anche per i responsabili della conformità. Possono dimostrare in qualsiasi momento che i dati personali sono stati correttamente protetti.
Performance: quanto è veloce la pseudonimizzazione?
Il motore PII lavora in tempo reale. La pseudonimizzazione di un prompt tipico richiede meno di 100 millisecondi. Non noti alcuna differenza nei tempi di risposta. Il motore è ottimizzato per alti volumi di throughput e scala automaticamente con il carico.
Conclusione
La pseudonimizzazione PII è il cuore di Gardeo. Ti permette di usare l'IA a piena potenza senza correre rischi di protezione dei dati. E il meglio: non devi configurare nulla. Funziona automaticamente dal primo messaggio.