Was ist PII-Pseudonymisierung?
PII steht für "Personally Identifiable Information". Personenbezogene Daten wie Namen, E-Mail-Adressen, Telefonnummern oder AHV-Nummern. Pseudonymisierung bedeutet, diese Daten durch Platzhalter zu ersetzen, sodass der Kontext erhalten bleibt, aber keine echten Personendaten preisgegeben werden.
Der Unterschied zur Anonymisierung: Bei der Pseudonymisierung kann der Vorgang umgekehrt werden. Die Originaldaten bleiben erhalten und werden nach der KI-Verarbeitung wieder eingesetzt. Bei der Anonymisierung wären die Daten unwiderruflich verloren.
Warum Pseudonymisierung und nicht Anonymisierung?
Für den Einsatz mit KI ist Pseudonymisierung die ideale Lösung. Denn du möchtest ja, dass die KI-Antwort mit den echten Daten zurückkommt. Wenn du fragst "Schreibe eine E-Mail an Max Müller", soll die Antwort auch "Max Müller" enthalten. Nicht "[PERSON_1]".
Gleichzeitig soll das KI-Modell nie erfahren, dass es sich um Max Müller handelt. Es arbeitet nur mit dem Token "[PERSON_1]" und liefert trotzdem eine perfekte Antwort.
Wie funktioniert es bei Gardeo?
Der Prozess läuft in vier Schritten ab:
-
Erkennung (NER): Unsere PII-Engine nutzt Named Entity Recognition, um personenbezogene Daten in deinem Text zu identifizieren. Die Engine erkennt verschiedene Kategorien: Personennamen, Firmennamen, E-Mail-Adressen, Telefonnummern, AHV-Nummern, Postadressen und IBAN-Nummern.
-
Konsistente Ersetzung: Jede erkannte Entität wird durch einen konsistenten Token ersetzt. Das bedeutet: "Max Müller" wird immer durch denselben Token "[PERSON_1]" ersetzt. Auch wenn der Name mehrfach im Text vorkommt. So bleibt der Kontext für die KI verständlich.
-
KI-Verarbeitung: Der pseudonymisierte Prompt wird an das ausgewählte KI-Modell gesendet. Das Modell sieht nur Tokens, nie echte Personendaten. Die Verarbeitungsqualität leidet nicht. Die KI versteht den Kontext auch mit Platzhaltern.
-
Rücksubstitution: Die KI-Antwort wird automatisch mit den Originaldaten zurücksubstituiert. "[PERSON_1]" wird wieder zu "Max Müller". Das Ergebnis sieht genauso aus, als hättest du direkt mit der KI kommuniziert. Nur dass die echten Personendaten nie den europäischen Rechtsraum verlassen haben.
Welche Daten werden erkannt?
Gardeo erkennt automatisch folgende Kategorien:
- Personennamen: Vor- und Nachnamen, auch in verschiedenen Schreibweisen
- Firmennamen: Unternehmensbezeichnungen und Marken
- E-Mail-Adressen: Alle gängigen Formate
- Telefonnummern: Schweizer und internationale Formate
- Sozialversicherungsnummern: Das Schweizer AHV-Format (756.XXXX.XXXX.XX)
- Postadressen: Strasse, PLZ, Ort
- IBAN-Nummern: Bankkontonummern
- Benutzerdefinierte Entitäten: Im Business-Plan können eigene Erkennungsregeln definiert werden (z.B. Fallnummern, Policennummern, interne IDs)
Transparenz: Was wurde pseudonymisiert?
Ein einzigartiges Feature von Gardeo ist die Transparenz-Ansicht. Nach jeder Konversation kannst du auf einen Blick sehen:
- Welche Entitäten erkannt wurden
- Durch welche Tokens sie ersetzt wurden
- Ob es falsch-positive Erkennungen gab (die du melden kannst)
- Ob Entitäten übersehen wurden (die du ebenfalls melden kannst)
Diese Transparenz ist nicht nur für dich als Nutzer wichtig, sondern auch für Compliance-Verantwortliche. Sie können jederzeit nachweisen, dass personenbezogene Daten korrekt geschützt wurden.
Performance: Wie schnell ist die Pseudonymisierung?
Die PII-Engine arbeitet in Echtzeit. Die Pseudonymisierung eines typischen Prompts dauert unter 100 Millisekunden. Du merkst keinen Unterschied in der Antwortzeit. Die Engine ist für hohe Durchsatzraten optimiert und skaliert automatisch mit der Last.
Fazit
PII-Pseudonymisierung ist das Herzstück von Gardeo. Sie ermöglicht es dir, KI mit der vollen Leistung zu nutzen, ohne Datenschutzrisiken einzugehen. Und das Beste: Du musst nichts konfigurieren. Es funktioniert automatisch ab der ersten Nachricht.