GDPR megfelelés támogatása NLP-vel
2019.08.23
A Bank egyike Magyarország nagy pénzügyi szolgáltatóinak.
Körülmények
Bank szektor Testreszabott megoldásunkban NLP és szótár alapú szöveganalitikai komponenseket kombináltunk egy olyan rendszerré, amely lehetővé teszi a szervezet adatbázisaiban tárolt adatainak GDPR szempontú feltérképezését, a GDPR szenzitív adatok kigyűjtését és helyettesítését.
Kihívás
Az EU általános adatvédelmi szabályzata 2018. május 25-től alkalmazandó, ami kiterjeszti az egyének azon jogát, hogy ellenőrizzék személyes adataik gyűjtésének és feldolgozásának módját, ezzel együtt új kötelezettségeket ró a szervezetekre, hogy nagyobb felelősséggel kezeljék az adatvédelmet. A GDPR a személyes adatokra, illetve annak különleges kategóriáira vonatkozik, mint például vallás, politikai vélemények, egészségügyi információ, stb. A rendelet szigorú ellenőrzéseket ír elő ezen különleges kategóriák kezelésére, ezért is vált szükségessé a banknál tárolt adatok GDPR szempontú feltérképezése, és az esetleges beavatkozás megtétele.
Megoldás
Az adatbázisok manuális feltérképezése rengeteg időt és erőforrást kötött volna le, ezért szükséges volt egy automata rendszer kialakítása. A bevezetett megoldás a Clementine szöveganalitikai rendszerének speciálisan testreszabott implementációja, amely több lépésben került bevezetése: 1. Historikus adatok feldolgozása Az adatbázisokban, rendszerekben tárolt szöveges információk feldolgozása GDPR szempontból, majd ez alapján a GDPR alapszótár gazdagítása NLP technikákkal. 2. Működési mechanizmus kialakítása A rendszer úgy került kialakításra, hogy akár ad-hoc módon, akár ütemezetten is képes legyen feltérképezni, és feldolgozni a kérdéses adatbázisokat, azaz megtalálni és kiszűrni bármilyen GDPR szenzitív információt.
Hatások, eredmények
A bank a historikus feldolgozás és az automatizált üzemeltetés révén képes folyamatosan megfelelni a szigorú GDPR előírásainak, amivel így súlyos bírságokat kerülhet el, ráadásul mindezt úgy, hogy a feladat manuális erőforrás igényét minimálisra csökkentettük.