Adattisztítás a gyakorlatban

Névtisztítás

A névtisztítás lényege a névlistánkon szereplő nevek hibáinak felderítése és megszüntetése. A teljes neveket részeire, elemeire (előtag, családi név, keresztnév stb.) bontjuk és elemenként javítjuk. A javított elemeket összefűzve megkapjuk a javított teljes nevet, de a név javított részeit önállóan is felhasználhatjuk. Például egy javított keresztnév alapján megállapíthatjuk az adott személy nemét, meghatározhatjuk névnapját. A név előtagja vagy utótagja utalhat egy tudományos fokozatra, ami adott esetben értékes információ lehet. Ha a névadatokat egy korszerű informatikai rendszerbe akarjuk tölteni, akkor pedig általában már követelmény, hogy a teljes név elemenként rendelkezésünkre álljon.

Az előtagok és utótagok valamint a keresztnevek referenciaszótárak felhasználásával javíthatóak. Magyar nevek esetében, a keresztnevek vizsgálatakor az MTA Nyelvtudományi Intézete által anyakönyvi bejegyzésre alkalmasnak minősített utónevek jegyzéke alapján dolgozunk. Külföldi nevek esetében hasonló, hiteles forrásokból származó referenciákat alkalmazunk. A teljes nevek szerkezetének vizsgálatakor 1982. évi 17. számú törvényerejű rendeletben, a névviselésre vonatkozó rész szerint járunk el.

Címtisztítás

Címtisztítás során a címeket egységes formátumúra alakítjuk, bennük az elgépeléseket, hibákat javítjuk, a hiányosságokat kiegészítjük, a régi utcaneveket az aktuálisra cseréljük. Ezzel a szolgáltatással a címlisták hiányosságai és elavultsága megszűntethetők. A rövidítések feloldása tovább emeli a címadatok megbízhatóságát.

A címek javításakor is az elemekre bontás és elemenként történő javítás a célravezető. A cím elemeit (irányítószám, település, közterület, stb.) javításuk után összefűzve megkapjuk a javított, teljes címet. A cím elemeire bontása a címadatok új informatikai rendszerekbe történő migrációja során ma már elengedhetetlen kívánalom. Az újabb fejlesztésű rendszerekben ugyanis a címek elemeit már önálló mezőkben tároljuk, ellentétben a régi rendszerekre jellemző, ömlesztett módon történő tárolással. Ez a megoldás lehetőséget ad arra is, hogy lakóhely vagy telephely szerint elkülönített célcsoportokat azonosítsunk ügyfeleink között.

A címek helyességének megállapítása, illetve címadatok javításához referencia adatbázist használunk.

E-mail címek tisztítása

Az adatbázisunkban tárolt e-mail címek egy része általában rögzítési, gépelési hiba miatt hibás. Ezekre a címekre nem tudunk e-mail-t küldeni. A hibák részben, különösen a tipikus hibák, javíthatók. Javított e-mail címeink érvényes, használható adatokká válnak.

Az e-mail címek javításakor mind algoritmikus feldolgozás, mind referencia-adatbázissal történő összehasonlítás végezhető.

Telefonszámok tisztítása

A telefonszámok tisztítása során a formai ellenőrzésekkel megvizsgáljuk, hogy az adott telefonszám megfelel-e a Magyarországon használatos telefonszámok formátumának, melyben megkülönböztetünk budapesti, vidéki, mobil- valamint közérdekű és speciális telefonszámokat. Ezen kívül tartalmi ellenőrzés mentén a magyarországi hivatalos körzetszám referencia adatbázis alapján validáljuk a körzetszámokat és szabványos formátumúra alakítjuk a telefonszámokat.

Okmányszámok, azonosítók tisztítása

Magyarországon a különböző, személyazonosításra alkalmas okmányok (pl. személyazonosító igazolvány száma, útlevélszám) és egyéb azonosítók (pl. adóazonosító jel, TAJ), valamint a vállalkozások azonosítására alkalmas azonosítók (pl. adószám, cégjegyzékszám, TEÁOR-kód) illetve a bankszámlaszámok részben algoritmikusan ellenőrizhetők, részben referenciaszótárhoz hasonlíthatók.

DSS Consulting