Dublettenerkennung mit reDUB > Glossar

Adressdubletten

In großen Adressdatenbanken können Adressen mit minimalen Unterschieden in der Schreibweise unbemerkt doppelt oder sogar mehrfach vorkommen. Bei diesen Adressen spricht man von Dubletten bzw. Adressdubletten. Die Schreibweise von Dubletten wird oft auch als Doubletten oder Dupletten angegeben.

Adressdubletten entstehen beispielsweise durch Schreib-/Tipp- oder Hörfehler beim Anlegen der Adresse in die Datenbank. Oft entstehen Adressdubletten auch dadurch, dass verschiedene Adressbestände vereinigt werden oder die erfassten Personen oder Unternehmen ihren Namen wechseln. Gleichzeitig kann das Anmieten oder Ankaufen neuer Adressen dazu führen, dass Personen mehrfach in der Adressdatenbank geführt werden.

...weiterlesen


Dublettensoftware

Eine moderne Dublettensoftware leistet heutzutage weit mehr, als nur Dubletten bzw. doppelte Einträge anhand eines komplexen Deduplizierungsalgorithmus zu erkennen und herauszufiltern. Sie gibt dem Anwender die Möglichkeit, aus verschiedenen Einstellungen die optimalste Kombination auswählen zu können, um beim eigentlichen Deduplizierungslauf das bestmögliche Ergebnis zu erzielen.

...weiterlesen