Dubletten Prüfung - DQS

Optimus DQS (Data Quality Service) – Dublettenprüfung

Bei der Dublettenprüfung werden doppelte Datensätze, die sich auf dieselbe Einheit beziehen, identifiziert und anschließend zusammengeführt. Adressdatensätze enthalten oft leicht unterschiedliche Datensätze, die identische Adressen oder Namen repräsentieren. Namen von Personen, Straßen oder Städten können unterschiedlich geschrieben, abgekürzt oder falsch geschrieben sein. Zur Dublettenprüfung von Adressdatensätzen können die Datensätze mit einem Referenzadressdatensatz abgeglichen werden, um ihre Namens- und Adressbezeichnungen zu normalisieren.

Der Optimus DQS – Dublettenprüfung ist modular aufgebaut und ermöglicht somit eine gezielte Zuschaltung bestimmter Module für die Normalisierung von Adressen oder anderen Komponenten.

Mit unserem Adressprüfungsmodul sind wir in der Lage, einzelne zusammengesetzte Textbausteine, die z. B. eine Adresse darstellen, auseinander zu strukturieren.
 
Zudem sind wir in der Lage, Adressen von Unternehmen innerhalb EU mit unserem Stammdatenprüfer zu validieren und entsprechend zu berichtigen.
 

Alle unsere Module/Funktionen sind als Cloud-Lösung verfügbar und auch per REST-API.

Ermittlung aller Firmendaten nur Anhang der UST-ID API-Beispiel:

Nach der Eliminierung der Dubletten in der ersten Iteration führen wir ein kontinuierlich laufendes System, das für jede reale Einheit ein „Fuzzyhash“ erstellt und diesen bei jeder Änderung oder Hinzufügen von Datensätzen in Echtzeit vergleicht. Damit erzielen wir auch bei mehreren Hunderttausend Stammdatensätzen eine Evaluierung von Dubletten in weniger als 100 ms.