2.2. Dublettenanalyse

2.2.1. Voraussetzungen
2.2.2. Überblick zum gesamten Ablauf
2.2.3. Neuen Report erstellen
2.2.4. Report-Auswahl
2.2.5. Benutzeroberfläche Details
2.2.5.1. Strukturbaum
2.2.5.1.1. Was stellt der Baum dar?
2.2.5.1.2. Navigation im Strukturbaum
2.2.5.1.3. Kolorierung im Strukturbaum
2.2.5.1.4. Verbindung von Baum und Ergebnissen (Cluster) und Statistik-Überblick
2.2.5.2. Ergebnisse
2.2.5.2.1. Cluster bearbeiten
2.2.5.2.2. Geometrische Ähnlichkeit
2.2.5.2.3. Referenzteil
2.2.5.2.4. Farbliche Markierung von Variablen
2.2.5.2.5. Bereich "Duplicates"
2.2.5.2.6. Workflow beim Löschen eines Main Part
2.2.5.2.7. Teil annotiert in anderem Cluster
2.2.5.3. Überblick
2.2.5.4. Filter
2.2.6. Teilevergleich
2.2.7. Export
2.2.8. Fehlermeldungen

Die Dublettenanalyse ist ein zentrales Werkzeug zur Datenqualitätskontrolle – insbesondere bei großen Datenmengen und importierten Katalogen. Sie findet Dublettenkandidaten, beseitigt sie aber nicht automatisch, sondern bildet die Grundlage für nachgelagerte Bereinigungsprozesse.

Konkret bedeutet dies für den Ablauf: