Was ist Datenzusammenführung?

Datenzusammenführung – oder auch Data Blending – ist ein Prozess, bei dem Daten aus mehreren Quellen kombiniert werden, um ein verwertbares analytisches Dataset für die Entscheidungsfindung im Unternehmen oder für einen bestimmten Geschäftsprozess zu erstellen. Dieser Prozess ermöglicht es Organisationen, aus einer Vielzahl von Quellen einen Mehrwert zu ziehen und tiefergehende Analysen zu erstellen.

Die Datenzusammenführung unterscheidet sich insofern von der Datenintegration und der Aufbewahrung von Daten in Data Warehouses, als ihr hauptsächlicher Nutzen nicht darin besteht, eine eindeutige Version der Wahrheit zu schaffen, die in Data Warehouses oder anderen Aufzeichnungssystemen eines Unternehmens gespeichert wird. Stattdessen wird dieser Prozess von einem Geschäfts- oder Datenanalyst:innen durchgeführt, mit dem Ziel, ein Analyse-Dataset zu erzeugen, das bei der Beantwortung bestimmter geschäftlicher Fragen hilft.

Warum ist Datenzusammenführung wichtig?

Durch Datenzusammenführung können Data Analysts Daten jeder Art und aus jeder beliebigen Quelle in ihre Analysen integrieren, um schnellere, tiefergehende Erkenntnisse über das Unternehmen zu erhalten.

Durch die Kombination von zwei oder mehr Datasets werden häufig wertvolle Informationen aufgedeckt, die nicht entdeckt würden, wenn die Daten nicht zusammengeführt worden wären – Informationen, die eine neue Perspektive bieten und zu besseren Geschäftsentscheidungen führen können.

Analyst:innen haben sich traditionell auf VLOOKUPs, Skripte und mehrere Tabellen gestützt, um Datasets zu erstellen. Das kann jedoch umständlich und zeitaufwendig sein.Die Nutzung manueller Prozesse und das Zurückgreifen auf Data Scientists bei der Erstellung analytischer Datasets ist zunehmend ineffektiv, denn es ist nicht mit der Menge an Ad-hoc-Anfragen skalierbar, die Analyst:innen erhalten.

Bausteine für die Datenzusammenführung beschleunigen den Prozess der Erstellung von Datasets und können Analyst:innen und Führungskräften dabei helfen, genauere Antworten zu erhalten.

Um an der Spitze der Innovation zu stehen, muss sich die Datenanalyse auf generelle geschäftliche Fragen konzentrieren, anstatt auf Details von Tabellen und manuelle SQL-Abfragen. Datenzusammenführung kann es Analyst:innen ermöglichen, den vollen Nutzen aus ihren sich ausweitenden Rolle zu ziehen, genauso wie aus der Erweiterung der Daten, die zum Treffen wichtiger Geschäftsentscheidungen erforderlich sind.

Der Prozess der Datenzusammenführung

Der Prozess der Datenzusammenführung

Es gibt zwar viele verschiedene Methoden, um Daten zusammenzuführen, von inneren und äußeren Verknüpfungen („Joins“) bis hin zu Fuzzy Matching und Unions. Aber Datenzusammenführung läuft auf vier einfache Schritte hinaus.

 

Vorbereitung der Daten

Der erste Schritt bei der Datenerfassung besteht darin, zu fragen, welche Informationen hilfreich sein könnten, um die gestellten Fragen zu beantworten. Identifizieren Sie relevante Datasets aus verschiedenen Quellen. Dabei kann eine große Bandbreite von Strukturen oder Dateitypen verwendet werden. Alle enthaltenen Datenquellen müssen eine Dimension gemeinsam haben, um kombiniert werden zu können.

Diese unterschiedlichen Typen in eine gemeinsame Struktur umzuwandeln, die eine sinnvolle Zusammenführung ermöglicht, ohne die ursprüngliche Datenquelle zu verändern, ist etwas, was durch moderne Analysetechnologien automatisiert und wiederholbar möglich ist.

 

Zusammenführen von Daten

Kombinieren Sie die Daten aus verschiedenen Quellen und passen Sie jede Verknüpfung auf Grundlage der gemeinsamen Dimension an, um eine nahtlose Datenzusammenführung zu gewährleisten.

Denken Sie an die gewünschte zusammengeführte Ansicht und schließen Sie nur Daten ein, die für die Beantwortung der gestellten Fragen unerlässlich sind, sowie Felder, die diesen Antworten einen zusätzlichen Kontext geben können, wenn eine Analyse stark beansprucht wird. Das daraus resultierende Dataset sollte leicht verständlich und den Stakeholdern leicht zu erklären sein.

Kehren Sie zu diesem Schritt zurück, um Daten in einen Workflow zu integrieren oder aus diesem zu entfernen und die Analyse weiter auszubauen.

 

Bestätigen der Ergebnisse

Es ist kein Geheimnis, dass das Kombinieren von Daten aus verschiedenen Quellen zu zahlreichen Problemen mit der Kompatibilität oder Genauigkeit  führen kann. Untersuchen Sie die Daten, um die Ergebnisse zu bestätigen, nicht abgeglichene Datensätze zu erkunden und Genauigkeit und Konsistenz im gesamten Dataset sicherzustellen.

Bereinigen und strukturieren Sie die Daten zunächst für den gewünschten Zweck. Überprüfen Sie dann das neue Dataset, um sicherzustellen, dass Datentyp und -größe im für die Analyse gewünschten Format vorliegen.

Prüfen Sie abschließend das Ergebnis der Zusammenführung mit kritischem Blick. Dies ist eine gute Gelegenheit, die Ergebnisse auf nicht abgeglichene Datensätze zu untersuchen und vielleicht zu zusätzlichen, der Zusammenführung vorgelagerten Datenvorbereitungsaufgaben zurückzukehren.

 

Ausgabe der Daten

Sobald die harte Arbeit der Datenzusammenführung erfolgt ist, ist es an der Zeit, die Daten im richtigen Business-Intelligence-System zu implementieren, damit das zusammengeführte Dataset bei der Erreichung des Ziels helfen kann.

Dies bedeutet, dass die ausgegebenen Daten anschließend wieder in einer Datenbank gespeichert, in einen operativen Prozess aufgenommen, mit statistischen, Geodaten- oder Prognosemethoden weiter analysiert oder auch in Datenvisualisierungssoftware wie QlikView oder Tableau übernommen werden können.

Datenzusammenführung und Analyseweg

Die Datenzusammenführung ist ein entscheidender Schritt auf dem Weg zur Analyse, obwohl die Menge der Datenquellen, die ein Unternehmen möglicherweise hat, die Datenzusammenführung als ein komplexes Unterfangen erscheinen lassen kann.

Mit der Alteryx Analytics Automation Platform ist Datenzusammenführung weniger überwältigend und leichter zugänglich. Analyst:innen können detaillierte Erkenntnisse bereitstellen, indem sie interne Daten, Daten von Drittanbietern und Daten aus der Cloud zusammenführen und diese dann mithilfe von Geodaten- und Prognosebausteinen per Drag & Drop analysieren. Andere Bausteine wie Fuzzy Matching ermöglichen es, zwei Datasets anhand ähnlicher, aber nicht identischer Attribute (typischerweise Namen und Anschriften) abzugleichen.

Darüber hinaus lassen sich Alteryx-Workflows zur Optimierung, weiteren Datenzusammenführung, Bearbeitung, Aktualisierung und Analyse einfach speichern und wiederholen.

Mit der Alteryx Analytics Automation Platform können Geschäftsanalyst:innen, IT-Benutzer:innen und Data Scientists gleichermaßen unbegrenzte Kombinationen von Daten zusammenführen und analysieren, um handfeste Geschäftsergebnisse zu erzielen. Das bedeutet, dass Benutzer:innen den Zugriff auf Daten demokratisieren, manuelle Prozesse optimieren und automatisieren und ihre Erkenntnisse mit Advanced Analytics auf Low-Code-/No-Code-Basis verbessern können.

erste Schritte bei der Datenzusammenführung machen

Alteryx wurde entwickelt, um jeden Schritt des Prozesses der Datenzusammenführung einfach und intuitiv zu gestalten. Sehen Sie sich das Starter-Kit für die Datenzusammenführung an, um einen tieferen Einblick in die Datenzusammenführung zu erhalten, und erfahren Sie, wie Sie:

  • Transaktionen und Kund:innen zusammenführen, um Erkenntnisse aus visueller Berichterstellung zu liefern und Trends und Chancen zu erkennen
  • die schnelle Zusammenführung per Fuzzy Matching ähnlicher, aber nicht genau übereinstimmender Daten ermöglichen und diese in automatisierte Workflows einspeisen, um Echtzeit-Erkenntnisse zu erhalten
  • Geodaten zusammenführen, um die Verteilung von Werbegebieten zu berechnen, den Umsatz zu steigern und den Return-on-Investment (ROI) zu verbessern

Um mehr über Alteryx zu erfahren und erster Hand zu erleben, wie Analyst:innen und Führungskräfte die Funktionen zur Datenzusammenführung, -verarbeitung, -analyse und Berichterstellung zu Ihrem Vorteil nutzen können, installieren Sie jetzt Ihre kostenlose Testversion.

Nächste Begriff
Cloud Data Warehouse (CDW)