Der herkömmliche Ansatz für Datenzugriff und -aufbereitung kann für Data Analysts einen hohen Zeitaufwand bedeuten. Manche frustrierte Analyst:innen nehmen die Sache selbst in die Hand und erlernen das Schreiben von SQL-Code, anstatt für diese Aufgabe IT- und SQL-Entwickler:innen hinzuziehen zu müssen. Eines der größten Probleme, mit denen Analystinnen und Analysten beim Schreiben von SQL-Code konfrontiert sind, besteht darin, es überhaupt zum Laufen zu bringen! In SQL gibt es keine Autokorrektur, das heißt, ein falsch platzierter Punkt oder ein falsch platziertes Komma wird nicht automatisch abgefangen – und das kann dazu führen, dass Ihr gesamtes Skript fehlschlägt.
Mit einer Workflow-basierten Umgebung, die es Ihnen ermöglicht, Daten aus mehreren Quellen – einschließlich unstrukturierter Daten – aufzubereiten, zusammenzuführen und zu analysieren, wählt Alteryx hier einen anderen Ansatz. Statt Ihre Zeit mit dem Testen und Debuggen von Code zu verbringen, erstellen Sie einen wiederholbaren Workflow, bei dem Mitarbeiter:innen im gesamten Unternehmen – andere Analystinnen und Analysten, die IT-Abteilung sowie Geschäftsentscheider:innen – genau sehen, wie Sie die Daten extrahiert und umgewandelt haben. Das Ergebnis? Weniger Programmieraufwand, höhere Transparenz und mehr Konsistenz.
Wir haben einige der häufigsten datenbezogenen Prozesse zusammengestellt, die viele Analystinnen und Analysten in SQL programmieren. Direkt daneben zeigen wir Ihnen für jede dieser Aufgaben den entsprechenden Ansatz in Alteryx. Diese Beispiele sollen Analysten, die SQL-Code schreiben, helfen, besser zu verstehen, wie sie ihre SQL-Kenntnisse in einen Alteryx-Workflow umsetzen können.
Um in Alteryx auf Daten zuzugreifen, ziehen Sie per Drag & Drop ein Eingabedaten-Tool in den Arbeitsbereich (Canvas), suchen Sie die Datenbank und wählen Sie diese einfach aus. In diesem Beispiel wird das Eingabedaten-Tool verwendet, um eine Verbindung zu einer SQL Server-Datenbank herzustellen.
In Alteryx können Sie mit dem Datenfelder-auswählen-Tool den Datentyp ändern, Felder auswählen oder die Auswahl aufheben sowie Felder ganz nach Ihrem Belieben umbenennen. In diesem Fall lautet der Feldname „Customer ID“.
In Alteryx lassen sich mit dem Verknüpfen-Tool mehrerer Datasets einfach kombinieren.
Mit dem Verknüpfen-Tool können Sie zwei Tabellen mit einem gemeinsamen Feld (Primärschlüssel) verknüpfen, und Alteryx gibt automatisch drei Datensatzgruppen zurück:
Hier sehen Sie eine Verknüpfung über „Customer ID“.
Neben dem Verknüpfen-Tool verfügt Alteryx auch über ein In-DB-Verknüpfen-Tool. Bei großen Datenbeständen ermöglicht es das Zusammenführen und Analysieren von Daten, wobei diese in der Datenbank verbleiben. Im Vergleich zu traditionellen Analysemodellen kann dies erhebliche Leistungsverbesserungen bieten.
Mit dem In-DB-Verknüpfen-Tool können Sie innere (inner), linke äußere (left outer) und rechte äußere (right outer) Verknüpfungen sowie vollständige äußere (full outer) Verknüpfungen erstellen.
Erfahren Sie hier mehr über Alteryx In-Database Tools.
Das Zusammenführung-Tool erlaubt es Ihnen, mehrere Datensatzgruppen basierend auf dem Feldnamen oder einzelnen Spaltenpositionen zu kombinieren. Die Reihenfolge der Spaltenüberschriften lässt sich in jeder Datensatzgruppe einfach so ändern, dass sie zusammenpassen.
Hier werden zwei Datensatzgruppen – die links unverknüpften Datensätze und die (inneren) verknüpften Datensätze – zusammengeführt, was eine linke äußere Verknüpfung ergibt.
Das Eingrenzen von Datensätzen basierend auf bestimmten Kriterien wird anhand des Filter-Tools durchgeführt. Die Filterung kann alles von einfachen Vergleichen bis hin zu komplizierten bedingten Anweisungen verwenden. In diesem Beispiel werden nur die Datensätze gefiltert, die das Land „United States“ nicht enthalten.
In Alteryx wird das Zusammenfassen-Tool verwendet, um Daten aus mehreren Datensätzen zu sammeln, eine Aggregierungsfunktion anzuwenden und Ergebnisse nach einem oder mehreren Feldern zu gruppieren.
In diesem Beispiel wird mithilfe des Zusammenfassen-Tools nach Land (z. B. Großbritannien, Deutschland) gruppiert und der durchchnittliche Gesamtbetrag pro Land ermittelt.
Mit dem Filter-Tool lassen sich Datensätze basierend auf bestimmten Kriterien eingrenzen. Der Filter kann alles verwenden, von einfachen Vergleichen bis hin zu komplexen, bedingten Anweisungen. Dieses Beispiel zeigt nur die Datensätze, deren durchschnittlicher Gesamtbetrag größer oder gleich 1000 ist.
In Alteryx ermöglicht es Ihnen das Daten-sortieren-Tool, Ihre Daten zweckmäßig zu ordnen. Markieren Sie einfach den/die Namen der Spalten und wählen Sie zwischen „Aufsteigend“ und „Absteigend“. In diesem Beispiel wird der durchschnittliche Gesamtbetrag absteigend sortiert.
Dies ist der gesamte Alteryx Workflow für die SELECT-Anweisung von SQL.
Mit dem Felder-anfügen-Tool können Sie jedem Datensatz einer Zieleingabe Felder aus einer Quelleneingabe anfügen. Für jeden Datensatz in der Quelleneingabe wird von jedem Datensatz der Zieleingabe ein Duplikat erstellt. In diesem Beispiel werden jedem Kundeneintrag alle Datensätze des Distributionszentrums angefügt.
Dieser Alteryx Workflow fügt jedem Kundendatensatz die Datensätze des Distributionszentrums an.
Mit dem Alteryx Filter-Tool lassen sich Datensätze, deren Feldwerte innerhalb eines bestimmten Bereichs liegen, eingrenzen. Für dieses Beispiel wird einfach nach Bestelldatum vom 1. bis einschließlich 31. Dezember 2016 gefiltert.
Dieser Alteryx Workflow filtert Kundenauftragsdaten speziell nach Aufträgen, die zwischen dem 1. und 31. Dezember 2016 erteilt wurden.
Mit dem Alteryx Filter-Tool lassen sich Datensätze auf solche mit Feldwerten, die zu einem Satz möglicher Alternativen gehören, eingrenzen. In diesem Beispiel ist der Filter auf Kund:innen gesetzt, deren Land entweder „United States“ oder „United Kingdom“ sind.
Dieser Alteryx Workflow filtert nach Kunden bzw. Kundinnen, deren Land entweder die Vereinigten Staaten oder Großbritannien sind.
Das Einmalig-Tool in Alteryx hilft beim Trennen von Daten in zwei Gruppen – doppelte und einmalige Datensätze –, basierend auf den vom Benutzer ausgewählten Feldern. Das in diesem Beispiel ausgewählte Feld ist das Land.
Mit dem Einmalig-Tool (Unique Tool) unterteilt dieser Alteryx Workflow die Daten in zwei Gruppen (doppelte und einmalige Datensätze), basierend auf den Feldern, die Sie auswählen, in diesem Beispiel das Land.