Das Arbeiten mit Daten in Excel kann einfach, aber auch schwierig und zeitintensiv sein, besonders beim Arbeiten mit mehreren Datenquellen und -formaten. Daten müssen in Zeilen und Spalten passen, haben Größeneinschränkungen, und das Verknüpfen von Daten aus mehreren Tabellenkalkulationen erfordert komplexe Formeln, die Ihre Ergebnisse fehleranfällig machen. Immer wenn Ihre Daten sich ändern, müssen Sie zudem jeden Schritt der Datenvorbereitung und -zusammenführung erneut durchführen.
Der Ansatz von Alteryx basiert hingegen auf einer Workflow-basierten Umgebung, die es Ihnen ermöglicht, Daten mehrerer Datenquellen und -typen aufzubereiten, zusammenzuführen und zu analysieren, einschließlich unstrukturierter Daten. Und weil Sie Ihre Zeit damit verbringen, einen wiederholbaren Workflow zu erstellen, der genau dokumentiert, wie Sie mit Daten arbeiten, brauchen Sie den Workflow einfach nur neu auszuführen, wenn Ihre Daten sich ändern – was zu weniger Zeitaufwand bei der Datenanalyse, weniger Fehlern und mehr Konsistenz führt.
Wir haben einige der häufigsten datenbezogenen Aufgaben aufgeführt, für die Analystinnen und Analysten häufig noch Excel verwenden. Daneben zeigen wir Ihnen für jede dieser Aufgaben den passenden Ansatz in Alteryx. Diese Beispiele sollen Excel-Nutzern verstehen helfen, wie sie ihr Excel-Wissen in ein Alteryx Tool und eine Workflow-Umgebung übertragen können.
Laden Sie das E-Book A Radical Guide to Data Analytics Mastery for Spreadsheet Users herunter und erfahren Sie, wie Alteryx Excel-Benutzer:innen unterstützen kann. Dazu können Sie eine kostenlose Demoversion von Alteryx herunterladen.
Um das Excel-Programm zu öffnen, klicken Sie zuerst auf „Datei“ und dann auf „Öffnen“.
Um in Alteryx auf Daten zuzugreifen, ziehen Sie per Drag & Drop ein Eingabedaten-Tool in den Arbeitsbereich (Canvas), suchen Sie die Datenbank und wählen Sie diese einfach aus. Klicken Sie dann im Konfigurationsbereich auf das Dropdown-Menü „Connect a File or Database“.
Suchen Sie den Ordner, in dem sich die Datei befindet, und klicken Sie dann einfach darauf, um sie zu öffnen.
Suchen Sie als Nächstes Ihre Datei.
Excel kann eine begrenzte Menge von strukturierten Daten aus lokalen Dateien öffnen.
Alteryx bietet Benutzern eine breit gefächerte Palette von Datenzugriffen auf zahlreiche Datenquellen und Datenstrukturen. Mit dem Input Tool können Benutzer lokal auf Daten von Excel, Access, XML, SAS, SPSS und MapInfo zugreifen sowie auf Daten, die in Datenbanken oder HDFS gespeichert sind.
Darüber hinaus verfügt Alteryx über direkte Konnektoren, um auf Daten zuzugreifen, die in einem Cloud-System gespeichert sind, wie Amazon S3, Twitter, Foursquare, Marketo, Salesforce, Microsoft SharePoint oder anderen Big Data-Umgebungen wie Amazon Redshift, Impala, Spark usw.
Die Dateitypen, -quellen und -strukturen können durch den Zugriff auf Daten aus dem Internet, Text und eine breite Palette weiterer Datenquellen erweitert werden.
Wenn in Excel ein Ordner mehrere Dateien desselben Typs enthält (z. B. CSV), müssen Sie diese alle einzeln auswählen, woraufhin jede in einem separaten Arbeitsblatt geöffnet wird.
In Alteryx ziehen Sie dafür ein Input Tool auf die Arbeitsfläche, suchen den Ordner und fügen einen Platzhalter (*) ein. In diesem Fall sollen zwei CSV-Dateien importiert werden.
Mit dem Eingabe-Tool suchen Sie das Verzeichnis und die gewünschte Datei. In diesem Fall ist dies „POS_Data“.
Nach Import der Datei „POS_Data“ können Sie zum Konfigurationsbereich wechseln und den Verzeichnispfad bearbeiten, indem Sie „(_*.csv)“ hinzufügen. Dadurch werden alle CSV-Dateien aus demselben Verzeichnis importiert und zusammengeführt, vorausgesetzt, sie weisen alle dieselbe Tabellenstruktur und dasselbe Format auf.
Spalten lassen sich in Excel schnell und einfach umbenennen. Sie brauchen nur auf die Spaltenzelle zu klicken und den Namen zu ändern.
Auch in Alteryx ist es einfach. Mit dem Datenfelder-auswählen-Tool können Sie das Feld einfach nach Belieben umbenennen.
Spalten lassen sich in Excel schnell und einfach umbenennen. Sie brauchen nur auf die Spaltenzelle zu klicken und den Namen zu ändern.
In Alteryx können Sie mit dem Datenfelder-auswählen-Tool den Datentyp in jedes gewünschte Format ändern.
Neben dem Datenfelder-auswählen-Tool steht auch das Auto-Datentypbestimmung-Tool zur Verfügung. Wie der Name vielleicht vermuten lässt, kann dieses Tool die Daten interpretieren und den für den jeweiligen Inhalt geeigneten Typ und die Größe zuweisen. Dies ist besonders nützlich für Felder, die Textzeichenfolgen enthalten.
Einige Konvertierungen sind etwas komplexer. Daten können problematisch sein, weil das Datenfelder-auswählen-Tool möglicherweise nicht in der Lage ist, Ihr bevorzugtes Datumsformat zu erfassen. Um dies zu bewerkstelligen, gibt es ein spezielles Datum/Uhrzeit-Tool.
Um eine in einem Berechnungsfeld verwendete Spalte zu entfernen, müssen Sie zunächst die Werte kopieren und einfügen, bevor Sie das Original löschen. Andernfalls funktioniert Ihre Formel nicht mehr.
In Alteryx ist das kein Problem. Verwenden Sie einfach das Datenfelder-auswählen-Tool und heben Sie die Auswahl der Kontrollfelder für alle Elemente auf, die Sie nicht benötigen oder die Sie ausblenden möchten, und sie werden aus Ihrem Workflow entfernt, ohne die Formeln zu beeinträchtigen.
In Excel können Sie dies über eine manuelle Auswahl oder einen Schnellfilter tun, der sucht, was Sie nicht brauchen.
Die Kriterien lassen sich auflisten? Dann können Sie das Filter-Tool verwenden. Falls es kompliziert ist, können Sie IF-Anweisungen mit einer Formel erstellen oder die „switch ()“-Funktion verwenden.
Die gängigste Methode zum Erstellen neuer Felder in Excel ist das Einfügen einer neuen Spalte, das Benennen der Spalte und gegebenenfalls das Einfügen einer Formel in die Spalte.
In Alteryx brauchen Sie eine Spalte nicht in eine Tabelle einzufügen. Sie können einfach mit dem Formel-Tool ein neues Ausgabefeld zum Workflow hinzufügen. Tippen Sie einfach in das neue Feld (in diesem Fall „Value Targets“) und es wird in jeder Zeile berechnet.
Tipp 1: Falls Sie den ersten und letzten Namen verketten müssen, verwenden Sie eine Formel mit dem „+“-Symbol. Bei den meisten anderen textbasierten Formeln sind der verwendete Name und die Syntax identisch, zum Beispiel „Left ()“ oder „Right ()“. Das Alteryx-Handbuch (F1 drücken) hilft Ihnen dabei, die Formeln zu finden, wo das nicht der Fall ist.
Tipp 2: Falls Sie ein Feld mit einem normalen Format splitten (zum Beispiel ein durch Kommas getrenntes Adressfeld), verwenden Sie das Text-in-Spalten-aufteilen-Tool.
In Excel arbeitet jeder mit IF-Anweisungen. Dies ist eine der beliebtesten Entscheidungsfunktionen der Plattform. Um eine neue Spalte für das Umsatzpotenzial zu erstellen, welche die Werte als „Hoch“, „Mittel“ oder „Gering“ einstuft, verwenden Sie in Excel die folgende IF-Anweisung:
=IF(V2>2500, “High”, IF(V2>1499, “Medium”, “Low”))
Das Formula Tool ist ein leistungsfähiger Daten- und Formelrechner. Verwenden Sie es, um in einer Eingabetabelle ein Feld hinzuzufügen, um neue Datenfelder basierend auf einem Ausdruck oder einer Datenbeziehung zu erstellen oder ein bestehendes Feld unter denselben Voraussetzungen zu aktualisieren. Um die gleiche IF-Anweisung in Alteryx zu erstellen, legen Sie einfach ein neues Ausgabefeld namens „Umsatzpotenzial“ an und geben unter Verwendung des Gesamtumsatz-Feldes folgenden Ausdruck ein:
IF [Total Sales] > 2500 THEN “High” ELSEIF [Total Sales] > 1499 && [Total Sales] < 2501 THEN “Medium” ELSE “Low” ENDIF
Um eine automatische Summenfunktion in Excel zu erstellen, müssen Sie die jeweiligen Felder und Zeilen markieren und dann auf das Auto-Sum-Symbol klicken. Sie können auch „=SUMformula“ schreiben.
Das Zusammenfassen-Tool kann jede Menge Zusammenfassungsprozesse durchführen, darunter: Gruppieren, Summieren, Zählen, Geo-Objekte verarbeiten, Zeichenfolgen verketten und vieles mehr. In diesem Beispiel wird das Zusammenfassen-Tool verwendet, um Transaktionen nach Kund:innen zu gruppieren und danach die Gesamtausgaben der einzelnen Kund:innen zu summieren und anzuzeigen.
Um die kumulative Summe von Zeilen in Excel zu erstellen, müssen Sie erst eine neue Spalte anlegen und dann den Kumulationsbereich festlegen. In diesem Fall ist der Startpunkt „=S2“, und für die zweite Zeile fügen Sie „=S2 + R3“ hinzu. Sobald dies festgelegt wurde, lässt sich die Formel für den Rest der verbundenen Informationen kopieren.
Das Mehrzeilige-Formel-Tool führt das Konzept des Mehrzeilige-Formel-Tools einen Schritt weiter, indem es Ihnen bei der Formelerstellung das Verwenden von Zeilendaten ermöglicht. Dieses Tool ist nützlich, um komplexe Daten zu analysieren und laufende Summen, Durchschnittswerte und Prozentsätze zu berechnen sowie andere mathematische Berechnungen durchzuführen. In diesem Fall wird erst ein neues Feld und dann ein Ausdruck erstellt.
Um in Excel Prozentsätze für jedes Feld basierend auf einer Summe zu berechnen, müssen Sie möglicherweise zunächst eine eigene Datentabelle und dann eine Pivottabelle erstellen. Alternativ können Sie eine SUMIF()-Anweisung schreiben, um die Prozentsätze für jeden Monat und Betrag zu berechnen. Nachstehend ein Beispiel für eine Pivottabelle.
Das Formel-mit-mehreren-Feldern-Tool macht es einfach, eine einzelne Funktion über mehrere Felder auszuführen. Dieses Beispiel legt neue Spalten/Felder in den Daten an, die einen Prozentsatz für jeden Monat anzeigen.
Filtern in Excel ist einfach. Sie markieren einfach das Arbeitsblatt oder die Spalten, die Sie filtern möchten, und wählen dann das Dropdown-Menü des Filters aus.
In Alteryx lassen sich Daten anhand des Filter-Tools mit einem Basisfilter in zwei Gruppen teilen: True (den Ausdruck erfüllende Daten) oder False (Daten, die den Ausdruck nicht erfüllen).
In Excel ist die Sortierung nach mehreren Spalten einfach. Markieren Sie einfach das Arbeitsblatt und führen Sie eine normale oder eine benutzerdefinierte Sortierung aus.
Das Daten-sortieren-Tool in Alteryx macht es genauso einfach und ermöglicht es Ihnen, Ihre Daten zweckmäßig zu organisieren. Markieren Sie einfach den Namen der Spalte und wählen Sie zwischen „Aufsteigend“ oder „Absteigend“.
Für das Pivotieren von Daten in Excel (z. B. Daten transponieren oder eine Kreuztabelle erstellen) müssen Sie normalerweise eine Pivottabelle erstellen, um die Daten in die gewünschte Form zu bringen.
Das Umstellung-Tool erlaubt es Ihnen, die Ausrichtung der Datentabelle zu drehen. Es wandelt die Daten so um, dass Sie horizontale Datenfelder vertikal betrachten können. Dieses Tool ist nützlich, um nicht konforme Daten zu extrahieren. Dabei lässt sich eine unbegrenzte Menge von Datensätzen oder Feldern transponieren.
Das Kreuztabellen-Tooldreht die Ausrichtung der Datentabelle. Es wandelt Daten so um, dass vertikale Datenfelder horizontal betrachtet werden können, und fasst Daten dabei je nach Anweisung zusammen.
Um Spalten oder Felder in Excel neu anzuordnen, müssen Sie die Spalten markieren und dann mit der Umschalttaste die Spalten per Drag & Drop an den gewünschten Platz verschieben.
Zum Neuanordnen von Spalten in Alteryx können Sie das Datenfelder-auswählen-Tool oder das Formel-Tool nutzen.
Bei Excel müssen Sie sicherstellen, dass die Spalten der beiden Tabellen identisch und in derselben Reihenfolge sind. Dann kopieren Sie den ganzen Inhalt der zweiten Tabelle und fügen ihn in die erste leere Zeile der ersten Tabelle ein.
Alteryx vereinfacht diesen Vorgang. Das Union Tool ermöglicht es Ihnen, mehrere Arbeitsblätter basierend auf den Feldnamen zu kombinieren, während die Position jeder Spalte beibehalten wird. Die Reihenfolge der Spaltenüberschriften lässt sich in jedem Arbeitsblatt einfach so ändern, dass sie zusammenpassen.
Wenn Sie in Excel mehrere Arbeitsblätter verknüpfen möchten, können Sie die Formeln VLOOKUP oder INDEX MATCH verwenden, um Informationen zu den Datasets aus einer (oder mehreren) anderen Quelle(n) oder Tabelle(n) zu importieren. INDEX MATCH wird statt einer VLOOKUP-Formel verwendet, falls die Spalte am linken Rand nicht den Suchwert enthält und die VLOOKUP-Formel daher nicht verwendbar ist.
Wenn Sie mehrere Übereinstimmungen jeweils in einer eigenen Zeile anzeigen wollen, ist ein „Join“ (eine Verknüpfung) eine bessere Lösung. Sie können zwei Datasets eingeben und entweder mit dem Verknüpfen-Tool verknüpfenoder, falls eine kompatible Datenquelle verbunden ist, auch mit dem Eingabe-Tool.
Mit dem Verknüpfen-Tool verknüpfen Sie zwei Tabellen mit einem gemeinsamen Feld (Primärschlüssel) zum Erstellen von:
Sie können auch das In-DB-Verknüpfen-Tool verwenden, falls Sie mit Daten in einer Datenbank arbeiten. Bei großen Datasets ermöglichen es die In-DB-Verknüpfen-Tools von Alteryx, Daten zusammenzuführen und zu analysieren. Die Daten verbleiben dabei in der Datenbank, was erhebliche Leistungsverbesserungen verglichen mit traditionellen Analysemodellen bieten kann.
Das In-DB-Verknüpfen-Tool ermöglicht innere Verknüpfungen, Verknüpfungen links und rechts außen sowie sogar vollständige Verknüpfungen.
Hier erfahren Sie mehr über Alteryx In-DB Tools.
Wenn Sie Daten in Excel zusammenfassen wollen, erstellen Sie eine Pivottabelle.
Das Summarize Tool in Alteryx funktioniert genau wie eine Pivottabelle in Excel. Sie können Daten erst gruppieren und dann summieren, zählen oder andere Berechnungen für andere Feldern durchführen.
Wenn Sie Alteryx nicht bereits heruntergeladen haben, erhalten Sie hier eine kostenlose Demoversion.
Besuchen Sie die Alteryx-Community, um mehr zu erfahren oder Hilfe von anderen Alteryx-Benutzern zu weiteren Alteryx-Funktionen zu erhalten.
Ein besonderer Dank gilt unserem Partner Information Lab für seinen Beitrag. Erfahren Sie mehr über das Information Lab.