Travailler avec des données dans Excel peut être simple, mais cela peut aussi poser des problèmes et être fastidieux, notamment lorsque vous utilisez plusieurs sources et formats de données. Les données doivent entrer dans des lignes et des colonnes, sont soumises à des limites de taille, et la fusion de données issues de plusieurs feuilles de calcul nécessite des formules complexes qui peuvent provoquer des erreurs. En outre, lorsque les données changent, vous devez recommencer complètement chaque étape de la préparation et de la fusion des données.
Alteryx adopte une approche différente, basée sur les workflows, qui permet de préparer, de fusionner et d'analyser les données de plusieurs sources et de différents types, y compris les données non structurées. Comme vous passez du temps à construire un workflow reproductible qui documente précisément la façon dont vous utilisez les données, il suffit ensuite de réexécuter le workflow chaque fois que les données changent. Cela accélère l'analyse, réduit le risque d'erreur et renforce la cohérence.
Nous avons répertorié certaines des tâches les plus courantes que beaucoup d'analystes tentent d'effectuer dans Excel. Nous expliquons comment faire la même chose avec Alteryx. Ces exemples visent à aider les utilisateurs d'Excel à exploiter leurs connaissances d'Excel dans un environnement d'outils et de workflow Alteryx.
Pour en savoir plus sur ce qu'apporte Alteryx aux utilisateurs d'Excel, téléchargez l'e-book sur la maîtrise de l'analytique des données pour les utilisateurs de feuilles de calcul. Puis, téléchargez une version d'essai gratuite d'Alteryx.
Pour ouvrir le fichier dans Excel, cliquez sur Fichier, puis sur Ouvrir.
Pour accéder aux données dans Alteryx, faites glisser un outil Entrée de données dans l'espace de travail, localisez la base de données, puis sélectionnez-la. Ensuite, vous cliquez sur la liste déroulante Connect a File ou Database dans la section de configuration.
Localisez le dossier dans lequel se trouve le fichier, puis cliquez dessus pour l'ouvrir.
Ensuite, recherchez l'emplacement du fichier.
Excel peut ouvrir une quantité limitée de données structurées depuis les fichiers locaux.
Alteryx offre un vaste choix aux utilisateurs pour accéder aux données de multiples sources et structures de données. L'outil Entrée de données leur permet d'accéder en local aux données Excel, Access, XML, SAS, SPSS, MapInfo, ainsi qu'aux données stockées dans des bases de données ou HDFS.
Alteryx comprend aussi des connecteurs directs permettant d'accéder aux données stockées dans un système cloud comme Amazon S3, Twitter, Foursquare, Marketo, Salesforce et Microsoft Sharepoint, ou dans d'autres environnements Big Data comme Amazon Redshift, Impala, Spark, etc.
Vous pouvez utiliser d'autres types, sources et structures de fichier en accédant à des données du Web et de fichiers texte, ainsi qu'à de nombreuses autres sources de données.
Dans Excel, si un dossier contient plusieurs fichiers de même type (.CSV, par exemple), vous devez en sélectionner un à la fois. Chaque fichier s'ouvre alors dans une feuille de calcul distincte.
Dans Alteryx, faites glisser un outil Entrée de données dans l'espace de travail, localisez le dossier, puis insérez un caractère générique (*). Dans cet exemple, nous utilisons deux fichiers .CSV.
Avec l'outil Entrée de données, recherchez le répertoire et le fichier appropriés. Dans cet exemple, il s'agit de POS_Data.
Une fois le fichier POS_Data ajouté, passez dans la section Configuration et modifiez le chemin du répertoire en ajoutant ceci : _*.csv. Cela permet d'ajouter tous les fichiers .CSV d'un même répertoire et de les réunir s'ils ont la même structure de table et le même format.
Il est très facile et rapide de changer les noms de colonne dans Excel. Cliquez simplement dans la cellule et tapez un autre nom.
Dans Alteryx, c'est très simple aussi. Utilisez l'outil Sélectionner pour changer le nom.
Il est très facile et rapide de changer les noms de colonne dans Excel. Cliquez simplement dans la cellule et tapez un autre nom.
Dans Alteryx, l'outil Sélection permet de changer le type de données pour utiliser le format de votre choix.
Outre l'outil Sélection, vous pouvez également utiliser l'outil Champ automatique. Comme son nom l'indique, cet outil est capable d'interpréter les données et de leur attribuer le type et la taille appropriés selon le contenu. Cela est particulièrement utile pour les champs qui contiennent des chaînes de texte.
Certaines conversions sont un peu plus complexes. Les dates peuvent poser des problèmes : en effet, l'outil Sélection n'est pas forcément capable de comprendre quel est votre format de date préféré. C'est pour cette raison que l'outil Date/Heure existe.
Pour supprimer une colonne utilisée dans un champ calculé, vous devez d'abord copier et coller les valeurs avant de supprimer celles d'origine, sinon votre formule ne fonctionnera plus.
Dans Alteryx, cette opération est simple. Utilisez simplement l'outil Sélection et désactivez la case à cocher de l'élément dont vous n'avez pas besoin ou que vous voulez masquer. Il disparaît alors de votre workflow sans que cela perturbe les formules.
Vous pouvez effectuer une sélection manuelle dans Excel, ou utiliser un filtre rapide pour rechercher ce dont vous n'avez pas besoin.
Si vous pouvez répertorier les critères, il est possible d'utiliser l'outil Filtrer. Si c'est compliqué, vous pouvez utiliser une formule pour créer des expressions conditionnelles ou utiliser la fonction switch ().
En général, pour créer des champs dans Excel, vous insérez une nouvelle colonne, lui attribuez un nom, puis créez une formule si besoin.
Dans Alteryx, au lieu d'insérer une colonne dans la table, il suffit d'ajouter un nouveau champ de sortie au workflow en utilisant l'outil Formule. Tapez simplement le nouveau champ (Value Targets en l'occurrence) ; le nouveau champ est calculé sur chaque ligne.
Conseil 1 : si vous devez concaténer un nom et un prénom, utilisez une formule avec le symbole +. La plupart des autres formules basées sur du texte utilisent le même nom et la même syntaxe, par exemple Left () ou Right (). Consultez la documentation Alteryx (appuyez sur F1) pour connaître les exceptions à cette règle.
Conseil 2 : si vous fractionnez un champ ayant un format normal (par exemple, un champ d'adresse avec des valeurs séparées par des virgules), utilisez l'outil Texte en colonnes.
Tout le monde utilise des instructions conditionnelles dans Excel. Il s'agit de l'une des fonctions de prise de décision les plus utilisées dans la plateforme. Pour créer une colonne Sales Potential qui attribue les scores High, Medium ou Low, vous utilisez l'instruction conditionnelle suivante dans Excel :
=IF(V2>2500, “High”, IF(V2>1499, “Medium”, “Low”))
L'outil Formula est un processeur de données et de formules puissant. Utilisez-le pour ajouter un champ à une table d'entrée, créer des champs de données en fonction d'une expression ou d'une relation de données ou actualiser un champ existant en fonction de ces mêmes éléments. Pour créer la même instruction conditionnelle dans Alteryx, ajoutez simplement un nouveau champ de sortie appelé Sales Potential, puis en utilisant le champ Total Sales, entrez l'expression suivante :
IF [Ventes totales] > 2500 THEN “High” ELSEIF [Ventes totales] > 1499 && [Ventes totales] < 2501 THEN “Medium” ELSE “Low” ENDIF
Pour créer une somme automatique dans Excel, il faut sélectionner les champs et les lignes Excel, puis cliquer sur le symbole Auto Sum. Vous pouvez aussi créer une formule =SUM (=SOMME dans la version localisée).
L'outil Synthèse peut exécuter diverses opérations telles que regroupement, somme, comptage, traitement d'objet spatial, concaténation de chaînes, etc. Dans cet exemple, l'outil Synthèse est utilisé pour regrouper des transactions par client et calculer la somme des transactions afin de déterminer le total des dépenses du client.
Pour créer la somme cumulée des lignes dans Excel, vous devez créer une colonne, puis définir la plage cumulative. Dans cet exemple, le point de départ est =S2, et vous ajoutez =S2 + R3 pour la seconde ligne. Ensuite, vous pouvez copier la formule pour le reste.
L'outil Formule à plusieurs lignes reprend le concept de l'outil Formule en l'étendant pour permettre d'utiliser les données des lignes lors de la création de la formule. Cet outil est pratique pour analyser la syntaxe des données complexes et créer des totaux, des moyennes, des pourcentages et d'autres calculs mathématiques cumulés. Dans cet exemple, vous créez un champ, puis une expression.
Dans Excel, pour calculer des pourcentages sur chaque champ en fonction d'un total, vous devrez peut-être créer d'abord une table avec vos données, puis un tableau croisé dynamique en fonction de ces données. L'autre option consiste à écrire une instruction SUMIF() pour calculer les pourcentages de chaque mois et chaque montant. Voyez ci-dessous un exemple de tableau croisé dynamique.
L'outil Formule à plusieurs lignes facilite l'exécution d'une seule fonction sur plusieurs champs. Cet exemple crée des colonnes/champs dans les données pour afficher un pourcentage pour chaque mois.
Le filtrage des données est facile dans Excel. Sélectionnez simplement la feuille de calcul ou les colonnes à filtrer, puis ouvrez la liste déroulante Filtrer.
Dans Alteryx, l'outil Filtrer permet d'effectuer un filtrage de base pour séparer les données en deux flux : True (les données correspondent à l'expression) ou False (les données ne correspondent pas).
Le tri en fonction de plusieurs colonnes dans Excel est simple. Sélectionnez simplement la feuille de calcul et exécutez un tri ou un tri personnalisé.
Dans Alteryx, l'outil Trier fonctionne tout aussi simplement et vous permet d'organiser les données exactement comme vous l'entendez. Sélectionnez le nom de la colonne et choisissez le tri croissant ou décroissant.
Pour faire pivoter des données dans Excel (par exemple les transposer ou créer un tableau croisé), il faut créer un tableau croisé dynamique pour organiser les données comme vous le souhaitez.
L'outil Transposer permet de pivoter l'orientation du tableau de données. Il transforme les données pour que vous puissiez voir les champs de données horizontaux sur un axe vertical. Cet outil est pratique pour extraire les données non conformes. Vous pouvez transposer autant d'enregistrements ou de champs que vous voulez.
L'outil Cross Tab pivote l'orientation du tableau de données. Il transforme les données pour montrer les champs verticaux sur un axe horizontal en résumant les données là où cela a été spécifié.
Pour réorganiser des colonnes ou des champs dans Excel, il faut sélectionner les colonnes, puis utiliser la touche Maj pour les faire glisser à l'endroit voulu.
Pour réorganiser des colonnes dans Alteryx, utilisez l'outil Sélection ou l'outil Formule.
Dans Excel, vous devez vérifier que les colonnes des deux tables sont absolument identiques et dans le même ordre. Ensuite, vous copiez tout le contenu du second tableau et le collez dans la première ligne vide du premier tableau.
Cette opération est très simple dans Alteryx. L&'outil Union permet de combiner plusieurs feuilles de calcul en fonction des noms de champ tout en conservant la position de chaque colonne. Vous pouvez changer aisément l'ordre des en-têtes de colonne dans chaque feuille de calcul pour qu'ils correspondent.
Pour réunir plusieurs feuilles de calcul dans Excel, vous pouvez utiliser la formule VLOOKUP ou INDEX MATCH afin d'ajouter des informations dans les jeux de données à partir d'une ou de plusieurs sources ou tables différentes. La formule INDEX MATCH est utilisée à la place de la formule VLOOKUP si la valeur recherchée ne se trouve pas dans la colonne la plus à gauche. Par conséquent, vous ne pouvez pas utiliser la formule VLOOKUP.
Si plusieurs correspondances doivent avoir leurs propres lignes, une jointure est plus appropriée. Vous pouvez utiliser deux jeux de données en entrée et les réunir avec l'outil Jointure.Si vous vous connectez à une source de données compatible, vous pouvez les joindre dans l'outil Entrée des données.
L'outil Jointure permet de réunir deux tables ayant un champ commun (clé primaire) pour créer :
Vous pouvez aussi utiliser l'outil Réunir en BDD si vous travaillez avec des données d'une base de données. L'outil Réunir en BDD d'Alteryx permet de fusionner et d'analyser les données par rapport à des jeux de données volumineux sans sortir les données de la base de données, et peut améliorer sensiblement les performances par rapport aux méthodes d'analyse traditionnelles.
L'outil Réunir en BDD permet d'effectuer des jointures internes, gauches, droites et même des jointures complètes.
Pour en savoir plus sur les outils En base de données d'Alteryx, cliquez ici.
Pour agréger des données dans Excel, créez un tableau croisé dynamique.
L'outil Synthèse d'Alteryx fonctionne comme un tableau croisé dynamique Excel. Vous pouvez regrouper des données, additionner, compter ou exécuter d'autres calculs sur d'autres champs.
Si vous n'avez pas encore téléchargé Alteryx, obtenez une version d'essai gratuite.
Pour en savoir plus ou obtenir de l'aide sur d'autres fonctions d'Alteryx grâce aux utilisateurs d'Alteryx, visitez la communauté Alteryx.
Nous remercions tout spécialement notre partenaire Information Lab pour sa contribution. Pour en savoir plus sur Information Lab, cliquez ici.