Guides produit

Guide Alteryx pour SQL

Alteryx SQL

L'approche traditionnelle de l'accès aux données et de leur préparation implique parfois des tâches chronophages pour les analystes. Frustrés, certains prennent les choses en main et se lancent dans l'apprentissage de la programmation SQL plutôt que de dépendre de l'IT et des développeurs SQL. L'une des principales difficultés de la programmation SQL, c'est de faire en sorte que le code fonctionne ! La correction automatique n'existe pas en SQL : si vous placez un point ou une virgule au mauvais endroit, l'erreur ne sera pas détectée automatiquement et cela peut faire échouer le script.

 

Alteryx adopte une approche différente, basée sur les workflows, qui permet de préparer, de fusionner et d'analyser les données de plusieurs sources, y compris les données non structurées. Au lieu de passer votre temps à tester et déboguer le code, vous créez un workflow reproductible qui montre précisément à vos collègues, aux autres analystes, à l'IT et aux décideurs comment vous avez extrait et transformé les données. Le résultat ? Moins de temps passé à coder, et plus de transparence et de cohérence.

 

Nous avons répertorié certains des processus les plus courants que beaucoup d'analystes codent en SQL. Nous expliquons comment faire la même chose avec Alteryx. Ces exemples visent à aider les analystes qui écrivent du code SQL à exploiter leurs connaissances SQL pour créer un workflow Alteryx.

 
 

Select

SELECT, FROM, WHERE, GROUP BY, HAVING, ORDER BY

En SQL

 

 

Dans Alteryx

 

Pour accéder aux données dans Alteryx, faites glisser un outil Entrée de données dans l'espace de travail, localisez la base de données, puis sélectionnez-la.
Dans cet exemple, l'outil Entrée de données vous permet de vous connecter à une base de données SQL Server.

L'outil Sélection vous permet de changer le type de données, de sélectionner/désélectionner des champs ou de renommer simplement les champs comme vous le souhaitez. Dans cet exemple, CustomerID est le nom du champ.

 

Dans Alteryx, l'outil Jointure permet de combiner facilement plusieurs jeux de données.

L'outil Jointure vous permet de réunir deux tables ayant un champ commun (clé primaire), et Alteryx renvoie automatiquement trois ensembles d'enregistrements :

  • Jointure interne (J) : colonnes de la table source (L) combinées avec les colonnes de la table à joindre (R), en faisant correspondre les enregistrements en fonction du ou des champs communs
  • Gauche sans jointure (L) : enregistrements de la table d'origine (L) pour lesquels il n'existe pas de correspondance dans la table à joindre (R)
  • Droite sans jointure (R) : enregistrements de la table à joindre (R) pour lesquels il n'existe pas de correspondance dans la table source (L)

Voici une jointure sur l'ID client.


Outre l'outil Jointure, Alteryx dispose également d'un outil Rejoindre en base de données. Celui-ci permet de fusionner et d'analyser les données par rapport à des jeux de données volumineux sans sortir les données de la base de données. Il améliore sensiblement les performances par rapport aux méthodes d'analyse traditionnelles.

L'outil Rejoindre en base de données permet d'effectuer des jointures internes, des jointures externes gauches, des jointures externes droites et des jointures externes complètes.

Pour en savoir plus sur les outils En base de données d'Alteryx, cliquez ici.


  L'outil Union permet de combiner plusieurs ensembles d'enregistrements en fonction du nom du champ ou de la position de chaque colonne. Vous pouvez changer aisément l'ordre des en-têtes de colonne dans chaque ensemble d'enregistrements pour qu'ils correspondent.

Ici, deux ensembles d'enregistrements, à savoir les enregistrements gauches non joints et les enregistrements joints (internes), ont été rassemblés pour produire une jointure externe gauche.

 

La limitation des enregistrements en fonction de critères spécifiques s'effectue avec l'outil Filtrer. Le filtrage peut utiliser aussi bien des comparaisons simples que des instructions conditionnelles complexes. Dans cet exemple, seuls les enregistrements qui ne contiennent pas le pays États-Unis sont filtrés.

 

Dans Alteryx, l'outil Synthèse vous permet de collecter des données dans plusieurs enregistrements, d'appliquer une fonction d'agrégation et de regrouper les résultats en fonction d'un ou plusieurs champs.

Dans cet exemple, l'outil Synthèse est utilisé pour regrouper en fonction du pays (par exemple : Royaume-Uni, Allemagne) et calculer la moyenne du montant total par pays.

L'outil Filtrer permet de limiter les enregistrements en fonction de critères spécifiques. Le filtrage peut utiliser aussi bien des comparaisons simples tout au long du processus que des instructions conditionnelles complexes. Dans cet exemple, seuls les enregistrements dont la moyenne des totaux est supérieure ou égale à 1 000 apparaissent.

 

L'outil Trier d'Alteryx permet d'organiser les données comme vous l'entendez. Sélectionnez le ou les noms de la ou des colonnes et choisissez le tri croissant ou décroissant. Dans cet exemple, le montant moyen total est affiché par ordre décroissant.


Il s'agit du workflow Alteryx complet pour l'instruction SQL SELECT.

 
 

Cross Join

Cross Join

En SQL

Dans Alteryx

 L'outil Append Fields permet d'ajouter les champs d'une entrée source à chaque enregistrement d'une entrée cible. Chaque enregistrement de l'entrée cible sera dupliqué pour chaque enregistrement dans l'entrée source. Ici, tous les enregistrements Distribution Center sont annexés à chaque enregistrement Customer.

Ce workflow Alteryx ajoute les enregistrements Distribution Center à chaque enregistrement Client.

 
 

Where Between

Where Between

En SQL

Dans Alteryx

L'outil Filtrer d'Alteryx permet de limiter les enregistrements à ceux dont les valeurs des champs sont comprises dans une plage spécifique. Dans cet exemple, seules les dates de commande comprises entre le 1er et le 31 décembre 2016 inclus sont filtrées.

Ce workflow Alteryx filtre les données des commandes situées entre le 1er et le 31 décembre 2016.

 
 

Where In

Where In

En SQL

Dans Alteryx

Utilisez l'outil Filtrer d'Alteryx pour limiter les enregistrements à ceux dont les valeurs des champs appartiennent à un ensemble d'alternatives possibles. Dans cet exemple, Alteryx filtre les clients dont le pays est soit États-Unis, soit Royaume-Uni.

Ce workflow Alteryx filtre les clients dont le pays est soit États-Unis, soit Royaume-Uni.

 
 

Distinct

Distinct

En SQL

Dans Alteryx

L'outil Unique d'Alteryx permet de séparer les données en deux flux, enregistrements en double et uniques, en fonction des champs que vous avez choisis. Le champ sélectionné dans cet exemple est celui des pays.

Distinct

Avec l'outil Unique, ce workflow Alteryx sépare les données en deux flux (enregistrements en double et uniques) en fonction des champs que vous choisissez (celui des pays dans cet exemple).