Mieux comprendre les expressions LOD (Level of Detail)
Quelle est la meilleure manière d'utiliser et d'exploiter les expressions LOD dans vos analyses ?
Chez Tableau, notre objectif est de rendre votre expérience d'analyse de données la plus agréable possible. Nos utilisateurs nous expliquent que lorsqu'ils sont pleinement immergés dans leurs analyses dans Tableau, ils ne pensent plus aux mécanismes d'utilisation du produit et prennent plaisir à trouver des réponses à leurs questions grâce à leurs données. C'est ce que nous appelons l'expérience optimale, ou « flow » en anglais.
Si vous commencez à réfléchir à la manière dont vous devez utiliser votre outil pour trouver la réponse à votre question, cet état d'immersion totale est interrompu. L'une des raisons les plus fréquentes d'une telle rupture est le besoin d'utiliser des données qui sont agrégées à des niveaux de détail différents. Vos questions sont simples à formuler, mais il est difficile d'y répondre. Il s'agit souvent de questions du type : Puis-je déterminer combien de jours par trimestre mon entreprise a reçu plus de 100 commandes ?
Pour répondre à ces questions, Tableau 9.0 introduit une nouvelle syntaxe : les expressions LOD. Cette nouvelle syntaxe simplifie et développe le langage de création de calculs dans Tableau, en permettant de répondre directement à des questions relatives au niveau de détail.
Dans ce livre blanc, vous allez acquérir des connaissances sur le fonctionnement des expressions LOD et vous plonger au cœur des différents types d'expressions LOD et de leurs exemples d'utilisation respectifs.
Nous vous proposons ici quelques pages extraites du début du livre blanc. Téléchargez le PDF via le formulaire ci-contre à droite pour lire la suite.
Fonctionnement des expressions LOD – Définition du niveau de détail
En matière d'exploration de données, il est important de comprendre la structure de la source. Vous pouvez par exemple disposer de données relatives aux évaluations données à des restaurants, dont le niveau le plus granulaire est l'adresse postale. Vous souhaitez peut-être agréger ces données pour présenter les établissements en fonction du code postal, de la ville, de l'État ou même du pays.
Pour cela, dans Tableau vous placez généralement sur vos étagères les dimensions qui vous intéressent (la ville ou l'État, par exemple). En fonction des dimensions que vous choisissez d'ajouter à la vue, vos données seront agrégées pour constituer le niveau de détail de la visualisation.
Il est important de noter que les expressions LOD vous permettent de déterminer les niveaux de détail (c'est-à-dire les dimensions) utilisés dans un calcul, sans devoir les placer dans votre visualisation. Vous pouvez définir le niveau de détail auquel le calcul sera exécuté, indépendamment du niveau de détail de votre visualisation.
Dans l'exemple suivant (qui utilise les données des évaluations des restaurants), deux dimensions ont été ajoutées à la vue : Ville et État.
Les données présentes dans la vue sont agrégées en fonction du niveau de détail de la visualisation, qui ici se compose de Ville et État. Par ailleurs, le niveau d'agrégation est supérieur à celui de la source de données sous-jacente. Le point sélectionné sur l'image présente le nombre moyen de clients fans pour les restaurants situés à Newbridge, dans la banlieue d'Édimbourg.
L'ajout de dimensions plus granulaires à la vue se traduira par un niveau de détail moins agrégé pour la visualisation. Par exemple, vous pouvez ajouter le code de l'établissement à la visualisation (en faisant glisser cette dimension sur l'étagère Détail) pour afficher le nombre moyen de clients fans pour chaque établissement. Si vous procédez ainsi, la visualisation sera modifiée et chaque établissement apparaîtra sous la forme d'un cercle sur la carte. Mais si vous ne souhaitez pas modifier la visualisation ? Imaginons que vous souhaitiez déterminer le nombre total de clients fans pour chaque ID d'établissement, calculer la moyenne de ces valeurs pour chaque ville et afficher uniquement un cercle par ville. Ce qui vous intéresse, c'est le nombre moyen de clients fans par restaurant dans chaque ville.
Cela nécessite d'ajouter une dimension à la vue, sans la faire glisser dans la visualisation. Pour cela, utilisez une expression LOD.
Créons un nouveau champ calculé, intitulé « Clients fans par établissement ». Voici une brève présentation de la syntaxe :
(Image cachée)
Cette expression ordonne à Tableau d'effectuer l'agrégation pour chaque ID d'établissement, sans considérer les autres dimensions utilisées dans la visualisation. Vous pouvez utiliser cette expression LOD pour calculer le nombre total de clients fans par ID d'établissement. Une fois que vous avez fait glisser ce nouveau champ dans la vue, vous pouvez déterminer la moyenne de ces valeurs par ville.
En utilisant l'opérateur FIXED dans l'expression LOD, vous obtenez des informations sur les villes qui comportent, en moyenne, un nombre élevé de clients fans par ID d'établissement. Cela signifie que les villes signalées par une teinte bleu sombre possèdent des restaurants plus appréciés par les clients (ou la ville peut avoir plus d'habitants, et par conséquent plus de clients fans par restaurant).
Il existe trois types de mots-clés pour les expressions LOD : EXCLUDE, INCLUDE et FIXED. Chacun de ces mots-clés permet de modifier l'étendue de l'expression LOD.