Analyse Détaillée de Google Data Studio - Tout ce que Vous Devez Savoir (2024)

Transformez vos données en insights avec Google Data Studio, un outil de visualisation pour créer des rapports interactifs et personnalisés.

Google Data Studio
DÉCOUVRIR Google Data Studio

4.4

| 5

Version Gratuite Disponible

Version D'Essai Disponible

Version Payante Uniquement

À partir de

0

$

/mois

Qu'est-ce que Google Data Studio ?

Google Data Studio est l'un des outils de BI les plus populaires sur le marché, créé par Google.  Il vise à la simplicité, et ses capacités sont donc assez limitées. Data Studio a l'air sympa en apparence, mais en fait, ses fonctions sont fragmentées et peu abouties.

Google Data Studio fonctionne mieux si l'organisation utilisait déjà BigQuery de Google (entre autres outils Google) pour l'entreposage des données et disposait d'un flux de travail pour le nettoyage et la transformation des données.

Il y a également un tableau récapitulatif d'évaluation à la fin du post qui résume bien notre évaluation de Data Studio.

À qui s'adresse Data Studio ?

D'après notre évaluation de Google Data Studio, l'outil semble cibler un ensemble d'utilisateurs semi-techniques, qui travaillent avec des chiffres et connaissent très bien Excel. Ils peuvent même connaître un peu de langage de script (Python, JS), mais ne sont pas assez techniques pour travailler sur l'infrastructure des données ou pour créer des rapports complets à partir de zéro, ou encore pour élaborer des analyses complexes qui nécessitent des acrobaties SQL.

Il s'agit essentiellement de ce que les gens appellent des "analystes d'entreprise". Ils comprennent bien les problèmes de l'entreprise, peuvent parler le langage de l'entreprise et un peu le langage des données, et ont besoin d'un outil pour rassembler et présenter de jolis rapports aux clients ou aux parties prenantes internes.

Fonctionnalités

Google Data Studio comporte 4 concepts importants : Dataset, Connector, Data Source, Report.

gds-concepts

Les concepts de Google Data Studio et leurs liens

L'ensemble de données est la couche "physique" qui sous-tend tout (et stocke les données), tandis que la source de données est la couche "logique" avec des propriétés et des fonctionnalités supplémentaires. Un connecteur est le "tuyau" qui relie ces deux couches.

Un ensemble de données peut être bien plus qu'un simple tableau ou un fichier Excel. Quelques exemples :

  • Vues de rapports Google Analytics
  • Feuilles de calcul Google Sheets, fichiers CSV téléchargés sur Drive
  • Bases de données MySQL, PostgreSQL
  • etc...

La source de données est créée au-dessus de l'ensemble de données avec des fonctionnalités supplémentaires :

  • Partageable : bien que vous soyez le seul à avoir accès à votre ensemble de données sous-jacent, la source de données peut être partagée de la même manière que n'importe quelle autre ressource Google (avec des autorisations de propriétaire, de modification et de visualisation...).
  • Configurable : vous pouvez modifier les noms des champs, le type d'agrégation, créer des champs calculés, désactiver des champs...

Connecteur : La Google Data Studio n'importe pas vos données - elle utilise un connecteur pour avoir accès à vos données sous-jacentes réelles. Outre les connecteurs officiels de Google, il existe des connecteurs partenaires et des connecteurs open-source permettant d'accéder aux données d'autres plateformes telles que Facebook, GitHub ou Twitter.

Bien qu'il dispose d'un grand nombre de connecteurs qui facilitent la connexion des données, les connecteurs fournis par la communauté ne sont pas toujours stables car ils ne sont pas toujours bien entretenus.

gds-connectors

Google Data Studio prend en charge un grand nombre de connecteurs, certains fournis par Google, d'autres par des partenaires et des communautés.

Enfin, un rapport est la présentation finale et visuelle des données provenant de différentes sources de données. Nous parlerons davantage d'un rapport dans la section ci-dessous.

Prenons un exemple simple où vous voulez analyser les données d'une transaction de vente dans un fichier Excel que vous stockez dans GDrive.

  • Vous démarrez Google Data Studio, et utilisez leur connecteur Google Drive pour vous connecter à Google Drive (jeu de données).
  • Vous créez ensuite une source de données basée sur ce fichier Excel particulier dans Google Drive. Vous ajoutez ensuite une formule personnalisée (calculer la marge brute sur la base du prix de vente et du coût), ou supprimez les champs/données inutiles dans la source de données.
  • Ensuite, vous créez un rapport avec plusieurs visualisations pour présenter différents aspects de vos données dans la source de données. Vous pouvez partager ce rapport avec différentes parties prenantes. C'est fait !

1. Rapports

Google Data Studio s'articule autour du concept de "rapport". Un rapport dans Google Data Studio a une ressemblance frappante avec Google Drawing ou Google Slides. Google Data Studio n'a pas le concept de tableau de bord.

Comparé à d'autres outils de BI, où les rapports sont généralement constitués d'un graphique ou d'un tableau, et où le tableau de bord est constitué de plusieurs graphiques, avec un concept de mise en page basé sur une grille très fixe, nous pensons que c'est l'un des aspects les plus agréables de Google Data Studio.

Du côté de l'édition, l'outil offre une interface glisser-déposer très interactive, où l'utilisateur peut librement redimensionner et aligner les graphiques. Cela donne plus de liberté aux concepteurs, mais peut irriter ceux qui ne veulent que des graphiques rapides et agréables qui sont arrangés automatiquement.

Cette approche s'aligne bien sur les analystes d'affaires semi-techniques qui ont l'habitude d'embellir les diapositives Powerpoint.

Filtrage des données dans Google Data Studio

Le filtrage des données dans Google Data Studio est fragmenté. Il existe différents types de filtres dans Google Data Studio : Plage de dates, Contrôle des filtres, Contrôle des données, Filtres spécifiques aux cartes.

Un filtre est lié à une source de données et prend le contrôle de certains champs/dimensions de cette source de données.

Lorsque la valeur du filtre est modifiée, cette modification se répercute sur la source de données, générant de nouvelles requêtes qui sont envoyées au jeu de données sous-jacent. Les résultats sont stockés dans le cache des requêtes, puis les graphiques sont mis à jour en conséquence.

gds-filter-mechanism

Modélisation des données

Dans une source de données, nous pouvons ajouter un nouveau champ et spécifier son type. Les champs de type catégorique comme le texte, la date, le booléen... seront classés comme Dimension, tandis que les nombres sont classés comme Métriques. Chaque métrique est liée à une méthode d'agrégation par défaut.

La syntaxe de Formula est une version simplifiée de la syntaxe SQL standard de BigQuery. Les fonctions prises en charge répondent à la plupart des cas d'utilisation populaires, mais elles sont un peu insuffisantes dans les cas limites où vous souhaitez une formule plus compliquée :

En bref, il semble facile au début de s'habituer à cette fonctionnalité, mais elle comporte quelques bizarreries. En outre, elle ne permet pas actuellement de définir des relations (jointures) entre différentes sources de données, ce qui est très limitatif comme vous le lirez ci-dessous.

Exploration

Google Data Studio a récemment introduit la fonction Explorer (encore en mode Labs/beta) qui permet à l'utilisateur d'explorer une seule source de données dans une version simplifiée de Data Studio. Il s'agit probablement d'un moyen pour Google de répondre aux besoins de certains utilisateurs en matière d'interface d'exploration de données rapide et sale.

Cependant, nous pensons qu'avec une couche d'abstraction de données limitée (sans relations entre les sources de données), le développement de cette fonctionnalité sera limité, à moins que la couche de modélisation sous-jacente soit suffisamment complexe.

Combinaison de données

La combinaison de données provenant de sources multiples est l'une des caractéristiques les plus importantes d'un outil de BI. Nous examinons ci-dessous comment la Google Data Studio vous aide à le faire.

Google Data Studio a introduit la fonctionnalité de Data blending qui permet aux utilisateurs de combiner différentes sources de données en une seule. Cette fonctionnalité est à la fois similaire et différente d'une JOIN SQL. Comme Google l'a défini, il s'agit d'un LEFT JOIN et Google Data Studio permet de combiner jusqu'à 5 sources en une seule opération.

À notre avis, cette fonctionnalité est sous-développée et n'est utile que pour un petit nombre de cas d'utilisation spécifiques.

gds-blend-data

Examinons les différents scénarios de jointure suivants :

  • Mélange de deux sources de données
  • Mélange de 3 sources de données ou plus avec les mêmes clés de jointure
  • Mélange de 3 ou plusieurs sources de données avec des clés de jointure différentes

Les sources de données mélangées sont appelées "vues de données" et ne sont disponibles que dans le rapport créé, ce qui signifie qu'elles ne peuvent pas être partagées ou réutilisées. En d'autres termes, l'idée du mélange de données semble excellente, mais l'exécution n'est pas à la hauteur. S'il est développé davantage, le Data Blending sera un excellent compagnon du mode Explorer.

Contrôle d'accès et partage des données

Les rapports et les sources de données ont le même mécanisme de partage, de permission et de propriété qu'un document sur Google Drive, mais sans structure de dossier. Lorsqu'ils sont créés, ces objets sont enregistrés en tant que "fichier inconnu" dans le dossier principal de Google Drive, ce qui est assez désordonné.

Le partage des données est facile pour les individus, mais pour les groupes, Google Data Studio s'appuie sur Google Groups, ce qui ajoute des frictions à l'expérience. En fait, le mécanisme est assez restrictif pour les grandes organisations qui ont besoin d'un contrôle complexe des autorisations.

gds-access-control

Par exemple, lorsqu'un utilisateur quitte une organisation, le processus de transfert de propriété dans Data Studio est actuellement maladroit. Il arrive que le compte Gmail d'un utilisateur soit désactivé avant qu'il ne puisse transférer la propriété de ses rapports et sources de données, ce qui entraîne la désactivation de centaines de sources de données qui doivent être reconnectées à l'ensemble de données. Ce processus est assez long, fastidieux et parfois ingérable.

Intégrations

Google Data Studio s'intègre bien avec les autres produits de l'écosystème Google, principalement les produits de base de données (BigQuery, Spanner, Cloud SQL...), les produits de gestion des annonces et des campagnes (Google Analytics, Adwords, Youtube Analytics...) et Google Sheets.

  • BigQuery : Google Data Studio peut facilement se connecter aux tables et aux vues de BigQuery, et il prend également en charge le SQL personnalisé pour aider les utilisateurs à optimiser les performances des tableaux de bord et le coût des requêtes. Chaque table, vue et SQL personnalisé agit comme un ensemble de données.
  • Google Sheets : Chaque feuille d'une feuille de calcul Google est un ensemble de données séparé, ce qui signifie que chaque source de données ne se connectera qu'à une seule feuille d'une feuille de calcul. Les données de la feuille doivent être sous forme de tableau pour que Google Data Studio fonctionne correctement.
  • Applications (GA, Youtube, Google Ads) : Google Data Studio dispose de connecteurs officiels à Google Analytics, Youtube Analytics et autres. En se connectant à ces sources, Google Data Studio reconnaît automatiquement les dimensions et métriques disponibles. Il existe également des modèles Google Data Studio conçus pour fonctionner instantanément avec Google Ads ou Youtube Analytics, et il existe même un filtre dédié pour contrôler les sources de données GA dans Google Data Studio. Cependant, les données obtenues via ces connecteurs officiels ne sont que des données agrégées (et éventuellement échantillonnées).
  • Travailler avec une stack non-Google : Comme indiqué ci-dessus, outre les connecteurs officiels vers les produits Google, Google Data Studio propose des centaines de connecteurs écrits par des partenaires de Google, ainsi que quelques connecteurs open source. Ces connecteurs vous aident à explorer les données publiques (ou parfois privées) d'autres sites Web, dont les connecteurs de médias sociaux et de plateformes publicitaires représentent la plus grande partie.

Tarifs

Pour l'instant, Google Data Studio est proposé gratuitement par Google dans le cadre de son offre Google Cloud Platform.

Il est probable que Google commence à faire payer ce service (ou une version premium de celui-ci) à l'avenir, à l'instar de Google Analytics (avec Google Analytics 360).

Avis Final

Dans l'ensemble, nous pensons que Google Data Studio est un outil de BI décent, idéal pour les rapports dont la structure des données est simple, mais dont les exigences de formatage sont complexes (c'est-à-dire que les données ne sont pas complexes, mais que les utilisateurs finaux ont besoin de rapports sophistiqués).

Quelques points clés sont mis en évidence ci-dessous :

  • Conçu pour les utilisateurs semi-techniques, c'est-à-dire les analystes commerciaux.
  • Plusieurs connecteurs de données qui prennent en charge de nombreuses intégrations, mais aucune garantie de connecteurs contribués par la communauté.
  • Leur vue des rapports avec une expérience de type Powerpoint est unique et se démarque des autres outils que nous connaissons.
  • Leur modélisation des données est faible et très basique, ce qui les rend incapables d'effectuer des opérations compliquées et des rapports en libre-service. Il n'y a pas d'exploration et les capacités de filtrage sont standard.
  • Le mélange de données a du potentiel, mais il est encore très limité et il est difficile pour les utilisateurs de manipuler et de joindre les données (ce qui prend généralement 80 % du temps).
  • Conçu pour compléter la stack Google Cloud et fonctionne bien avec elle. Recommandé uniquement si vous utilisez déjà (ou décidez de le faire) les services de Google et de GCP.
Avantages
  • Visualisations de Données Efficaces : Facilite la compréhension des données complexes.
  • Flexibilité de la Source de Données : Compatible avec une multitude de sources de données.
  • Facilité de Collaboration : Partagez facilement des rapports avec d'autres.
  • Personnalisation Avancée : Créez des rapports qui répondent à vos besoins spécifiques.
Inconvénients
  • Courbe d'Apprentissage : Nécessite une certaine familiarité avec les concepts de visualisation de données.
  • Dépendance aux Autres Outils Google : Fonctionne mieux avec des sources de données Google.
  • Limitations de Personnalisation : Certaines fonctionnalités de personnalisation peuvent être limitées.

Fondée en 1998

Siège à San Francisco (États Unis)

Linkedin :
logo linkedin
X :
Table des matières
>
Partager ce contenu