Vous avez certainement déjà entendu parler de Google BigQuery, mais savez-vous bien à quoi sert ce data warehouse ? Son nom est souvent évoqué par les professionnels du webmarketing mais peu savent réellement à quoi sert BigQuery et surtout quelle est son utilité dans la prise de décision marketing.
Le but de cet article, c’est de vous éclairer sur ces points.
Qu’est-ce que Google BigQuery ? Définition
Google BigQuery est un entrepôt de données (Data Warehouse) basé dans le cloud, intégré à la plateforme Google Cloud. Il fait partie d'un écosystème plus large comprenant Google Cloud Storage pour les data lake (une méthode de stockage de données massives) et divers services de déploiement d’applications comme Google App Engine, Google Cloud Run et Google Cloud Functions. Pour faire simple : BigQuery permet de stocker et d'exploiter de vastes quantités de données de manière efficace.
L'une des fonctionnalités majeures (pour les webmarketeurs) de BigQuery est la possibilité d'ingérer des données brutes provenant de Google Analytics 4 (GA4) pour un coût très faible (voir nul selon votre volume de données), facilitant ainsi leur exploitation pour la visualisation de données avec des outils comme Google Looker Studio.
À qui s’adresse Google BigQuery ?
Google BigQuery est utilisé par les professionnels qui travaillent autour de la gestion et de l’analyse des données. L’outil propose des fonctionnalités adaptées à chaque corps de métier :
- Web analystes & analytics engineers : L’analyse des données dans BigQuery s’effectue en exécutant des requêtes SQL puis en exportant les résultats vers Google Sheet ou un outil de data visualisation tel que Looker Studio. L’utilisation en web analyse est particulièrement intéressante pour approfondir le traitement des données. On peut par exemple croiser des données de plusieurs sources ou aller plus loin dans l’analyse des données de GA4 (vous aussi vous vous sentez limité par l’interface ?)
- Data scientists : Les analyses prédictives sont possibles dans BigQuery par l’implémentation de modèles directement dans le datawarehouse.
- Équipes marketing : L’entrepôt de données est utilisé pour analyser les comportements d'achat, optimiser les campagnes de marketing et améliorer l'expérience utilisateur.
Les (multiples) intérêts d’utiliser BigQuery
Assurer une bonne gestion de la donnée
Au-delà du simple stockage et de l'analyse, Google BigQuery propose de nombreuses fonctionnalités avancées pour une administration optimisée des données :
- Centralisation : BigQuery centralise les données et les ressources de calcul, simplifiant ainsi leur gestion et permettant une meilleure organisation des flux de travail.
- Automatisation des tâches : Le data warehouse de Google peut exécuter automatiquement diverses actions telles que le chargement, l'exportation, l'interrogation ou la copie de données. Cela permet de gagner du temps et d'assurer une gestion fluide et efficace des données sans intervention manuelle constante.
Aller plus loin dans l’analyse qu’avec une simple utilisation de Looker Studio
BigQuery va permettre d’aller plus loin que Google Looker Studio en matière d'analyse avancée des données. Bien que Looker Studio soit un excellent outil pour la visualisation des données, il présente des limitations dans certains cas.
Les limites de Looker Studio se manifestent surtout lorsqu'il s'agit de calculs complexes ou de croisement de données. BigQuery, en revanche, permet de surmonter ces restrictions en offrant une plus grande flexibilité et puissance de traitement. Grâce à un identifiant commun, BigQuery permet de lier les données du back-office avec les données analytiques, facilitant ainsi le croisement de données souvent difficilement exploitables directement dans GA4 .
Un exemple concret dans le contexte de Google Analytics 4 : il est possible de “sessionnaliser” ou de "useriser" (via l’user ID) les données, c'est-à-dire d'associer des actions à des utilisateurs spécifiques ou à des sessions.
Dans Looker Studio, cette tâche est complexe parce que l’outil de data visualisation ne possède pas d'ID utilisateur et d'ID session. Avec BigQuery, il devient possible de manipuler ces identifiants pour reproduire des schémas de conversion détaillés et précis, quelque chose de particulièrement complexe voire impossible à réaliser directement dans Looker Studio.
Réinjecter de la donnée
BigQuery ne se limite pas seulement à l'analyse des données, il permet également la réinjection de données. Là encore, un exemple permettra de comprendre plus concrètement ce qu’est la réinjection de données. Imaginez que vous gérez un hôtel ou une entreprise qui cherche à générer des prospects sur son site web. Dans votre outil de webanalyse, vous avez des données sur vos utilisateurs, mais vous disposez également de données offline dans une autre base de données.
En croisant ces deux sources de données, vous pouvez obtenir une vue analytique complète. Vous pourrez alors identifier les sources d'acquisition en ligne qui se traduisent par des conversions offline. Grâce à des identifiants communs tels que l'ID utilisateur ou des identifiants d'application, vous pouvez recouper les données comportementales des utilisateurs en ligne avec leurs actions offline.
L'intérêt de cette approche est double. D'une part, vous pouvez explorer et analyser les données offline pour comprendre leur impact sur vos campagnes en ligne. Par exemple, vous pouvez stocker des identifiants tels que le GCLID (Google Click ID) et utiliser ces données pour enrichir vos analyses. D'autre part, vous pouvez réinjecter ces données offline dans Google Ads, un processus appelé ETL inversé (Extract, Transform, Load).
Cette réinjection de données permet de fournir à Google Ads des informations supplémentaires sur les conversions qui se produisent offline, telles que les devis signés suite à un lead généré en ligne. Enrichir vos algorithmes publicitaires avec ces données permet d'optimiser vos campagnes en ciblant plus précisément les utilisateurs ayant un potentiel de conversion élevé. Vous améliorez ainsi l'efficacité globale de vos efforts marketing.
Comment fonctionne Google BigQuery ?
BigQuery utilise un dialecte SQL dédié, appelé GoogleSQL. Ce dialecte ajoute certaines fonctions analytiques et de transformation utiles. Cependant, il est compatible avec le SQL standard: ainsi, une grande majorité du code écrit en SQL standard est supporté dans BigQuery.
(Pour rappel SQL (Structured Query Language) est un langage de programmation standard utilisé pour gérer et manipuler des bases de données relationnelles.)
Un entrepôt de données gratuit, vraiment ?
Bien que Google BigQuery offre la possibilité d'exporter des données gratuitement, et que le connecteur GA4 lui-même soit sans frais, il existe en réalité des coûts associés à l'utilisation du datawarehouse. Les frais liés aux requêtes et au stockage des données peuvent parfois être élevés en fonction de la manière dont vous les exploitez. Retrouvez ci-dessous ce qui est gratuit… et ce qui l’est pas :
- Exportation des données depuis GA4 : GRATUIT. Vous pouvez facilement exporter vos données sans frais supplémentaires.
- Exécution des requêtes : PAYANT. L'exécution des requêtes dans BigQuery est facturée en fonction du volume de données traitées. Plus vos requêtes sont complexes et volumineuses, plus les coûts vont logiquement augmenter. Cependant il est possible d’avoir un coût quasi nul en optimisant les requêtes. Sachez que vous disposez d’un 1TB de requêtes gratuites par mois.
- Stockage : PAYANT. Le stockage des données dans BigQuery est également tarifé. Le coût dépend de la quantité de données que vous conservez et de la durée de stockage. En exportant uniquement des données GA4, il est fort probable que cela ne vous coûte rien ou au pire quelques centimes.
Vous retrouverez l’ensemble des tarifications liées à Google BigQuery sur leur page d’information dédiée.