Avec l’essor des intelligences artificielles génératives comme ChatGPT, Gemini ou Perplexity, si vous êtes un professionnel du marketing digital, vous êtes certainement confrontés à une nouvelle réalité : une part (croissante mais encore relativement faible aujourd’hui) du trafic web ne vient plus des moteurs de recherche classiques, mais de réponses générées par ces IA.
Ce bouleversement oblige à repenser les méthodes de suivi de performance, notamment pour comprendre où et comment une marque est mentionnée, et surtout, mesurer l’impact réel de ces canaux sur le business.
Un enjeu simple : mesurer l’impact business
Pourquoi tracker ces données ? Pour une raison simple : comprendre si elles ont un impact business. Fin 2024, ChatGPT représentait déjà 4,33 % du marché de la recherche, contre seulement 1 % en juin de la même année. Cette croissance rapide montre que ces plateformes peuvent générer un trafic qualifié… mais encore difficilement mesurable sans une stratégie adaptée.

La vraie question est donc : quelle est la part de mon trafic qui provient de ces IA ? Ce trafic est-il qualifié ? Génère-t-il des ventes ? Même s’il ne représente qu’une fraction aujourd’hui, ne pas le suivre, c’est passer à côté d’un levier d’acquisition qui fait beaucoup parler en 2025.
Des résultats déjà visibles ?
Les premiers retours d'expérience sur le trafic provenant des LLMs commencent à émerger : certaines marques constatent déjà des ventes (certes très marginales) issues directement de ces IA. Des plateformes comme ChatGPT ou Perplexity génèrent déjà - sur certains prompts - un trafic non négligeable. Cela reste généralement en dessous du pourcent, mais le simple fait qu’un chatbot puisse générer des ventes montre qu’il y a un potentiel réel.
Les différences entre le tracking des données issues des LLMs et celui issu des moteurs de recherche ou des réseaux sociaux
Le tracking des données (client-side ou server-side) traditionnel repose sur des modèles bien établis : suivre les sources de trafic, mesurer les clics, analyser les conversions et attribuer une valeur aux différents canaux (search, social, email, etc.). Ces méthodes s'appuient sur des interactions visibles, traçables, qu’on peut évaluer avec une webanalyse dédiée.
Mais avec l’arrivée des modèles de langage génératifs (LLMs) comme ChatGPT, Gemini ou Perplexity, ces repères ne sont plus les mêmes. Ces IA ne renvoient pas vers une page de résultats classique ni ne génèrent de clics systématiques. Elles produisent directement une réponse intégrant potentiellement une mention de marque, sans lien ou avec un lien indirect (qu’on peut tracker, voir plus bas).
Résultat : la marque peut être citée, mais le chemin entre cette mention et une visite réelle sur le site devient flou, voire invisible pour les outils analytiques classiques si aucun tracking dédié n’est mis en place. On ne parle plus de positions ou de taux de clics, mais de présence conversationnelle et de contexte de citation.
Ainsi, le tracking dans un futur où les recherches seraient majoritairement effectuées par les LLMs (ce que je n’affirme pas ici, comprenez que c’est pour appuyer ma théorie) ne se concentrerait plus sur les canaux en tant que tels, mais sur :
- La capacité à détecter les mentions de la marque dans les réponses générées ;
- L’analyse de l’engagement indirect (trafic généré, durée de session, conversions) ;
- La compréhension des contextes dans lesquels la marque est recommandée ou utilisée.
Ce changement de paradigme impose de nouvelles méthodes de suivi, plus orientées vers la captation de signaux faibles et l’analyse post-clic, plutôt que sur l’attribution directe et linéaire. Néanmoins, l’attribution directe reste possible avec les LLMs, notamment via GA4.
ChatGPT, seule IA sur laquelle on doit tracker les données ?
La réponse est clairement non. ChatGPT, bien que dominant, n’est pas seul. Gemini, l’IA de Google (qui a d’ailleurs fait parler d’elle récemment), Perplexity ou encore Mistral Search (IA française) sont autant de plateformes qui développent des interfaces conversationnelles intégrées à la recherche. Il est donc essentiel d’élargir le spectre de suivi à l’ensemble de ces acteurs.
La bonne nouvelle, c’est que ces IA utilisent activement des liens vers les sources, avec un traçage direct via des UTM. Et c’est ce qu’on va chercher à tracker en priorité aujourd’hui.
Des paramètres de suivi mis en place : les UTMs
Les UTM jouent un rôle clé pour le suivi des données issues de l’IA. ChatGPT, Perplexity ou encore Bing Chat intègrent souvent automatiquement des paramètres UTM dans les liens qu’ils proposent. Cela permet d’identifier l’origine du trafic dans Google Analytics ou tout autre outil de web analytics.
Cependant, attention : ce trafic n’est pas toujours qualifié, et ne garantit pas une conversion. Il faut donc l’analyser dans le temps, en évaluant son évolution, sa qualité, et son potentiel business.
L’importance de tracker dès à présent
Ce qu’on ne tracke pas ne se mesure pas.
Les parts de marché des IA dans la recherche évoluant rapidement, il est indispensable d’anticiper. Si aujourd’hui ce canal représente 0,2 % de votre trafic, mais que dans 6 mois il passe à 1 %, vous devez pouvoir le démontrer et en tirer des enseignements stratégiques.
Le web se transforme profondément. Avec la Google I/O 2025, la question de la pérennité du trafic vers les sites web classiques est posée. Les utilisateurs vont-ils encore consulter les sites dans les années à venir ou se contenteront-ils des réponses générées ? Quelle place l’IA va prendre sur Google ou sur les réseaux sociaux ? Difficile à dire. Quoi qu’il en soit, tracker toutes les données dès aujourd’hui vous aidera dans votre prise de décision.
Mettre en place le tracking des données issues des IA : tutoriel
Pour suivre efficacement le trafic issu des IA, la méthode la plus robuste est aujourd’hui l’usage d’expressions régulières (regex) dans GA4.
Les expressions régulières (regex) offrent une méthode centralisée, rapide et évolutive pour suivre les sources de trafic issues des IA génératives. En une seule règle, elles permettent d’englober l’ensemble des domaines pertinents comme chat.openai.com, perplexity.ai ou gemini.google.com, ce qui permet d’éviter la création fastidieuse de conditions multiples.
Voici les étapes à suivre pour mettre en place le tracking issu des données IA sur GA4 :
Première étape
Sur Google Analytics 4, rendez-vous dans Administration > Affichage des données > Groupes de Canaux > Créer un groupe de canaux > Ajouter un canal > Intégrez un nom pour le canal > Sélectionnez “Source” puis “correspond à l’expression régulière” et intégrez le regex :


Seconde étape
Une fois le regex créé, vous allez pouvoir regarder le trafic et les conversions éventuelles issues des LLMs. Pour cela, sur Google Analytics 4, rendez-vous dans Rapports > Acquisition > Acquisition de trafic. Sélectionnez ensuite le groupe de canaux que vous avez préalablement configuré, par exemple « Search IA ». Cela vous permettra de visualiser les sessions, utilisateurs et conversions spécifiquement attribués à ces sources d’IA.

Ce tracking des données issues de l’IA est-il RGPD compliant ?
La question de la mise en conformité au RGPD (Règlement Général sur la Protection des Données) est centrale dès lors qu’il s’agit de collecter et analyser des données utilisateurs, y compris celles issues de plateformes d’intelligence artificielle comme ChatGPT ou Perplexity. La bonne nouvelle, c’est que le tracking des données provenant de ces sources peut parfaitement respecter le cadre légal, à condition d’appliquer les bonnes pratiques.
Ce que le tracking IA implique réellement :
- Il s’agit uniquement de suivre les comportements à partir du moment où un utilisateur arrive sur votre site, après avoir cliqué sur un lien proposé par une IA.
- Les données collectées sont les mêmes que pour tout autre canal d’acquisition : sources de trafic, pages vues, durée de session, conversions, etc.
- Aucune donnée personnelle n’est récupérée depuis les plateformes IA elles-mêmes.
Pour garantir la conformité RGPD, cela n’aura en réalité pas de lien direct avec le trafic issu de l'intelligence artificielle. Assurez-vous en revanche que :
- Un bandeau de consentement clair est bien présent et respecte les normes CNIL (ou équivalent selon votre pays).
- L’utilisateur peut refuser le suivi tout en continuant à naviguer normalement.
- Votre outil d’analytics est paramétré pour désactiver le suivi utilisateur en cas de refus du consentement.
Le suivi des données issues des IA génératives est un enjeu majeur et nécessite forcément un tracking dédié. Même marginal aujourd’hui, ce trafic est en forte croissance. En le trackant dès maintenant, vous vous garantissez d’avoir un historique complet de l’évolution du trafic et des conversions issues des LLMs pour prendre les bonnes décisions marketing, aujourd’hui et demain.