Qu’est-ce que l’analyse de cohortes ?

Si vous consultez régulièrement vos statistiques web, vous connaissez probablement vos chiffres globaux : nombre de visiteurs, taux de rebond, pages vues. Mais ces métriques agrégées masquent une réalité essentielle : tous vos visiteurs ne se comportent pas de la même manière selon le moment où ils découvrent votre site.

L’analyse de cohortes résout ce problème. Elle consiste à regrouper vos utilisateurs en cohortes — des groupes définis par un événement commun survenu à une date précise — puis à suivre leur comportement dans le temps.

Concrètement, une cohorte peut être :

  • Les visiteurs qui ont découvert votre site la semaine du 3 mars
  • Les clients qui ont passé leur première commande en janvier
  • Les utilisateurs qui se sont inscrits à votre newsletter un mois donné

L’objectif est simple : mesurer si ces groupes reviennent, achètent à nouveau, ou disparaissent. C’est la base de toute stratégie de rétention sérieuse.

Pourquoi la rétention est plus importante que l’acquisition

Le réflexe de la plupart des entreprises est de concentrer leurs efforts (et leur budget) sur l’acquisition de nouveaux visiteurs. C’est compréhensible, mais c’est souvent une erreur stratégique.

Voici quelques chiffres qui remettent les choses en perspective :

  • Acquérir un nouveau client coûte 5 à 7 fois plus cher que de fidéliser un client existant (source : Harvard Business Review)
  • Une augmentation de 5 % du taux de rétention peut accroître les profits de 25 à 95 % (source : Bain & Company)
  • En moyenne, un site e-commerce perd 70 à 80 % de ses nouveaux visiteurs dès la deuxième semaine

Sans analyse de cohortes, ces pertes restent invisibles. Vos courbes de trafic global peuvent même monter alors que votre capacité à retenir les visiteurs s’effondre. L’analyse de cohortes agit comme un révélateur : elle montre ce qui se passe après la première visite.

Comment fonctionne concrètement une analyse de cohortes

Le principe de base

Le mécanisme est le suivant :

  1. Définir l’événement d’entrée : la première visite, la première commande, l’inscription…
  2. Regrouper les utilisateurs par période : semaine, mois, trimestre
  3. Suivre une métrique dans le temps : taux de retour, transactions, pages vues…
  4. Comparer les cohortes entre elles pour identifier des tendances

Un exemple concret avec un tableau de rétention

Imaginons un site e-commerce qui suit le taux de retour hebdomadaire de ses visiteurs sur 5 semaines. Voici à quoi ressemble un tableau de cohortes typique :

Cohorte (semaine d’acquisition)Semaine 0Semaine 1Semaine 2Semaine 3Semaine 4
1er – 7 janvier100 %38 %22 %15 %12 %
8 – 14 janvier100 %42 %25 %18 %14 %
15 – 21 janvier100 %35 %19 %13 %10 %
22 – 28 janvier100 %44 %28 %21 %17 %
29 janv. – 4 fév.100 %40 %24 %16 %13 %

Que nous apprend ce tableau ?

  • La cohorte du 22-28 janvier retient significativement mieux ses visiteurs que les autres (17 % en semaine 4 contre 10-13 % pour les autres)
  • La cohorte du 15-21 janvier montre les plus mauvais résultats

La question suivante est naturelle : qu’est-ce qui s’est passé la semaine du 22 janvier ? Une campagne emailing ciblée ? Un changement de landing page ? Une promotion ? C’est précisément ce type d’investigation que l’analyse de cohortes rend possible.

Mettre en place l’analyse de cohortes : outils et méthodes

Google Analytics 4 (GA4)

GA4 propose un rapport de cohortes natif accessible depuis Explorer > Exploration de cohortes. Vous pouvez y configurer :

  • Le critère d’inclusion : première visite, première transaction…
  • Le critère de retour : n’importe quel événement, un événement spécifique…
  • La granularité : jour, semaine, mois
  • La métrique : taux de rétention, nombre d’utilisateurs, revenus…

La limite principale de GA4 est la personnalisation restreinte. Pour des analyses plus fines, il faut souvent exporter les données.

SQL sur une base de données analytique

Pour les sites à fort trafic ou les équipes data, l’analyse de cohortes en SQL offre une flexibilité totale. Voici un exemple de requête pour calculer la rétention hebdomadaire :

WITH user_cohort AS (
  SELECT
    user_id,
    DATE_TRUNC('week', MIN(event_date)) AS cohort_week
  FROM events
  WHERE event_name = 'page_view'
  GROUP BY user_id
),
user_activity AS (
  SELECT
    e.user_id,
    uc.cohort_week,
    DATE_TRUNC('week', e.event_date) AS activity_week
  FROM events e
  JOIN user_cohort uc ON e.user_id = uc.user_id
)
SELECT
  cohort_week,
  EXTRACT(WEEK FROM activity_week) - EXTRACT(WEEK FROM cohort_week) AS week_number,
  COUNT(DISTINCT user_id) AS active_users,
  ROUND(
    COUNT(DISTINCT user_id) * 100.0 /
    FIRST_VALUE(COUNT(DISTINCT user_id)) OVER (
      PARTITION BY cohort_week ORDER BY activity_week
    ), 1
  ) AS retention_rate
FROM user_activity
GROUP BY cohort_week, activity_week
ORDER BY cohort_week, week_number;

Cette requête, adaptable à BigQuery, PostgreSQL ou Redshift, produit exactement le type de tableau présenté plus haut. Chez Lueur Externe, nous accompagnons nos clients dans la mise en place de ce type de pipelines analytiques, en connectant GA4, BigQuery et des outils de visualisation comme Looker Studio.

Autres outils complémentaires

  • Mixpanel : excellent pour l’analyse de cohortes sur les applications web et mobiles, avec une interface visuelle très intuitive
  • Amplitude : particulièrement puissant pour croiser cohortes et parcours utilisateur
  • Matomo : alternative open source à Google Analytics, avec un plugin de cohortes disponible
  • Looker Studio (ex Data Studio) : pour créer des dashboards de rétention personnalisés à partir de données BigQuery

Les 5 analyses de cohortes les plus révélatrices

1. Rétention par canal d’acquisition

Segmentez vos cohortes non seulement par date, mais aussi par source de trafic. Vous découvrirez souvent que :

  • Le trafic organique (SEO) retient 2 à 3 fois mieux que le trafic payant
  • Les visiteurs provenant de newsletters ont un taux de rétention supérieur de 40 à 60 % par rapport aux réseaux sociaux
  • Le trafic direct (visiteurs qui tapent votre URL) est logiquement le plus fidèle

Ces insights permettent de réallouer intelligemment votre budget marketing.

2. Rétention avant/après une refonte

Vous avez refondu votre site, changé votre tunnel de conversion ou modifié votre page d’accueil ? Comparez les cohortes “avant” et “après” pour mesurer l’impact réel sur la fidélisation, pas seulement sur le trafic immédiat.

3. Rétention par type d’appareil

Les visiteurs mobiles et desktop n’ont pas les mêmes patterns de retour. En 2024, les données montrent que :

  • Le taux de rétention à 30 jours sur desktop est en moyenne 1,5 fois supérieur à celui sur mobile
  • Les utilisateurs de tablettes se situent entre les deux

Si votre rétention mobile est catastrophique, c’est peut-être un signal d’alerte sur votre expérience utilisateur responsive.

4. Rétention par première action réalisée

Regroupez les utilisateurs selon ce qu’ils ont fait lors de leur première visite :

  • Ceux qui ont consulté plus de 3 pages
  • Ceux qui ont ajouté un produit au panier
  • Ceux qui ont créé un compte
  • Ceux qui ont utilisé la recherche interne

Vous identifierez les actions d’activation qui prédisent la fidélisation. C’est le fameux concept du “Aha moment” popularisé par les équipes Growth.

5. Rétention par valeur de première commande

Pour les sites e-commerce, segmenter les cohortes par montant du premier panier est extrêmement instructif. Un client dont la première commande dépasse 80 € revient-il plus souvent qu’un client à 20 € ? La réponse est presque toujours oui, mais les proportions varient et méritent d’être quantifiées.

Interpréter correctement les résultats

L’analyse de cohortes est puissante, mais elle comporte des pièges. Voici les erreurs les plus fréquentes.

Ne pas confondre corrélation et causalité

Si la cohorte du 22 janvier retient mieux, cela ne signifie pas automatiquement que votre campagne de cette semaine-là en est la cause. Il peut y avoir des facteurs externes : météo, actualité, saisonnalité. Croisez toujours avec d’autres données.

Attention aux volumes insuffisants

Une cohorte de 15 utilisateurs qui affiche 40 % de rétention n’est pas statistiquement fiable. Visez un minimum de 100 à 200 utilisateurs par cohorte pour tirer des conclusions solides. Si votre trafic est faible, passez à une granularité mensuelle plutôt qu’hebdomadaire.

Tenir compte de la saisonnalité

Un site de vente de maillots de bain aura naturellement des cohortes estivales plus actives. Ne comparez pas la cohorte de juillet à celle de décembre sans prendre en compte ce contexte.

Observer la courbe de stabilisation

Dans la plupart des cas, la rétention chute fortement les premières semaines puis se stabilise autour d’un plancher. Ce plancher représente votre “noyau dur” de visiteurs fidèles. L’objectif est double :

  • Réduire la chute initiale (améliorer l’onboarding, l’expérience de première visite)
  • Augmenter le plancher (programmes de fidélité, contenus récurrents, emails de relance)

Passer de l’analyse à l’action : stratégies concrètes

Identifier un problème de rétention ne suffit pas. Voici les leviers les plus efficaces pour améliorer vos chiffres.

Optimiser l’expérience de première visite

  • Réduire le temps de chargement sous les 2,5 secondes (Core Web Vitals)
  • Proposer un contenu ou une offre immédiatement pertinente
  • Simplifier la navigation mobile
  • Afficher clairement votre proposition de valeur

Mettre en place des mécanismes de retour

  • Email marketing : séquences de bienvenue, relance panier abandonné, newsletter à valeur ajoutée
  • Notifications push : pour les sites qui s’y prêtent (médias, e-commerce)
  • Retargeting intelligent : cibler les cohortes qui montrent un début d’engagement
  • Contenus récurrents : blog, guides, actualités sectorielles

Personnaliser l’expérience

Les sites qui affichent un contenu personnalisé basé sur le comportement passé voient leur taux de rétention augmenter de 20 à 35 %. Cela passe par :

  • Des recommandations produits basées sur l’historique de navigation
  • Des pages d’accueil dynamiques selon le segment utilisateur
  • Des offres ciblées en fonction de la cohorte d’appartenance

Cas pratique : l’impact d’une stratégie de rétention pilotée par cohortes

Prenons l’exemple d’un site e-commerce spécialisé en cosmétiques naturelles, un profil de client que l’équipe Lueur Externe accompagne régulièrement.

Situation initiale :

  • 12 000 nouveaux visiteurs par mois
  • Taux de rétention à 4 semaines : 8 %
  • Taux de réachat à 3 mois : 11 %

Actions mises en place après analyse de cohortes :

  1. Identification que les visiteurs arrivant par le blog (SEO) avaient un taux de rétention de 14 % contre 5 % pour les réseaux sociaux → réallocation de 30 % du budget social vers le contenu SEO
  2. Découverte que les clients dont la première commande incluait un échantillon gratuit revenaient 2,3 fois plus → systématisation des échantillons pour les primo-acheteurs
  3. Constat que la rétention mobile chutait de 40 % par rapport au desktop → refonte complète du parcours mobile sous Prestashop

Résultats à 6 mois :

  • Taux de rétention à 4 semaines : 15 % (+87 %)
  • Taux de réachat à 3 mois : 19 % (+73 %)
  • Coût d’acquisition client (CAC) en baisse de 22 %

Ce type de transformation est directement lié à la qualité de l’analyse initiale et à la capacité de traduire les données en actions concrètes.

Automatiser le suivi de vos cohortes

Pour que l’analyse de cohortes devienne un outil de pilotage permanent (et non un exercice ponctuel), l’automatisation est indispensable.

Voici une architecture recommandée :

  1. Collecte : GA4 + événements personnalisés via Google Tag Manager
  2. Stockage : export automatique vers BigQuery (gratuit avec GA4)
  3. Transformation : requêtes SQL planifiées (scheduled queries BigQuery)
  4. Visualisation : dashboard Looker Studio avec mise à jour automatique
  5. Alerting : notifications si le taux de rétention d’une cohorte passe sous un seuil défini

Cette stack est entièrement basée sur l’écosystème Google et reste économique même pour des PME. Lueur Externe, certifiée AWS Solutions Architect et experte en solutions data, déploie ce type d’infrastructure pour ses clients en s’adaptant à leur volume de données et à leurs objectifs métier.

Conclusion : faites de la rétention votre avantage concurrentiel

L’analyse de cohortes n’est pas un gadget réservé aux data scientists. C’est un outil stratégique accessible qui transforme votre compréhension du comportement utilisateur. En segmentant vos visiteurs par date d’acquisition et en suivant leur engagement dans le temps, vous passez d’une vision floue du trafic à une lecture précise de la valeur réelle de votre audience.

Les sites qui maîtrisent leur rétention surpassent systématiquement ceux qui ne misent que sur l’acquisition. Et dans un contexte où les coûts publicitaires ne cessent d’augmenter, c’est un avantage concurrentiel décisif.

Vous souhaitez mettre en place une analyse de cohortes sur votre site, identifier vos points de fuite et construire une stratégie de rétention performante ? L’équipe de Lueur Externe vous accompagne — de l’audit analytique initial jusqu’au déploiement des dashboards automatisés. Contactez-nous pour en discuter.