Interprétation de votre graphique Compass

  • Mise à jour

Cet article vous aidera à :

  • lire et interpréter un graphique Compass ;
  • comprendre la notion de corrélation et pourquoi Compass l’utilise.

Le graphique Compass d’Amplitude indique la corrélation entre le fait qu’un nouvel utilisateur déclenche un événement et la rétention de cet utilisateur. Comprendre quels événements utilisateur conduisent à la rétention est essentiel pour être en mesure de stimuler une croissance pérenne pour votre produit.

Avant de commencer

N’oubliez pas de consulter notre article sur la création d’un graphique Compass avant de vous lancer dans la lecture de cet article. Sinon, vous aurez des difficultés à comprendre les aspects auxquels nous faisons référence ici.

Comment lire votre graphique Compass

Lorsque vous lancez un graphique Compass pour la première fois, vous avez peut-être une hypothèse précise sur la nature des événements susceptibles de favoriser la rétention. Toutefois, si cela n’est pas le cas, Compass peut tout de même vous aider à en formuler une.

Dans l’article précédent, vous avez vu que Compass génère une carte thermique des événements utilisateur et des corrélations par défaut lorsque Any Event est sélectionné dans le module de gauche.

compass_1.png

Il s’agit d’une brève synthèse des événements les plus corrélés avec les membres d’une cohorte de base d’utilisateurs convertis en cohorte cible. C’est là un excellent point de départ si vous ne disposez pas encore de beaucoup de données à analyser.

REMARQUE : si vous ne connaissez pas la notion de corrélation, consultez notre explication utile à ce sujet figurant à la fin de cet article.

Vous pouvez trier le tableau par corrélation ascendante ou descendante pour un jour donné en cliquant sur les étiquettes des jours en haut. Si vous cliquez sur une cellule, une fenêtre contextuelle contenant des informations plus précises sur la combinaison événement/jour que vous avez sélectionnée apparaîtra.

 

interpret_compass_1.gif

Ce rapport de synthèse est utile pour examiner vos données depuis une vue d’ensemble, par exemple pour rechercher des événements qui ne figurent pas parmi les premiers, alors que cela devrait être le cas.

Une fois que vous avez choisi un événement sur lequel vous concentrer, Compass remplace la carte thermique par une ventilation plus détaillée.

À titre d’exemple, examinons la corrélation entre le déclenchement de l’événement « AddFriend » dans les sept premiers jours suivant l’arrivée d’un nouvel utilisateur et la rétention sur la deuxième semaine, puis parcourons les différents composants des rapports générés par Compass.

Screen_Shot_2017-04-14_at_5.14.29_PM.png

À gauche, on peut observer les scores de corrélation de cet événement, triés selon la fréquence à laquelle vos utilisateurs l’ont déclenché. Par défaut, le rapport vous montrera la fréquence avec la corrélation la plus élevée. Dans notre cas, vous pouvez voir que les utilisateurs ayant déclenché « AddFriend » au moins deux fois avaient le score de corrélation le plus élevé ; ils étaient donc les plus susceptibles de se retrouver dans la cohorte de rétention de la deuxième semaine.

REMARQUE : il est important de garder à l’esprit que corrélation ne signifie pas causalité. Un score de corrélation élevé peut suggérer une relation causale entre deux événements, mais il peut également signifier que chacun de ces événements est fortement corrélé avec un autre événement qui n’a pas encore été identifié.

Cliquez sur l’une des classes pour afficher une ventilation détaillée de cette combinaison événement/fréquence.

Sur la droite, vous pouvez voir le score de corrélation pour (a) cet événement à cette fréquence particulière et (b) votre cohorte cible. Bien qu’il soit difficile de généraliser, dans certains cas, même des corrélations très faibles (comme 0,2) peuvent être prises en compte lorsque l’on examine un petit nombre de jours initiaux pour chaque utilisateur.

Amplitude classe les scores de corrélation comme suit :

  • Hautement prédictif : corrélation >= 0,4
  • Modérément prédictif : 0,4 > corrélation >= 0,3
  • Légèrement prédictif : 0,3 > corrélation >= 0,2
  • Non prédictif : corrélation <= 0,2

Création d’une cohorte à partir de vos résultats

Revenons à notre exemple ci-dessus, où nous avons examiné les utilisateurs qui ont déclenché l’événement « AddFriend » au moins deux fois au cours des sept premiers jours suivant leur arrivée en tant que nouveaux utilisateurs. Vous pouvez créer une cohorte en cliquant sur Create Cohort. Ensuite, Amplitude comparera automatiquement leur rétention à celle des nouveaux utilisateurs.

interpret_compass_3.png

Si vous cliquez sur Show (à côté de Correlation Table), cela aura pour effet d’afficher un tableau de contingence détaillé qui présente le nombre d’utilisateurs de votre cohorte de base dans chacune des quatre catégories : vrais positifs, faux positifs, faux négatifs et vrais négatifs. 

De même, vous pouvez voir des statistiques détaillées à propos de votre cohorte en cliquant sur Show (à côté de Detailed Statistics) :  

Vous en apprendrez davantage sur ces statistiques ici.

Choix d’une autre métrique

Par défaut, Compass affiche les scores de corrélation, mais vous pouvez sélectionner une métrique différente si elle correspond mieux aux besoins de votre analyse. Il vous suffit de sélectionner la métrique qui vous intéresse dans le menu déroulant Correlation :

interpret_compass_2.png

Voici les métriques à votre disposition :

  • Correlation
  • Correlation with errors
  • Positive predictive value only
  • Negative predictive value only
  • Sensitivity only
  • Specificity only
  • Proportion above threshold only

View statistical significance

Compass vous permet d’activer et de désactiver l’intervalle de confiance à 95 % de la corrélation. Cliquez sur le nombre bleu à droite du tableau pour afficher l’intervalle sur le graphique à barres à gauche.

95Percent_Toggle.png

Présentation de la notion de corrélation

La corrélation est une mesure de la relation entre deux variables statistiques. Ses valeurs possibles vont de -1 à 1 ; un score de zéro indique qu’il n’existe aucune relation statistique entre les variables. Un score de 1 indique une corrélation positive parfaite, tandis qu’un score de -1 indique une corrélation négative parfaite.

Dans un graphique Compass, les deux variables à corréler sont :

  • l’utilisateur a-t-il déclenché l’événement en question au moins un certain nombre de fois ; et
  • l’utilisateur a-t-il été fidélisé dans la cohorte cible ?

Vous avez peut-être entendu parler de différentes approches et définitions de la corrélation. Parmi les exemples bien connus, on peut citer la corrélation de Matthews, la corrélation de Pearson, le coefficient Phi et la valeur R. Dans le cas que nous étudions, toutes ces méthodes différentes génèrent des résultats équivalents, car Compass examine des paires de variables aléatoires binaires.

N’oubliez pas que corrélation ne signifie pas causalité : toutes les hypothèses que vous proposez via une analyse Compass doivent donc systématiquement être testées et vérifiées dans la réalité.

Voici quelques définitions plus techniques de la notion de corrélation :

  1. La corrélation de X et Y est la covariance de X et Y divisée par la moyenne géométrique de leurs variances.
  2. Si X est modélisé par une fonction affine de Y et que Y est modélisé par une fonction affine de X, chacune avec une erreur quadratique moyenne racine minimale, alors la corrélation de X et Y est la moyenne géométrique des coefficients prédictifs de ces deux fonctions.

Pourquoi l’utilisation de la corrélation en tant que métrique est-elle pertinente ici ?

Lorsque vous recherchez la métrique spécifique qui enregistre le moment « Eurêka » de vos utilisateurs, celle-ci doit se caractériser par le fait que la plupart des utilisateurs au-dessus d’un certain seuil finissent par être fidélisés, et que la plupart des utilisateurs en dessous de ce seuil finissent par ne pas l’être. Une telle métrique aurait un seuil avec une bonne valeur prédictive positive (VPP) et une bonne valeur prédictive négative (VPN). Consultez notre article de blog pour obtenir des conseils sur la façon de déterminer quels événements sont source de croissance. 

Toutefois, vous devez également tenir compte de la facilité avec laquelle il sera possible de faire franchir ce seuil aux utilisateurs. Si vous trouvez un seuil avec une VPP et une VPN très fortes, mais que vous vous apercevez qu’il est très difficile de le faire franchir aux utilisateurs, cette métrique ne sera pas d’une grande aide pour faire croître votre base d’utilisateurs. Un bon élément annonciateur de ce phénomène serait que peu de vos utilisateurs ont franchi le seuil ou que presque tous vos utilisateurs l’ont déjà franchi. Ce n’est pas toujours le cas, bien sûr, mais en l’absence d’informations plus précises, il s’agit en général d’une bonne hypothèse.

C’est pourquoi Compass utilise la corrélation pour localiser ces seuils : la corrélation tient compte de la VPP, de la VPN et de la proportion d’utilisateurs au-dessus du seuil. Si la VPP est élevée, que la VPN est élevée ou que la fraction d’utilisateurs au-dessus du seuil est proche de 50 %, la corrélation sera également plus élevée. De même, si la VPP est faible, que la VPN est faible ou que la fraction d’utilisateurs au-dessus du seuil s’éloigne de 50 %, alors la corrélation sera plus faible.

REMARQUE : ce phénomène est un peu moins marqué dans le cas des corrélations négatives, mais vous n’observerez en général pas de corrélations négatives lorsque vous utiliserez Compass.

 

Vidéo explicative