A propos du dépassement des dimensions et des limites de cardinalité

En bref : comprendre pourquoi certaines dimensions de données agrégées s'affichent comme dépassées, et savoir comment respecter les limites de cardinalité. 

Qu’est-ce qui fait qu’une dimension est dépassée ?

AppsFlyer récupère vos données d'installation et d'événement et les agrège. Les données sont agrégées à l'aide des valeurs uniques en lien avec une dimension donnée. Le nombre de valeurs uniques dans une dimension est appelé cardinalité. La plupart des outils d'analyse et de reporting agrégés possède une limite de cardinalité par dimension. Lorsque le nombre de valeurs uniques dans une dimension dépasse la limite de cardinalité fixée, les données excédantes sont rassemblées dans un groupe dépassement. Et lorsque le nombre de valeurs uniques dans la dimension d’une source de média dépasse la limite de cardinalité, les données restantes de la source de média ainsi que toutes les dimensions basées sur les sources média restantes sont rassemblées dans des groupes dépassement.

Les exemples suivants détaillent le principe de cardinalité, et vous expliquent comment elle se répercute dans vos rapports. 

 Exemple

Exemple A : limite de cardinalité de l'ID de campagne

La limite de cardinalité de l'ID de campagne est fixée à 3000. Si le nombre d'ID de campagne rapportés un jour donné dépasse 3000, tous les ID de campagne restants sont regroupés dans le champ Exceeded_CampaignID_Limit. 

Exemple B : Limite de cardinalité des événements

  • Supposons que la limite de cardinalité des événements est fixée à 3.
  • Durant un jour donné, 7 événements uniques sont rapportés : A, B, C, D, E, F et G. En d'autres termes : la cardinalité des événements est 7.
  • Dans les rapports agrégés, les événements A, B et C sont affichés séparément. Les événements D, E, F et G sont regroupés dans le champ Exceeded_Events_Limit.

Le dépassement des limites des dimensions et de la cardinalité affecte les données agrégées de la manière suivante :

  • Tableau de bord général
  • Exportation des données agrégées et rapports d’API Pull
  • Rapports d’API principale
  • Données sur les clics et les impressions dans les tableaux de bord d'activité et personnalisés
  • Tableau de bord Protect360

Les données brutes ne sont pas concernées par les limites de cardinalité.

Si une grande partie de vos données est réunie dans des groupes dépassés, ces données ne sont pas ventilées. Cela peut donner des résultats incorrects dans les rapports d'analyse. Si besoin est, utilisez les données brutes pour créer des regroupements sans limite de cardinalité. 

Le tableau ci-dessous détaille les limites de cardinalité par jour et par application. 

Dimension Nom du groupe de dépassement Type de limite par... Limite de cardinalité par jour  Cardinalité pour Protect360 par jour
Publicité Exceeded_Ad_Limit Source média 1000 -
ID publicitaire Exceeded_AdID_Limit Source média 1000 -
Adset Exceeded_AdSet_Limit Source média 1000 -
ID d’adset Exceeded_AdSetID_Limit Source média 1000 -
Campagne Exceeded_Campaign_Limit Source média 3000
  • Installations/événements in-app : 3000
  • Impressions/clics : 100 
ID de campagne Exceeded_CampaignID_Limit Source média 3000
  • Installations/événements in-app : 3000
  • Impressions/clics : 100 
Canal Exceeded_Channels_Limit Source média 20 20
ID de site Exceeded_SiteID_Limit Source média 1000
  • Installations/événements in-app : 1000
  • Impressions/clics : 100 
Événements Exceeded_Events_Limit App  300 Installations/événements in-app : 300
Mots-clés Exceeded_Keywords_Limit Source média 1000 -
Noms des sources média* Exceeded_MediaSource_Limit App 1000
  • Installations/événements in-app : 1000
  • Impressions/clics : 100 
* Si le nombre de valeurs uniques dans la dimension de la source média dépasse la limite de cardinalité, les données restantes de la source média, ainsi que toutes les dimensions basées sur les sources média restantes, sont rassemblées dans des groupes dépassement.

Limites de cardinalité par dimension 

Exceeded_AdSet_Limit et Exceeded_Ad_Limit

  • Jusqu'à 1000 noms d'adset uniques et 1000 noms de publicité uniques par source média sont possibles. 
    • Un jour donné, les informations pour les adsets au-delà du 1001ième sont regroupées dans la source Exceeded_AdSet_Limit. Il en va de même pour la source Exceeded_Ad_Limit.

Astuce

«Diviser pour mieux régner» comme on dit. Définissez un petit nombre de noms d'adset généraux (idéalement jusqu'à 50) et associez tous les noms d'adset précédents à des publicités uniques. Vous pouvez également utiliser les paramètres af_sub dans les liens d'attribution AppsFlyer. Vous pourrez ainsi :
1. Eviter de voir s’afficher Exceeded_AdSet_Limit ou Exceeded_Ad_Limit.
2. Optimiser en fonction des adsets et du trafic publicitaire.
3. Effectuer des analyses approfondies basées sur les adsets et les noms d’adset dans les données brutes.

Exceeded_AdSetID_Limit et Exceeded_AdID_Limit

  • Il est possible d'utiliser jusqu'à 1 000 ID uniques d’adset et 1 000 ID publicitaires par source média.
    • Un jour donné, les informations pour les ID d’adsets au-delà de 1001 sont regroupées dans la source Exceeded_AdSetID_Limit. Il en va de même pour la source Exceeded_AdID_Limit.

Exceeded_Campaign_Limit

  • Jusqu'à 3000 noms de campagne uniques par jour sont possibles.
    • Un jour donné, les informations des campagnes au delà de la 3001ième sont regroupées dans la source Exceeded_Campaign_Limit.

Astuce

Définissez un petit nombre de noms de campagne généraux (idéalement jusqu'à 300), et associez tous les noms de campagne précédents à des adsets. Dans les liens d'attribution AppsFlyer, le paramètre est af_adset. Vous pourrez ainsi :
1. Eviter de voir s’afficher Exceeded_Campaign_Limit.
2. Optimiser en fonction du trafic des adsets.
3. Effectuer des analyses approfondies basées sur les campagnes et les noms d’adset dans les données brutes.

Exceeded_CampaignID_Limit

  • Jusqu'à 3 000 ID de campagne uniques par jour sont possibles.
    • Au cours d'une même journée, toutes les informations de campagne au delà du 3001ième ID de campagne sont attribuées à la source Exceeded_CampaignID_Limit.

Exceeded_Channels_Limit

  • Jusqu'à 20 noms de canal uniques par jour et par source média sont possibles. Pour Protect360, la limite est fixée à 1000.
    • Pour un jour donné, toutes les informations de canal au delà du 21ième canal sont attribuées à la source Exceeded_Channel_Limit.

Exceeded_Events_Limit

  • Jusqu'à 300 noms d'événements uniques par jour sont possibles.
    • Pour un jour donné, toutes les informations d’événements au delà du 301ième événement sont attribuées au nom d'événement Exceeded_Events_Limit.

Astuce

Pour ne plus voir s’afficher Exceeded_Events_Limit, vous pouvez utiliser :

  • Événements in-app riches : Plutôt que de rapporter des centaines d'événements différents, mieux vaut fixer un petit nombre de noms d'événements généraux (idéalement jusqu'à 20). Utilisez des valeurs d'événement dynamiques pour différencier ces événements. Vous pourrez ainsi optimiser selon les paramètres de valeur, et obtenir une analyse basée sur les valeurs des événements (disponibles dans le rapport de données brutes des événements in-app).
  • Règles de validation pour retirer les événements in-app inutiles de la plateforme AppsFlyer.

Exemple

Votre application com.greatapp envoie un événement d'achat in-app pour chaque couleur de chaussettes vendue, par exemple, acheter_chaussettes_rouges, acheter_chaussettes_bleues, acheter_chaussettes_blanches, etc. Pour éviter cette profusion d'événements différents, vous pouvez les réduire à un seul événement, acheter_chaussettes, et insérez la couleur comme un paramètre de l'événement.

Exceeded_Keywords_Limit

  • Jusqu'à 1000 mots-clés uniques par jour et par source média sont possibles.
    • Un jour donné, les informations sur les mots-clés au-delà du 1001ième sont regroupées dans la source Exceeded_Keywords_Limit.

Exceeded_MediaSource_Limit

  • Jusqu'à 1000 noms de sources média uniques par jour sont possibles.
    • Un jour donné, les informations sur les campagnes au delà du 1001ième nom de source média sont regroupées dans la source Exceeded_MediasSource_Limit.

Exceeded_SiteID_Limit

  • Jusqu'à 1000 ID de site uniques par jour et par source média sont possibles.
    • Un jour donné, les informations sur les ID de site au delà du 1001ième ID par source média, sont regroupées dans un seul ID de site Exceeded_SiteID_Limit. Si l'ID de site Exceeded_SiteID_Limit s’affiche, c’est qu'il y a trop d'ID de site utilisés par la source média en question, tenter d'optimiser le trafic de la source en fonction des ID de site sera donc beaucoup moins précis et efficace.

Astuce

«Diviser pour mieux régner». Au lieu d'utiliser des milliers d'ID de site par source média, ce qui risque de fausser vos données agrégées, utilisez un second paramètre af_sub_siteid dans vos liens d'attribution. Fixez un petit nombre d'ID de sites généraux (idéalement jusqu'à 50), puis attribuez-leur tous les ID de sites précédents en tant qu’ID de sous-sites. Vous pourrez ainsi :
1. Eviter de voir s’afficher Exceeded_SiteID_Limit.
2. Optimiser correctement en fonction du trafic des ID de site.
3. Effectuer des analyses approfondies basées sur les ID de site et les ID de sous-site dans les données brutes.

Remarque

Dans le rapport de rétention, vous ne voyez pas s’afficher Exceeded_SiteID_Limit, mais tous les ID de site ne sont pas listés. Les ID de sites sont affichés de manière aléatoire, mais l'interface utilisateur choisit d’afficher l’ensemble des sites (ceux qui dépassent la limite). Pour éviter ce problème, récupérez les données de rétention depuis l'API principale.

Comment éviter le dépassement des sources ?

Une solution à long terme

La plupart des annonceurs ne rencontrent pas de dépassement de source, car ils définissent rarement 3000 campagnes manuellement.

Si vous avez des dépassements de source, c'est probablement parce qu'une ou plusieurs sources média utilisent des valeurs dynamiques dans les noms de campagnes, ID de site, adsets ou publicités. Les événements dynamiques in-app dans le code de l'app peuvent provoquer l'apparition de données Exceeded_Events_Limit.

Astuce

N'utilisez que des valeurs statiques pour les noms des événements in-app, campagnes, ID de site, adsets et publicités afin d'éviter le dépassement de vos sources.

Veuillez également suivre nos conseils ci-dessus pour éviter le dépassement de source.

Une solution à court terme

Mettre en place une solution à long terme peut prendre de quelques jours à quelques semaines.

Mais qu'en est-il si vous souhaitez consulter vos données sans attendre ?

Comme nous l’avons vu, un dépassement de source se produit lorsque AppsFlyer reçoit un nombre de clics (ou d’événements) N+1 au cours d'une même journée. Il est possible que les sources média que vous utilisez le plus arrivent plus tard dans la journée et soient mêlées aux données d’un dépassement de source. Voici une astuce pour minimiser l'effet de tout dépassement de source :

Astuce

Oubliez le jour en cours et ne tenez compte que des données de la veille et l’avant-veille. Chaque jour, un processus d'agrégation recalcule les données du jour précédent et, rétrospectivement, n'attribue que les sources les plus faibles (pas les plus récentes) à tout dépassement de source. Cela permet de réduire au minimum les problèmes causés par un débordement de clics !