О превышенных показателях и ограничениях количества элементов

Краткий обзор. Почему некоторые показатели агрегированных данных отображаются как превышенные и как предотвратить достижение пределов количества (кардинального числа). 

Что такое превышенные показатели?

AppsFlyer собирает данные об установках и событиях и агрегирует их. Данные агрегируются с использованием уникальных значений, заполняющих заданный показатель. Количество уникальных значений в показателе называется кардинальным числом, или мощностью множества. Большинство инструментов для аналитики и агрегированных отчетов имеют ограничения кардинальности для каждого показателя. Когда количество уникальных значений в показателе превышает предел кардинальности, оставшиеся данные группируются как превышенные. А когда количество уникальных значений в показателе медиа-источника превышает предел кардинальности, оставшиеся данные медиа-источника, а также все показатели на основе остальных медиа-источников, группируются как превышенные.

В приведенных ниже примерах показана кардинальность и ее влияние на отчеты. 

 Пример

Пример A. Ограничение по количеству идентификаторов кампании

Максимальное количество элементов для идентификатора кампании составляет 3000. Если количество идентификаторов кампаний, зарегистрированных в определенный день, превышает 3000, то все оставшиеся идентификаторы кампаний группируются в Exceeded_CampaignID_Limit. 

Пример B. Ограничение по количеству событий

  • Предположим, что предел количества элементов (кардинальное число) событий равен 3.
  • В один день сообщается о 7 уникальных событиях: A, B, C, D, E, F и G. Другими словами, кардинальное число событий равно 7.
  • В агрегированных отчетах события А, В, С перечисляются отдельно. События D, E, F и G сгруппированы в Exceeded_Events_Limit.

Превышенные показатели и ограничения кардинальности влияют на агрегированные данные следующим образом:

  • Обзорный дэшборд
  • Экспорт агрегированных данных и отчеты Pull API
  • Отчеты Master API
  • Данные о кликах и показах на дэшборде активности и настраиваемом дэшборде
  • Дэшборд Protect360

Ограничения кардинальности не влияют на сырые данные.

Если большая часть ваших данных сгруппирована как превышенные, эти данные не разбиваются. Это может привести к неточным результатам в аналитических отчетах. При необходимости используйте сырые данные для создания группировок без ограничений по количеству элементов. 

В приведенной ниже таблице перечислены ограничения кардинальности в день для каждого приложения. 

Показатель Название группы превышения Тип лимита на... Лимит кардинальности в сутки  Кардинальность для Protect360 в сутки
Реклама Exceeded_Ad_Limit Медиа-источник 1000 -
ID рекламы Exceeded_AdID_Limit Медиа-источник 1000 -
Блок рекламы Exceeded_AdSet_Limit Медиа-источник 1000 -
ID блока рекламы Exceeded_AdSetID_Limit Медиа-источник 1000 -
Кампания Exceeded_Campaign_Limit Медиа-источник 3000
  • Установки и события в приложении: 3000
  • Показы и клики: 100 
ID кампании Exceeded_CampaignID_Limit Медиа-источник 3000
  • Установки и события в приложении: 3000
  • Показы и клики: 100 
Канал Exceeded_Channels_Limit Медиа-источник 20 20
ID сайта Exceeded_SiteID_Limit Медиа-источник 1000
  • Установки и события в приложении: 1000
  • Показы и клики: 100 
События Exceeded_Events_Limit Загрузка  300 Установки и события в приложении: 300
Ключевые слова Exceeded_Keywords_Limit Медиа-источник 1000 -
Названия медиа-источников* Exceeded_MediaSource_Limit Приложение 1000
  • Установки и события в приложении: 1000
  • Показы и клики: 100 
*Если количество уникальных значений в показателе медиа-источника превышает лимит кардинальности (допустимое количество элементов), остальные данные по медиа-источнику, а также все показатели на основе остальных медиа-источников, сгруппированы как превышенные.

Лимиты кардинальности для каждого показателя 

Exceeded_AdSet_Limit и Exceeded_Ad_Limit

  • Доступно до 1000 уникальных названий групп объявлений и 1000 уникальных названий объявлений для каждого медиа-источника. 
    • В определенный день информация о группе объявлений от 1001-й группы объявлений и выше группируется как Exceeded_AdSet_Limit. То же самое относится и к Exceeded_Ad_Limit.

Совет

Принцип «разделяй и властвуй». Определите небольшое количество общих названий групп объявлений (в идеале до 50) и назначьте все предыдущие названия групп объявлений как отдельные объявления. Вы также можете использовать параметры af_sub в ссылках атрибуции AppsFlyer. Это позволяет:
1. Предотвратить появление Exceeded_AdSet_Limit или Exceeded_Ad_Limit.
2. Провести эффективную оптимизацию в соответствии со значительным трафиком от групп объявлений и объявлений.
3. Провести глубокий анализ на основе группы объявлений и названий объявлений в сырых данных.

Exceeded_AdSetID_Limit и Exceeded_AdID_Limit

  • Доступно до 1000 уникальных идентификаторов групп объявлений и 1000 уникальных идентификаторов объявлений для каждого медиа-источника.
    • В определенный день информация об идентификаторе группы объявлений из 1001-й группы объявлений и выше группируется как Exceeded_AdSetID_Limit. То же самое относится и к Exceeded_AdID_Limit.

Exceeded_Campaign_Limit

  • Доступно до 3000 уникальных названий кампаний в день.
    • В определенный день информация от 3001-й кампании и выше группируется как Exceeded_Campaign_Limit.

Совет

Определите небольшое количество общих названий кампаний (в идеале до 300) и назначьте все предыдущие названия кампаний в качестве групп объявлений. В ссылках атрибуции AppsFlyer параметр равен af_adset. Это позволяет:
1. Предотвратить появление Exceeded_Campaign_Limit.
2. Провести эффективную оптимизацию в соответствии со значительным трафиком от групп объявлений.
3. Провести глубокий анализ на основе названий кампаний и групп объявлений в сырых данных.

Exceeded_CampaignID_Limit

  • Доступно до 3000 уникальных идентификаторов кампаний в день.
    • В течение одного дня вся информация о кампании с идентификатором 3001-й кампании и выше атрибутируется как Exceeded_CampaignID_Limit.

Exceeded_Channels_Limit

  • Доступно до 20 уникальных названий каналов в день на один медиа-источник. Для Protect360 ограничение составляет 1000.
    • В определенный день вся информация по каналу с 21-го канала и выше атрибутирована как Exceeded_Channel_Limit.

Exceeded_Events_Limit

  • Доступно до 300 уникальных названий событий в день.
    • В определенный день вся информация о событии от 301-го события и выше атрибутируется как событие под названием Exceeded_Events_Limit.

Совет

Чтобы предотвратить появление Exceeded_Events_Limit, рассмотрите возможность использования:

  • Насыщенные внутренние события. Вместо отчетов по сотням различных событий определите небольшое количество общих названий событий (в идеале до 20). Используйте динамические значения событий, чтобы различать эти события. Это позволяет проводить оптимизацию в соответствии со значимыми параметрами и проводить анализ на основе значений событий, которые доступны через отчет по сырым данным о событиях в приложении.
  • Правила валидации для удаления ненужных внутренних событий приложения с платформы AppsFlyer.

Пример

Ваше приложение com.greatapp отправляет событие покупки для каждого цвета носков, которые оно продает, например, buy_red_socks, buy_blue_socks, buy_white_socks и т. д. Чтобы избежать такого раздувания различных событий, сделайте их все одним событием покупки носков, buy_socks, и вставьте цвет как параметр события.

Exceeded_Keywords_Limit

  • Доступно до 1000 уникальных ключевых слов в день на один медиа-источник.
    • В определенный день информация о 1001-м ключевом слове и выше группируется как Exceeded_Keywords_Limit.

Exceeded_MediaSource_Limit

  • Доступно до 1000 уникальных названий медиа-источников в день.
    • В определенный день информация о кампании от 1001-го названия медиа-источника и выше группируется как Exceeded_MediasSource_Limit.

Exceeded_SiteID_Limit

  • Доступно до 1000 уникальных идентификаторов сайтов в день на один медиа-источник.
    • В течение дня информация об идентификаторе сайта от 1001-го идентификатора сайта и выше для каждого медиа-источника группируется как один идентификатор сайта под названием Exceeded_SiteID_Limit. Поэтому, если вы все-таки видите ID сайта как Exceeded_SiteID_Limit, это означает, что в этом медиа-источнике используется слишком много идентификаторов сайтов, и оптимизация трафика от источника в соответствии с идентификаторами сайтов становится менее точной и менее эффективной.

Совет

Принцип «Разделяй и властвуй». Вместо того чтобы использовать тысячи идентификаторов сайтов для каждого медиа-источника, что искажает агрегированные данные, используйте второй параметр в ссылках атрибуции под названием af_sub_siteid. Определите небольшое количество общих идентификаторов сайтов (в идеале до 50) и назначьте все предыдущие идентификаторы сайтов в качестве идентификаторов дочерних сайтов под этими общими идентификаторами сайтов. Это позволяет:
1. Предотвратить появление Exceeded_SiteID_Limit.
2. Провести эффективную оптимизацию в соответствии со значительным трафиком от идентификаторов сайтов.
3. Выполнить глубокий анализ на основе идентификаторов сайтов и идентификаторов дочерних сайтов в сырых данных

Примечание

В отчете об удержании клиентов вы не увидите Exceeded_SiteID_Limit, но не все идентификаторы сайтов отображаются. Идентификаторы сайтов отображаются случайным образом, но это ограничение пользовательского интерфейса для отображения всех (когда они превысили лимит). Чтобы обойти эту проблему, получите данные об удержании от master API.

Как избежать превышения количества источников?

Долгосрочное решение

Большинство рекламодателей не столкнутся с превышенными источниками, так как они обычно не определяют 3000 кампаний вручную.

Если вы все-таки столкнетесь с превышением, вероятно, это связано с тем, что один или несколько медиа-источников используют динамические значения для названий кампаний, идентификаторов сайтов, групп объявлений или объявлений. Динамические внутренние события приложения в коде приложения могут привести к появлению Exceeded_Events_Limit как источника данных.

Совет

Используйте только статические значения для названий внутренних событий приложения, кампаний, идентификаторов сайтов, групп объявлений и объявлений, чтобы избежать получения превышенных источников.

Также ознакомьтесь с конкретными советами по любому превышенному источнику выше.

Краткосрочное решение

Реализация долгосрочного решения может занять у вас от нескольких дней до нескольких недель.

Но что, если вы хотите посмотреть свои данные прямо сейчас?

Как уже объяснялось, превышенный источник возникает, когда AppsFlyer получает N+1 кликов (или событий) для источника в течение одного дня. Вполне возможно, что наиболее известные медиа-источники, которые вы используете, поступают позже в тот же день и, следовательно, комбинируются с превышенными данными. Вот простой трюк, чтобы свести к минимуму эффект от любого превышенного источника, который вы видите:

Совет

Не смотрите на сегодняшний день, смотрите только на данные от вчера и ранее. Каждый день процесс агрегирования пересчитывает данные за прошлый день и в ретроспективе назначает только самые маленькие (не самые поздние) источники как превышенные. Это гарантирует, что искажения, вызванные переполнением кликов, будут минимальными!