Краткий обзор: Data Locker отправляет данные отчетов в облачное хранилище для загрузки в ваши системы бизнес-аналитики. Вы можете выбрать между различными вариантами: корзина AppsFlyer в AWS или принадлежащее вам хранилище в AWS, GCS, Яндекс, BigQuery и Snowflake. Data Locker поддерживает различные хранилища. Это означает, что вы можете отправлять все данные в несколько хранилищ, разделять данные по хранилищам или сочетать оба варианта.
Data Locker
В Data Locker выберите свои приложения, медиа-источники, события и отчеты, данные которых AppsFlyer должен отправлять в указанные вами облачные хранилища. Затем программно загрузите данные из хранилища в свои системы.
Data Locker: возможности
Функция | Описание |
---|---|
Варианты хранилища (облако) |
Data Locker может отправить ваши данные в любой из следующих облачных сервисов:
В Data Locker можно указать более одного хранилища. Это означает, что вы можете отправлять все или некоторые данные в несколько хранилищ. Примеры
|
Несколько приложений | Отправка данных по одному, нескольким или всем приложениям аккаунта. Когда вы добавляете приложения в аккаунт, они могут включаться автоматически. |
Период доступности | 14 дней |
Разделение данных | Доступные варианты разделения данных (актуально для облачной корзины):
|
Форматы данных |
|
Обновление данных | Частота обновления данных зависит от типа отчета.
|
Отчеты, доступные через Data Locker
Архитектура хранилища данных
Обзор
Структура данных в хранилище зависит от того, в какое хранилище отправляются данные: облачное или локальное. Описанная здесь структура папок относится к облачному хранилищу (корзинам). В случае локального хранилища данных учитывайте, что ссылка на папки относится к просмотрам.
Данные записываются в выбранный вами тип хранилища. Если вам нужно облачное хранилище, тогда это хранилище AppsFlyer в AWS или ваше хранилище в AWS, GCS или Яндекс. Вы можете в любой момент перейти с одного варианта на другой или настроить отправку некоторых или всех данные в несколько хранилищ.
Данные в облачной корзине организованы с помощью иерархической структуры папок по типам отчетов, дате и времени. Ниже представлен пример такой структуры.
Данные конкретного отчета содержатся в папках по часам (h), связанных с этим отчетом:
- Количество часовых папок зависит от частоты обновления данных (раз в час, ежедневно или с контролем версий).
- Данные предоставляются в сжатых файлах Snappy или GZIP, или в виде несжатых файлов в формате Parquet или CSV.
- Файлы с данными состоят из столбцов (полей).
- Структура схемы (поля) отчетов о пути пользователя идентична и зависит от выбранных вами полей. Другие отчеты имеют свои собственные явные поля, так называемые, отчеты без схемы. Доступные отчеты и ссылки на спецификации отчетов см. в отчетах Data Locker для маркетолога.
Структура папок
Папка | Описание |
---|---|
Идентификатор подписки |
Примеры структуры папок в зависимости от владельца корзины и облачного сервиса
|
Тема (t) | Тип отчета связан с предметом отчета. |
Дата (dt) | Это дата, связанная с данными. Для сырых данных это дата, когда произошло событие. Для агрегированных данных это дата создания отчета. |
Время (h или версия) |
Папки дат делятся на почасовые (h) папки или папки версий, в зависимости от типа отчета. Почасовые папкиПапки h содержат данные по времени их поступления в AppsFlyer. Например, события установки, полученные с 14:00 до 15:00 UTC, записываются в папку h=14. Примечание! Между моментом поступления данных в AppsFlyer и записью папки h в Data Locker существует задержка около 1–3 часов. Например, папка h=14 записывается на час позже (в 15:00 UTC). Характеристики почасовых папок:
Папки версийУ некоторых отчетов есть вариант с контролем версий. Это значит, что самые актуальные данные за конкретный день предоставляются несколько раз. Поскольку данные могут продолжить обновляться из-за позднего поступления или уточнения данных, появляется несколько версий одного отчета. При этом последняя версия – самая точная. Отчеты за определенный день содержатся в папке версий за этот день. Каждая версия сохраняется в отдельной папке, имя которой задается по метке Unix-времени, позволяющей однозначно идентифицировать этот отчет. Учитывайте в своих процессах импорта данных, что данные могут быть записаны задним числом. Так, данные могут записываться в папку за 1 января позже, например, 14 января. Если корзина принадлежит вам, рекомендуем настроить в облачном сервисе уведомление, запускающее процесс импорта (AWS | GCS) |
Разделение приложений
Для облачной корзины данные предоставляются в объединенных файлах, включающих данные сразу по всем выбранным приложениям, или с разделением на папки по приложениям. Разделение выполняется в папке h, как описано в следующей таблице.
Тип разделения | Описание |
---|---|
[По умолчанию] Объединенный |
Данные по всем приложениям предоставляются в объединенных файлах. Чтобы определить, к какому приложению относятся те или иные данные, используйте поле app_id. Пример файлов с данными в папке h=2 Формат имени файла данных: unique_id.gz.
|
Разделение по приложениям |
Папка содержит подпапки по приложениям. Файлы с данными по конкретному приложению содержатся в папке этого приложения. На следующем рисунке в папке h=19 есть папки приложений. Папка каждого приложения содержит файлы с данными по нему. Примечание! В файлах данных не указан app_id, его нужно определять по папке. Формат имени файлов в каждой папке приложения: unique_id.gz:
Ограничение: Ограничение: этот параметр недоступен для отчетов по атрибуции People-Based (ориентированная на пользователя). |
Файлы с данными
Файлы данных зависят от типа разделения.
Содержимое | Подробности | |
---|---|---|
Флаг завершения | Флаг последнего файла (завершения) устанавливается, когда записаны все данные для определенной папки h.
|
|
Типы файлов |
|
|
Последовательность столбцов (файл CSV) |
Если используется формат CSV, последовательность полей в отчетах всегда одинакова. При добавлении новых полей, они появляются справа от существующих. В связи с этим:
|
|
Рекомендации по заполнению полей |
Пустые или незаполненные поля: Некоторые поля пусты или имеют значение null. Это говорит об отсутствии данных для предоставления в контексте этого отчета. Как правило, null означает, что соответствующее поле не заполняется в контексте отчета и типа приложения. Пустое значение "" означает, что поле актуально в этом контексте, но данные для его заполнения не найдены. При ограничении по медиа-источнику ограниченные поля будут содержать значение null. В целом пустое и нулевое поле означают одно и то же: нет доступных данных. Часовой пояс и валюта Настройки часового пояса и валюты приложения не влияют на данные, записываемые в Data Locker. Действуют следующие настройки:
Значения с запятыми: Эти запятые содержатся в двойных кавычках `"`, например, |
Варианты хранилища
Внимание!
Если вы используете хранилище, принадлежащее маркетологу:
- Убедитесь, что вы соблюдаете требования законов о защите данных, таких как GDPR, и политики рекламных сетей / SRN в отношении хранения данных.
- Не используйте хранилище, принадлежащее маркетологу, для отправки данных третьим лицам.
- Вы выбираете, кому принадлежит хранилище, в которое будут записываться данные:
- Хранилище AppsFlyer
- Хранилище клиента – AWS, GCS, Azure, Яндекс, BigQuery и Snowflake
- Изменить выбор хранилища можно в любое время.
- Если вы измените хранилище, произойдет следующее:
- Мы начнем записывать данные в новое хранилище в течение часа.
- Мы продолжим записывать данные в прежнее хранилище в течение переходного периода в 7 дней. Время истечения переходного периода отображается в пользовательском интерфейсе. Используйте переходный период, чтобы обновить процессы загрузки данных. При необходимости можно перезапустить переходный период или вновь переключиться на корзину AppsFlyer.
- Изменение хранилища: вы можете перейти с одного варианта на другой, используя опцию с несколькими хранилищами, при которой данные одновременно отправляются в несколько назначений. После завершения перехода и тестирования удалите вариант хранения, который вам больше не нужен.
Хранилище, принадлежащее AppsFlyer (AWS и Snowflake) | Хранилище маркетолога (GCS, AWS, Azure, Яндекс, BigQuery) | |
---|---|---|
Название корзины | Задается AppsFlyer. |
Пример: af-datalocker-your-bucket-name
|
Владелец хранилища | AppsFlyer | Маркетолог |
Платформа хранилища | AWS | AWS, GCS, Azure, Яндекс, BigQuery, Snowflake |
Учетные данные для вашего доступа к данным | Доступны администраторам аккаунта AppsFlyer в пользовательском интерфейсе Data Locker | Не известны AppsFlyer. Используйте учетные данные, предоставленные облачным провайдером. |
Хранение данных | Данные удаляются через 14 дней. | Ответственность маркетолога |
Запросы на удаление данных | Ответственность AppsFlyer | Ответственность маркетолога |
Безопасность | Хранилищем управляет AppsFlyer. У клиента есть доступ для чтения. | Хранилищем управляет маркетолог.
|
Вместимость хранилища | Управляется AppsFlyer | Управляется маркетологом |
Контроль доступа с помощью конечных точек VPC с политиками корзины | Не применимо | [Необязательно] Если вы реализуете безопасность конечных точек VPC на уровне корзины в AWS, необходимо внести серверы AppsFlyer в список разрешенных. |
Уведомление сотрудникам службы безопасности о хранилищах, контролируемых клиентом
Обратите внимание:
- Корзина или хранилище предназначены только для использования AppsFlyer. Никакой другой субъект не должен записывать данные в этот вариант хранения.
- Вы можете удалить данные в хранилище через 25 часов после того, как мы их запишем.
- Данные, которые мы записываем в хранилище, являются копией данных, уже находящихся на наших серверах. Данные продолжают находиться на наших серверах в соответствии с нашей политикой хранения данных.
- По техническим причинам мы иногда удаляем и переписываем данные. По этой причине нам нужны разрешения на удаление и списки. Эти разрешения не несут для вашей безопасности никакой угрозы. В отношении списков мы являемся единственным субъектом, осуществляющим записи в корзине. Что касается удаления, мы можем восстановить данные.
- Для получения дополнительной информации обратитесь в нашу службу безопасности по адресу hello@appsflyer.com или к своему менеджеру.
Принципы множественных подключений (более одного пункта назначения)
В Data Locker вы можете отправить некоторые или все ваши данные в два разных хранилища (определенные в настройках подключения). Например, вы можете отправить данные приложения A в AWS, а данные приложения B – в GCS.
Каждое подключение состоит из полного набора настроек Data Locker, включая пункт назначения. Настройки подключений не зависят друг от друга.
При управлении подключениями учитывайте следующее:
- В настройках Data Locker подключения отображаются на вкладках. Каждое подключение имеет собственную вкладку настроек, на которой можно управлять подключением. Значок каждой вкладки представляет тип хранилища.
- Чтобы просмотреть сведения о подключении, дублировать или удалить подключение, нажмите ⋮ (опции).
Алгоритм действий
Разрешения для пользователя
Доступ к Data Locker могут получить как администраторы, так и члены команды с необходимыми разрешениями.
Администраторы
Администраторы могут иметь доступ к странице Data Locker, создавать и управлять всеми соединениями, добавлять редакторов и назначать владельцев для существующих соединений.
Члены команды
Члены команды могут иметь доступ к странице Data Locker, редактировать существующие подключения, которыми они владеют, или создавать новые подключения.
Предоставление разрешений
- Чтобы предоставить члену команды разрешение на доступ к Data Locker, назначьте ему необходимую роль и задайте значение «Управление» для Data Locker.
- Чтобы назначить другого владельца или добавить члена команды в качестве редактора для существующего соединения, нажмите на меню параметров (три точки)
внутри существующего соединения, а затем выберите Управление, чтобы изменить владельца соединения или добавить редакторов.
- В соединении AF AWS опция Управление отсутствует, так как доступ к ней разрешен только администраторам.
Настройка Data Locker
Используйте эту инструкцию для настройки Data Locker. Изменения в настройках Data Locker вступают в силу в течение 3 часов.
Требования
Чтобы настроить хранилище маркетолога:
Если вы настраиваете Data Locker, используя хранилище маркетолога, то есть вашу облачную корзину, сначала выполните одну или несколько следующих процедур.
- Настройте:
Важно! Если у вас нет подписки на Data Locker и вы имеете доступ к данным SKAN или когортной аналитике, вы должны выполнить процедуру настройки облачного хранилища, принадлежащего маркетологу.
Чтобы настроить Data Locker:
- Настройку выполняет администратор.
- В AppsFlyer перейдите мз бокового меню в раздел Отчеты > Data Locker.
- [Необязательно] Если у вас уже есть активное хранилище Data Locker, и вы хотите добавить еще одно, нажмите Добавить подключение. Дайте название подключению.
-
Выберите, куда в облачном сервисе должны записываться данные. Выполните одно из следующих действий:
- Выберите корзину AppsFlyer в AWS (опция доступна только при наличии подписки на Data Locker). Нажмите Сохранить и перейдите к шагу 5.
- Выберите S3.
- Введите название своей корзины AWS S3. Префикс
af-
является обязательным и должен быть введен вручную. - Нажмите Тестировать подключение.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Выберите, нужно ли сделать это подключение совместимым с Adobe Experience Platform. Если опция выбрана, нажмите Сохранить и перейдите к шагу 6.
- Нажмите Сохранить.
- Введите название своей корзины AWS S3. Префикс
- Выберите GCS.
- Введите название вашей корзины GCS.
- Нажмите Тестировать подключение.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Выберите, нужно ли сделать это подключение совместимым с Adobe Experience Platform. Если опция выбрана, нажмите Сохранить и перейдите к шагу 6.
- Нажмите Сохранить.
- [Бета] Выберите Azure.
- Введите имя подключения, имя аккаунта хранилища и ключ.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Выберите, нужно ли сделать это подключение совместимым с Adobe Experience Platform. Если опция выбрана, нажмите Сохранить и перейдите к шагу 6.
- Нажмите Сохранить.
- [Бета] Выберите Яндекс.
- Введите Название корзины, Ключ доступа и Секретный ключ.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Выберите, нужно ли сделать это подключение совместимым с Adobe Experience Platform. Если опция выбрана, нажмите Сохранить и перейдите к шагу 6.
- Нажмите Сохранить.
- Выберите BigQuery.
- Введите идентификатор проекта BigQuery и имя набора данных.
- Нажмите Тестировать подключение.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Нажмите Сохранить и перейдите к шагу 6.
- Выберите Snowflake.
- Введите свой регион Snowflake и идентификатор аккаунта.
- Нажмите Тестировать подключение.
- Убедитесь в отсутствии сообщения об ошибке, указывающего на неверный путь к корзине.
- Нажмите Сохранить и перейдите к шагу 6.
- Заполните раздел Настройки данных:
- Выберите формат файлов:
- [По умолчанию] Parquet
- CSV
- Выберите нужный тип сжатия файлов:
- Snappy (доступно только для файлов Parquet)
- GZIP
- Без сжатия
- Выберите максимальное количество строк в файле. 10k, 25k, 50, 100k, 200k или 500k. Большее количество строк в файле означает меньшее количество файлов, но больший размер файла.
- Выберите структуру папок (разделение данных):
- [По умолчанию] Объединенный
- Разделение по приложениям
- Выберите формат файлов:
- Заполните раздел Контент Data Locker:
- Выберите одно или несколько приложений для включения в отчеты. Выберите все, чтобы автоматически включать приложения, которые будут добавлены в будущем.
- Нажмите Применить.
- [Необязательно] Выберите один или несколько медиа-источников для включения в отчеты.
- По умолчанию = Все. То есть медиа-источники, которые будут добавлены в будущем, добавляются автоматически.
- Нажмите Применить.
- [Необязательно] Выберите поля для включения в отчеты. Примечание: Примечание. Иногда мы делаем доступными дополнительные поля. Учитывайте это при импорте данных.
- Нажмите Применить.
- Выберите типы отчетов. Требуется выбрать хотя бы один.
- [Необязательно] Для отчета по внутренним событиям приложения выберите внутренние события, которые необходимо включить. Если типов внутренних событий более 100, вы не сможете воспользоваться поиском. Чтобы выбрать события, введите их точные названия.
- По умолчанию = Все. То есть внутренние события, которые будут добавлены в будущем, добавляются автоматически.
- Нажмите Применить.
- Нажмите Сохранить подключение. Произойдет одно из следующих действий:
- Если вы выбрали корзину AWS AppsFLyer:
- Создается специальная корзина AWS. Отображаются учетные данные корзины.
- Корзина доступна только с использованием учетных данных клиента. С вашими учетными данными вы получаете доступ к корзине только для чтения.
- Если вы выбрали один из своих облачных хранилищ: Данные будут записаны в ваш сервис в течение 3 часов.
- Если вы выбрали корзину AWS AppsFLyer:
Сброс учетных данных
Администратор может сбросить учетные данные корзины AppsFlyer в любое время. Примечание! Если вы сбрасываете учетные данные, необходимо обновить учетные данные в сценариях импорта данных.
Сброс учетных данных хранилища, принадлежащего AppsFlyer:
- В AppsFlyer перейдите в раздел Отчеты > Data Locker.
- Выберите хранилище, принадлежащее AppsFlyer.
- В разделе учетных данных нажмите Reset credentials (Сбросить учетные данные).
Откроется окно подтверждения. - Нажмите Reset (Сбросить).
- Подождите (около 20 секунд), пока появится сообщение Credentials successfully reset (Учетные данные успешно сброшены).
Доступны обновленные учетные данные.
Дополнительные сведения
Ограничения и особенности
Специфика | Примечания |
---|---|
Рекламные сети | Не для использования рекламными сетями. |
Агентства | Не для использования агентствами |
Часовой пояс конкретного приложения | Не применимо Папки Data Locker разделены по часам по часовому поясу UTC. Фактические события содержат время в формате UTC. При необходимости переводите время в любой другой часовой пояс. Независимо от часового пояса вашего приложения, задержка от возникновения события до момента его записи в Data Locker остается неизменной. |
Валюта приложения | Не поддерживается |
Ограничения на размер | Не применимо |
Обновление данных | Данные обновляются согласно частоте обновления конкретного отчета, указанной в этой статье. |
Исторические данные | Не поддерживается. Если вам нужны исторические данные, некоторые отчеты (не все) доступны через Pull API. |
Ограниченные данные | Поля в некоторых отчетах ограничены из-за требований конфиденциальности. Узнать больше |
Доступ пользователя | Настраивать Data Locker могут только пользователи аккаунта с необходимыми разрешениями. |
Одно приложение/Несколько приложений | Поддержка нескольких приложений. Data Locker на уровне аккаунта. |
Устранение неполадок
- Признак Невозможно получить данные с помощью интерфейса командной строки AWS
- Сообщение об ошибке Произошла ошибка (AccessDenied) при вызове операции ListObjectsV2: Доступ запрещен.
- Причина: Используемые учетные данные AWS не соответствуют учетным данным для корзины AppsFlyer. Это может быть вызвано наличием нескольких или неверных учетных данных на вашем компьютере.
-
Решение:
- Используйте другой инструмент, например, Cyberduck, чтобы получить доступ к корзине, то есть не интерфейс командной строки (CLI). Сделайте это, чтобы убедиться, что используемые учетные данные работают. Если вы можете подключиться с помощью Cyberduck, это указывает на проблему с кэшем учетных данных.
-
Обновите кэш учетных данных AWS.
Screenshot from AWS
Получение данных AWS
Используйте предпочитаемый инструмент извлечения данных AWS, AWS CLI, или один из инструментов, описанных в следующих разделах. Примечание! Данные инструкции применимы к корзинам AppsFlyer. При необходимости измените инструкции, если вы подключаетесь к собственной корзине.
AWS CLI
Прежде чем начать:
- Установите AWS CLI на ваш компьютер.
- В AppsFlyer перейдите в Data Locker и получите информацию с панели учетных данных.
Чтобы использовать AWS CLI:
- Откройте терминал. Для этого в Windows (<Windows> + <R>), нажмите OK.
Откроется окно командной строки. - Введите aws configure.
- Введите ключ доступа AWS, как он отображается на панели учетных данных.
- Введите ваш ключ доступа AWS, как он отображается на панели учетных данных.
- Введите eu-west-1.
- Нажмите Enter (нет).
Используйте указанные команды CLI по мере необходимости.
Значение {home-folder} содержится в следующих командах
Чтобы увидеть список папок в вашей корзине:
aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/
Список файлов и папок
В вашей корзине Data Locker есть три типа папок:
- Тип отчета
-
dt=
Датаdt= - Час
h=
Чтобы вывести список всех отчетов определенного типа:
aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/
Чтобы вывести список всех отчетов определенного типа за определенный день:
aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17
Чтобы вывести список всех отчетов определенного типа за определенный час определенного дня:
aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17/h=23
Чтобы скачать файлы за определенную дату:
aws s3 cp s3://af-ext-reports/<home-folder>/data-locker-hourly/t=installs/dt=2020-08-01/h=9/part-00000.gz ~/Downloads/
Cyberduck
Прежде чем начать:
- Установите клиента Cyberduck.
- В AppsFlyer перейдите в Data Locker и получите информацию с панели учетных данных.
Чтобы настроить Cyberduck:
- В Cyberduck нажмите Action (Действие).
- Выберите Новая закладка. Откроется окно.
- В первом поле (отмеченном [1] на скриншоте ниже) выберите Amazon S3.
- Заполните поля следующим образом:
- Псевдоним: Произвольный текст.
- Сервер: s3.amazonaws.com
- Идентификатор ключа доступа: скопируйте ключ доступа AWS, как он отображается на панели учетных данных в AppsFlyer.
- Секретный ключ доступа скопируйте секретный ключ доступа к корзине, как он отображается на панели учетных данных в AppsFlyer.
- Путь: {Имя корзины}/{Домашняя папка} Например: af-ext-reports/1234-abc-ffffffff
- Закройте окно. Для этого нажмите Х в верхнем правом углу.
- Выберите соединение.
Отобразятся каталоги данных.
Браузер Amazon S3
Прежде чем начать:
- Установите браузер Amazon S3.
- В AppsFlyer перейдите в Data Locker и получите информацию с панели учетных данных.
Чтобы настроить браузер Amazon S3:
- В браузере S3 нажмите Accounts (Аккаунты) > Add New Account (Добавить новый аккаунт).
Открывается окно Добавить новый аккаунт. - Заполните поля следующим образом:
- Account Name (Имя учетной записи): произвольный текст.
- Access Key ID (Ключ доступа): скопируйте ключ доступа AWS, как он отображается на панели учетных данных в AppsFlyer.
- Secret Access Key:скопируйте секретный ключ доступа к корзине, как он отображается на панели учетных данных в AppsFlyer.
- Выберите Encrypt Access Keys с помощью пароля и введите пароль. Запишите этот пароль.
- Выберите Use secure transfer (Безопасная передача данных).
- Выберите Сохранить изменения.
- Нажмите Buckets (Корзины) > Add External Bucket (Добавить внешнюю корзину).
Откроется окно Add External Bucket (Добавить внешнюю корзину). - Введите Bucket name (Имя корзины). Название крзины имеет следующий формат: {Имя корзины}/{Домашняя папка}. Значения, необходимые для имени корзины и домашней папки, появятся в окне учетных данных.
- Нажмите Add External bucket.
Корзина создана и отображается на левой панели окна.
Теперь вы можете получить доступ к файлам Data Locker.