Data Clean Room: работа с источниками

Краткий обзор. Настройте источники данных, загружаемые в Data Clean Room (DCR) для дополнения данными атрибуции AppsFlyer и создания отчетов DCR.

Прежде чем начать: Прочитайте статью Data Clean Room: настройка облачного хранилища и файлов с данными, чтобы разобраться в настройке облачного хранилища и требованиях к исходным файлам.

Введение

Когда исходный файл данных создан, следующий шаг — настроить его в качестве источника на платформе AppsFlyer DCR. Определение источника включает два основных компонента:

Список всех доступных источников можно увидеть на вкладке Sources (Источники) в Data Clean Room.

Расположение источника

Расположение источника состоит из корзины облачного хранилища (также известной, как коннектор) и дальнейшего пути к файлу, по которому DCR будет читать исходный файл при каждом его обновлении. 

Эта корзина и путь к файлу создаются в интерфейсе выбранного вами облачного сервиса. Полные инструкции по этому процессу с примерами доступны здесь.

Коннекторы

Коннектор определяет корзину облачного сервиса (в AWS или GCS), в которой хранятся данные DCR. Это расположение, из которого загружаются исходные данные и в которое доставляются отчеты.

  • Как правило, проще всего использовать одну корзину для всех загружаемых данных и для всех отчетов, которые вы получаете из DCR. Чтобы использовать несколько корзин и облачных сервисов, каждый из них нужно определить как коннектор на платформе AppsFlyer DCR.

Чтобы определить коннектор, выполните следующие шаги:

  1. На главной странице Data Clean Room нажмите Manage connectors (Управлять коннекторами) в правом верхнем углу.
  2. В диалоговом окне New connector (Новый коннектор) введите имя корзины точно так же, как в облачном сервисе.

Что делать, если расположение источника не известно?

Рекомендуется указывать расположение источника до определения его структуры; однако, это возможно не во всех случаях (например, если структура вашего облачного хранилища еще не определена окончательно). Если вы хотите определить структуру источника до определения его расположения, вы можете загрузить файл прототипа источника со своего компьютера (локальный файл).

 Важно!

Источник нельзя сохранить, пока не указано его расположение.

Чтобы сохранить источник до того, как вы узнаете его расположение, вы можете сохранить его, используя временное (даже неработающее) расположение источника. Однако, чтобы DCR могла начать обработку отчета, в котором задействуется этот источник, необходимо изменить его на фактическое (рабочее) расположение источника.

Структура источника

По всем источникам, загружаемым на обработку в DCR, AppsFlyer нужно знать по каждому полю данных, как оно должно использоваться при создании отчетов. Определение структуры источника предполагает загрузку файла источника и отнесение каждого поля к одному из следующих типов:

  • Identifier (Идентификатор). Поле, идентифицирующее уникального пользователя приложения (например, CUID, AppsFlyer ID и др.)
    • Основное назначение идентификаторов в контексте DCR — объединение источников данных для сопоставления соответствующих данных уровня пользователя.
  • Dimension (Параметр). Атрибут, по которому вы классифицируете пользователей приложения (например, гео, дата установки, кампания и др.)
  • Metric (Метрика). Числовые данные, собранные по пользователю приложения (например, доход, количество открытий приложения, LTV и др.)
    • Поле данных, отнесенное к категории метрик, может содержать только числовые значения.

Создание источника

Процесс создания источника включает все описанные ниже шаги. Для удобства чтения они разделены на вкладки.

Предварительные шаги

Чтобы создать источник, выполните следующие шаги:

  1. Перейдите на вкладку Sources (Источники) в Data Clean Room.
  2. Нажмите кнопку + New source (Создать источник).
    Откроется страница нового источника.
  3. Введите имя источника.
    • Им может быть любое уникальное имя, которое позволит вам идентифицировать этот источник на платформе AppsFlyer DCR. Оно не обязательно должно совпадать с именем файла.
    • Важно! Убедитесь, что имя этого источника отличается от имен других источников в вашем аккаунте, иначе вы не сможете сохранить источник.
    • Требования к названию источника:
      • Длина: от 2 до 80 символов
      • Допустимые символы:
        • буквы (A–Z, a–z)
        • цифры (0–9), имя не может начинаться с цифры
      • Недопустимые символы:
        • пробелы
        • все остальные символы или специальные символы
  4. Выполните соответствующие инструкции в зависимости от того, откуда AppsFlyer должен считать файл источника для загрузки полей.

Загрузка полей из расположения источника

Чтобы загрузить поля из расположения источника:

  1. Выберите Load fields from source location (Загрузить поля из расположения источника).
    Откроется диалоговое окно Source location and format (Расположение источника и формат).
  2. Выберите коннектор, к которому относится путь к файлу источника.
    • Если коннекторы в аккаунте не определены, откроется диалоговое окно New connector (Новый коннектор) с предложением создать коннектор.
    • Если у вас уже есть коннекторы, но вы хотите использовать новый, нажмите кнопку + New connector (Создать коннектор) в правом верхнем углу окна Source location and format (Расположение источника и формат).
  3. Укажите путь к папке источника:
  4. Выберите формат, в котором будут загружаться файлы источника.
  5. Нажмите Apply (Применить).

Загрузка полей из локального файла

Чтобы загрузить поля из локального файла:

  1. Выберите Load fields from local file (Загрузить поля из локального файла).
  2. Откроется диалоговое окно загрузки файла.
  3. Используйте опцию Click to upload (Нажмите, чтобы загрузить) и выберите файл прототипа источника.
  4. Нажмите Apply (Применить).

Определение структуры источника

Чтобы определить структуру источника, выполните следующие шаги:

  1. Когда предыдущие шаги (загрузка полей из расположения источника или из локального файла) будут выполнены, AppsFlyer проанализирует файл и отобразит все поля данных (столбцов) в списке Available fields (Доступные поля).
  2. Выберите одно или несколько полей в левой части списка Доступные поля и с помощью кнопок в центре экрана распределите их по категориям: идентификаторы, параметры или метрики.
    • Когда категория поля определена, оно отображается в списке соответствующей категории в правой части экрана.
    • Чтобы находить нужные поля в списках, можно использовать строку поиска.
  3. Чтобы удалить поле из категории, к которой оно было отнесено ранее, выберите его в соответствующем списке и нажмите кнопку Remove (Удалить). Поле вернется в список доступных полей.
  4. Повторяйте этот процесс, пока не присвоите категории всем полям, которые требуется включить в отчеты DCR.
    • Классифицировать все поля в списке доступных полей не требуется. Если же поле будет использоваться в отчете, определять его категорию обязательно.
    • Если позднее вы решите использовать дополнительные поля из этого источника, это можно сделать, отредактировав структуру источника. Обратите внимание, что поля без категорий не загружаются в список доступных полей автоматически. Чтобы работать с этими полями, их нужно повторно загрузить из расположения источника или локального файла.

Сохранение источника

 Примечание

Чтобы сохранить источник, нужно указать его расположение. Даже если пока нет возможности указать постоянное расположение, продолжайте выполнять шаги ниже для варианта Если вы загрузили поля из локального файла, но укажите временное расположение вместо постоянного. Временное расположение не обязательно должно быть рабочим расположением. Важно! Чтобы начать загрузку файлов для обработки в DCR и создания отчетов с использованием этого источника, отредактируйте источник, указав его постоянно расположение.

Чтобы сохранить источник, выполните следующие шаги:

  1. Если вы загрузили поля из расположения источника, нажмите Save (Сохранить).
  2. Если вы загрузили поля из локального файла:
    1. Нажмите Set source location (Задать расположение файла).
      Откроется диалоговое окно Source location and format (Расположение источника и формат).
    2. Выберите коннектор, к которому относится путь к файлу источника.
      1. Если коннекторы в аккаунте не определены, откроется диалоговое окно New connector (Новый коннектор) с предложением создать коннектор.
      2. Если для этого источника требуется использовать новый коннектор, нажмите кнопку + New connector (Создать коннектор).
    3. Укажите путь к папке источника:
      1. Корзина и папка с ключом DCR отобразятся автоматически.
      2. Введите полный путь после папки с ключом DCR до папки второго уровня по источнику данных включительно.
      3. Путь к папке источника будет выглядеть примерно следующим образом:
        s3://af-dcr-example-bucket/01bcc5fb/input/BI-data/
    4. Выберите формат, в котором будут загружаться файлы источника.
      • Важно! Если выбранный здесь формат файла не соответствует фактическому формату загружаемых файлов источника, DCR не сможет их обработать.
    5. Нажмите Apply (Применить), чтобы задать расположение источника.
    6. Нажмите Save (Сохранить), чтобы сохранить источник.
    7. Новый источник появится на вкладке Sources (Источники) в Data Clean Room.

Редактирование или удаление источника

Изменить (или удалить) источник можно несколькими способами:

  • Изменение имени источника
  • Изменение расположения источника или формата файла
  • Изменение структуры источника
  • Удаление источника (не используемого в отчете)

Изменение имени источника

Чтобы изменить имя источника:

  1. Перейдите на вкладку Sources (Источники) в Data Clean Room.
  2. В списке источников наведите курсор на строку с источником, который требуется отредактировать.
  3. Нажмите кнопку «Редактировать» edit_button.png, которая отображается справа от строки.
  4. На странице редактирования источника измените имя источника.
  5. Нажмите кнопку Update (Обновить), чтобы сохранить источник с новым именем, или Discard changes (Отменить изменения), чтобы не сохранять.

Изменение расположения источника или формата файла

Чтобы изменить расположение источника:

  1. Перейдите на вкладку Sources (Источники) в Data Clean Room.
  2. В списке источников наведите курсор на строку с источником, который требуется отредактировать.
  3. Нажмите кнопку «Редактировать» edit_button.png, которая отображается справа от строки.
  4. Прокрутите страницу редактирования источника вниз до раздела Source location (Расположение источника).
  5. Нажмите кнопку «Редактировать» edit_button.png рядом с текущим расположением источника.
  6. Внесите необходимые изменения в диалоговом окне Source location and format (Расположение источника и формат).
  7. Нажмите Apply (Применить), чтобы применить изменения.
  8. Нажмите кнопку Update (Обновить), чтобы сохранить источник с новым расположением / форматом файла, или Discard changes (Отменить изменения), чтобы не сохранять.

Изменение структуры источника

Чтобы изменить структуру источника:

  1. Перейдите на вкладку Sources (Источники) в Data Clean Room.
  2. В списке источников наведите курсор на строку с источником, который требуется отредактировать.
  3. Нажмите кнопку «Редактировать» edit_button.png, которая отображается справа от строки.
  4. На странице редактирования источника поля, ранее классифицированные как идентификаторы, параметры и метрики, будут отображаться в списках соответствующих категорий в правой части экрана.
  5. Вы можете перенести поле из одной категории в другую без повторной загрузки полей из файла источника. Для этого:
    1. Сначала выберите его в списке соответствующей категории и нажмите кнопку Remove (Удалить), чтобы оно вернулось в список доступных полей.
    2. Затем выберите его в списке доступных полей и с помощью кнопок в центре экрана определите его категорию: идентификатор, параметр или метрика.
  6. Чтобы работать с полями из файла источника, не отнесенными к категориям, их нужно повторно загрузить из расположения источника или из локального файла. Сделайте этот выбор, нажав соответствующую кнопку в нижней части списка доступных полей.
  7. AppsFlyer проанализирует файл, и все поля данных (столбцы) без категорий появятся в списке доступных полей.
    • Поля, уже классифицированные как идентификаторы, параметры и метрики, по прежнему будут отображаться в списках соответствующих категорий в правой части экрана.
    • Если ранее классифицированного поля нет в повторно загруженном файле источника, оно будет отображаться в списке соответствующей категории со значком ошибки.
  8. Классифицируйте новые поля, выбирая одно или несколько полей в левой части списка Доступные поля и используя кнопки в центре экрана, чтобы распределить их по категориям: идентификаторы, параметры или метрики.
  9. Когда все необходимые изменения будут внесены, нажмите кнопку Update (Обновить), чтобы сохранить источник с обновленной структурой, или Discard changes (Отменить изменения), чтобы не сохранять.

 Важно!

Не забудьте внести изменения, отражающие новую структуру источника, во все отчеты, в которых он используется:

  • Удаленные поля, поля без категории и поля, категория которых изменилась, автоматически исключаются изо всех отчетов, в которых они использовались.
  • Вновь добавленные или классифицированные поля не будут включены в имеющиеся отчеты, пока вы не добавите их в определения отчетов.

Удаление источника

  1. Перейдите на вкладку Sources (Источники) в Data Clean Room.
  2. В списке источников наведите курсор на строку с источником, который вы хотите удалить.
  3. Нажмите кнопку «Удалить» delete_button.png, которая отображается справа от строки.
  4. В диалоговом окне подтвердите удаление источника.
    • Нельзя удалить источник, который используется в отчете. Если вы попробуете это сделать, в сообщении будет указан список отчетов, в которых задействован данный источник. Чтобы удалить такой источник, вы можете выполнить одно из следующих действий:
      • Удалить отчеты, в которых он используется.
      • Удалить поля источника из определений отчетов, в которых он используется.
Была ли эта статья полезной?