Data Locker para profissionais de marketing

Premium

Resumo: o Data Locker envia seus dados de relatório para um cloud storage para que eles sejam carregados em seus sistemas de BI. Você pode selecionar diferentes destinos de armazenamento: um bucket da AppsFlyer na AWS ou um armazenamento de sua propriedade na AWS, GCS, Yandex, BigQuery e Snowflake. O Data Locker é compatível com múltiplos destinos. Isso significa que você pode enviar todos os dados para múltiplos destinos, segregar dados por destino, ou escolher uma combinação de ambos. 

Visão geral

6133DataLockerForAdvertisers.png

No Data Locker, selecione seus aplicativos, fontes de mídia, eventos e relatórios a serem incluídos nos dados que a Appsflyer envia para as suas opções selecionadas de cloud storage. Em seguida, carregue dados programaticamente em seus sistemas.  

Data Locker — recursos

Funcionalidade Descrição
Opções de armazenamento (nuvem)

O Data Locker pode enviar seus dados para qualquer um dos seguintes provedores de serviços na nuvem:

Você pode definir mais de um destino no Data Locker. Isso significa que você pode enviar todos ou alguns de seus dados para diferentes destinos.

Exemplos

  • Separe os dados por tipo de relatório. Envie dados brutos para GCS e dados agregados para Snowflake.
  • Separe os dados por aplicativo e envie os dados por grupo de aplicativos para diferentes buckets.  
Multiaplicativos   Envie dados de 1, mais ou todos os aplicativos na sua conta. Quando você adiciona aplicativos à conta, eles podem ser incluídos automaticamente.  
Janela de disponibilidade 14 dias
Segregação de dados

Opções de segregação de dados disponíveis (relevantes para bucket cloud storage):

  • [Padrão] Unificado: Dados de todos os aplicativos combinados. O campo de app ID em nível de linha é usado para identificar o aplicativo em arquivos de dados. 
  • Segregado por aplicativo: Os dados de cada aplicativo estão em uma pasta separada. O nome da pasta consiste no app ID.  
Opções de formato de dados
  • Para bucket cloud storage:
  • Data warehouse
Atualização dos dados

A atualização depende do tipo de relatório  

  • Por hora: dados gerados continuamente; por exemplo, instalações e dados de eventos in-app são transmitidos poucas horas após o evento chegar à AppsFlyer.
  • Diária: relatórios como os de desinstalações são gerados diariamente e ficam prontos no dia seguinte. 
  • Versionada: se o mesmo relatório for gerado várias vezes para o mesmo período, um mecanismo de controle de versão estará em vigor.  

Relatórios disponíveis via Data Locker

Definir configurações do relatório do Data Locker

Para configurar o Data Locker, siga as etapas abaixo para conectar seu cloud service, definir as configurações de exportação e personalizar o conteúdo do relatório:

1. Configure seu cloud service

Você pode conectar seu Data Locker a um ou mais provedores de cloud service. Veja a seguir as instruções sobre como configurá-los para trabalhar com o Data Locker:

Atenção! Se você não tiver uma assinatura do Data Locker e tentar acessar a análise de cohort ou os dados da SKAN, você deve completar um dos procedimentos acima.

 

2. Adicione uma conexão ao seu cloud service

Após configurar sua conta de cloud service para trabalhar com o Data Locker (veja "Configurar seu cloud service" acima), crie uma conexão no Data Locker usando as credenciais da sua conta. Você pode criar até duas conexões.

Atenção:

Por padrão, cada conta pode ter até 2 conexões do Data Locker. Se você precisar adicionar mais conexões, entre em contato com seu Customer Success Manager (CSM).

Para criar uma conexão para o seu cloud provider, siga os seguintes passos:

  1. Na AppsFlyer, no menu lateral, vá para Relatórios > Data Locker.
  2. À direita, clique em Nova conexão.
  3. Em Nome da conexão insira o nome da sua conexão. Use apenas letras minúsculas, dígitos e hífens "-"
  4. Clique no ícone do cloud service ao qual você deseja se conectar.
  5. Dependendo da opção que você selecionou, insira as seguintes informações de conexão.

    Conexão de bucket da AWS cloud

    Antes de configurar a conexão com a AWS, crie um bucket da AWS. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira o nome do seu bucket S3 da AWS. O prefixo af- é obrigatório e deve ser inserido manualmente.
    2. Clique em Testar conexão.
    3. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    4. Selecione se deseja tornar esta conexão compatível com a Adobe Experience Platform. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.
    5. Clique em Salvar.

    Conexão de bucket do GCS cloud

    Antes de configurar a conexão GCS, crie um bucket no GCS. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira o nome do bucket do GCS.
    2. Clique em Testar conexão.
    3. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    4. Selecione se deseja tornar esta conexão compatível com a Adobe Experience Platform. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.
    5. Clique em Salvar.

    Conexão de bucket da Azure cloud

    Antes de configurar a conexão da Azure, abra uma conta de armazenamento na Azure. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira seu Nome de conexão, Nome da conta de armazenamento e Chave.
    2. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    3. Selecione se deseja tornar esta conexão compatível com a Adobe Experience Platform. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.
    4. Clique em Salvar.

    Conexão do bucket do Yandex Cloud

    Antes de configurar a conexão com a AWS, crie uma conta de serviço no Yandex. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira o nome do bucket, a chave de acessoe a chave secreta.
    2. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    3. Selecione se deseja tornar esta conexão compatível com a Adobe Experience Platform. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.
    4. Clique em Salvar.

    Conexão com o data warehouse do BigQuery

    Antes de configurar a conexão do BigQuery, crie um conjunto de dados no BigQuery. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira o project ID do BigQuery e o nome do conjunto de dados.
    2. Clique em Testar conexão.
    3. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    4. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.

    Conexão do data warehouse do Snowflake

    Antes de configurar a conexão com o Snowflake, abra uma conta no Snowflake. Para mais informações, acesse aqui.

    Para configurar a conexão:

    1. Insira sua região e account ID do Snowflake.
    2. Clique em Testar conexão.
    3. Verifique se uma mensagem de erro indicando que o caminho do bucket é inválido não é exibida.
    4. Se selecionado, clique em Salvar e continue a selecionar filtros de nível global.
  6. Clique em Salvar. A seção de configurações de output do relatório é exibida.

Atenção:

Você pode usar o log de auditoria para confirmar se uma conexão foi criada, atualizada ou excluída, e quem fez a alteração.

3. Defina as configurações de output do relatório

Após estabelecer a conexão com o cloud service, você pode continuar a definir as configurações gerais de outputs de relatórios do seu Data Locker. Se o seu cloud service for BigQuery ou Snowflake, você pode pular essa etapa.

  1. Em Configurações de output do relatório, selecione a estrutura de pastas (segregação de dados):
    • Unificado (padrão): Os arquivos de relatório incluem registros de todos os aplicativos.
    • Segregado por aplicativo: Cada arquivo de relatório é dedicado a um aplicativo.
  2. Selecione o formato do arquivo de relatórios: Parquet (padrão) ou CSV.
  3. Selecione o tipo de compactação de arquivo que você deseja:
    • Snappy (disponível apenas para arquivos Parquet)
    • GZIP
  4. Selecione o número máximo de linhas que você deseja em seu arquivo: 10 mil, 25 mil, 50 mil, 100mil, 200 mil ou 500 mil. Mais linhas significam menos arquivos, mas um tamanho de arquivo maior. 

    Atenção:

    Em Expected path, veja os padrões de caminho para seus relatórios. Atenção: O caminho real pode ser diferente do exibido.

4. Selecione filtros de nível global

Os filtros de nível global permitem que você filtre seus relatórios por aplicativos ou fontes de mídia. Esses filtros se aplicam à maioria dos relatórios na sua conta do Data Locker, mas você também pode configurá-los no nível do relatório (veja 7-selecionar-os-filtros-do-nível-do-relatório abaixo). Se o mesmo filtro for aplicado em ambos os níveis, o filtro de nível de relatório tem prioridade.

Para aplicar um filtro, faça o seguinte:

  1. Em Relatórios, clique no filtro e selecione os itens a serem incluídos no relatório. Por exemplo, clique Untitled.png no filtro Apps e selecione os aplicativos a serem incluídos nos relatórios.
  2. Em seguida, clique no botão Enter (⏎).

5. Selecione o grupo de relatórios

Selecione os relatórios que você deseja obter em seu cloud service. Os relatórios estão listados em grupos. Clicar no nome do grupo de relatórios expande ou recolhe os grupos.

  • Para selecionar um relatório, clique em down.png para expandir o grupo de relatórios. Para cada relatório no grupo, as seguintes informações são apresentadas:
    • Nome do relatório: O título do relatório.
    • Nome do conjunto de dados: O nome do conjunto de dados que contém os registros do relatório.
    • Atualização dos dados: Com que frequência o relatório é atualizado com novos registros (por exemplo, a cada hora, diariamente ou em versões).
    • Campos: o número de campos (ou colunas) que você selecionou para o relatório em comparação com o número total de campos disponíveis para seleção.

6. Personalize ou duplique o relatório

Após selecionar um ou mais relatórios de um grupo de relatórios, você pode optar por personalizar o relatório original ou criar uma cópia personalizada separada duplicando-o. Isso permite que você personalize os campos e filtros do relatório de acordo com suas necessidades específicas, sem afetar a versão original.

Opção A: Personalize o relatório original

  1. Clique no botão de customize.png personalizar ao lado do nome do relatório.
  2. O editor de relatórios será aberto, permitindo que você selecione campos e aplique filtros.
  3. As alterações serão salvas na configuração original do relatório.

Atenção: Isso modifica como o relatório é entregue ao seu cloud storage.

Opção B: Duplicar o relatório

  • Clique em Untitled 2.png ao lado do nome do relatório.
  • Selecione duplicate2.png Duplicar no menu suspenso.
  • Uma cópia do relatório será criada, nomeada com o prefixo copy_of_.
  • O relatório duplicado é aberto em modo de edição para maior personalização.

Dica: Duplicar é ideal para criar variações de um relatório para diferentes casos de uso.

Após escolher entre personalizar ou duplicar, configure os campos do relatório conforme descrito na próxima etapa.

7. Selecione os campos do relatório

Uma vez que você escolheu personalizar ou duplicar um relatório, o próximo passo é definir quais campos de dados devem ser incluídos. Cada relatório fornece um conjunto completo de campos disponíveis e você pode personalizar sua seleção para incluir apenas o que é relevante para sua análise ou integração. Por padrão, todos os campos são selecionados, mas você pode refinar o relatório escolhendo manualmente campos específicos.

Selecione os campos a serem incluídos no relatório:

  1. No diálogo do relatório selecionado, em Campos, passe o mouse sobre qualquer campo para ver sua descrição.

    HQ1_2024-08-26_15.44.23.png

  2. Verifique os campos que deseja incluir no relatório ou desmarque os campos que deseja excluir.
  3. Clique em Aplicar para salvar suas configurações.

Copiar os campos de outro relatório

Você pode copiar os campos de outro relatório como ponto de partida e, em seguida, continuar a selecionar ou desmarcar campos para ajustar seu relatório.

  1. Na aba Campos, desmarque qualquer campo aleatório.
  2. Clique em Extrair esquema do relatório.
  3. Selecione o relatório do qual você deseja copiar os campos.
  4. Continue selecionando ou desmarcando campos.
  5. Para restaurar a seleção original do relatório, clique em Sem título 4.png Atualizar.

8. Selecione os filtros a nível de relatório

Os filtros a nível de relatório permitem que você filtre um único relatório por aplicativos, fontes de mídia ou outras dimensões. Você também pode definir filtros que se aplicam a todos os relatórios em sua conta; veja selecionar filtros a nível global. Por padrão, os filtros a nível de relatório são definidos para as configurações de filtro a nível global, mas você pode atualizá-los para configurações personalizadas que se aplicam apenas ao relatório selecionado.

Para selecionar os filtros a serem aplicados a um relatório específico:

  1. Passe o mouse sobre o relatório específico que você deseja personalizar.
  2. Clique em Untitled 2.png para abrir o menu de ações e selecione Untitled 3.png Editar relatório.
  3. Abra a aba Filtros. Os filtros estão configurados para as configurações de filtro a nível global.
  4. Clique no filtro e selecione os itens a serem incluídos no relatório. Por exemplo, clique no filtro Untitled.png Apps e selecione os aplicativos a serem incluídos nos relatórios.
  5. Em seguida, clique no botão Enter (⏎). Essa seleção substitui as configurações a nível global.
  6. (Opcional) Para o relatório Inapps , você pode definir o filtro Evento in-app. Digite seus nomes de maneira precisa para selecioná-los. 
  7. Clique em Aplicar para salvar suas configurações.

9. Remova campos legados

Os campos não utilizados são aqueles que foram anteriormente incluídos no esquema do relatório, mas agora foram excluídos. Recomendamos remover esses campos para garantir que seu relatório contenha apenas informações relevantes. Antes de fazer quaisquer alterações, certifique-se de que seus workflows e integrações não dependem deles.

Para remover campos legados específicos

  1. Abra a aba campos legados.
  2. Ative: incluir campos legados no relatório.
  3. Desmarque os campos que deseja excluir.
  4. Clique em aplicar.
  5. Salve as configurações de conexão.

Para remover todos os campos legados:

  1. Abra a aba de campos legados.
  2. Desativar: incluir campos legados no relatório.

Atenção:

Se você quiser incluir campos não utilizados no relatório, mas não consegue fazer isso porque a lista de campos legados está desativada e bloqueada, entre em contato com seu Customer Success Manager.

Campos legados não vazios

A maioria dos campos legados está vazio ou null. No entanto, alguns deles contêm valores, mas ainda são considerados sem uso porque:

  • Eles aparecem no relatório com um nome diferente (renomeado).
  • Eles foram excluídos do esquema do relatório (obsoleto).

Baixar a lista de campos legados não vazios (CSV). 

10. Salve a conexão

Clique em Salvar e o primeiro envio de dados aparecerá no seu cloud service dentro de 3 horas. Os cronogramas de atualização de dados subsequentes são específicos para cada relatório.

 

Importante!

As alterações nas configurações do Data Locker levam até 3 horas para entrar em vigor. 

Permissões do usuário

Tanto os administradores quanto os membros da equipe, com as permissões corretas, podem acessar o Data Locker.

Administradores

Os administradores podem acessar a página do Data Locker, criar e gerenciar todas as conexões, adicionar editores e atribuir proprietários a conexões existentes.

  • Para fornecer a um membro da equipe permissão para acessar o Data Locker, atribua a ele um papel de gestão no Data Locker.
  • Para transferir a propriedade ou adicionar um membro da equipe como editor em uma conexão existente, clique no ícone do menu de opções 3 dots icon.png dentro da conexão existente e, em seguida, clique em Gerenciar propriedade para alterar o proprietário da conexão ou adicionar a permissão de edição.

    Atenção:

    Nas conexões AF AWS, não há opção de gerenciar propriedade mesmo para administradores, uma vez que apenas administradores podem editar, excluir ou criar novas conexões em AF AWS. Essa precaução tem como objetivo evitar a exposição das credenciais do bucket.

Membros da equipe

Os membros da equipe podem acessar a página do Data Locker, editar conexões existentes ou criar novas conexões. Eles não podem gerenciar a propriedade (ou seja, definir novos proprietários e editores), mesmo que eles sejam proprietários da conta.

Arquitetura do armazenamento de dados

Visão geral

A estrutura dos dados no armazenamento depende de se os dados são enviados para armazenamento em nuvem ou para um data warehouse. A estrutura de pastas descrita aqui se aplica ao armazenamento (buckets). No caso de armazenamento em data warehouse, considere que a referência a pastas se aplica a exibições. 

Os dados são registrados na opção de armazenamento selecionada por você. No caso de cloud storage, o armazenamento é de propriedade da AppsFlyer na AWS ou de sua propriedade na AWS, GCS ou Yandex. Você pode mudar as opções de armazenamento a qualquer momento ou enviar alguns ou todos os seus dados para múltiplas opções de armazenamento.  

Os dados de bucket cloud storage são organizados em uma estrutura de pastas hierárquica, de acordo com o tipo de relatório, data e hora. A figura a seguir contém um exemplo dessa estrutura:

DLFolderOVerview.png

Os dados de um determinado relatório estão contidos nas pastas de hora (h) associadas a esse relatório:

  • O número de pastas de hora depende da atualização dos dados do relatório (por hora ou diária).
  • Os dados são fornecidos em arquivos compactados Snappy ou GZIP, ou arquivos não compactados, com formato Parquet ou CSV.
  • Os arquivos de dados consistem em colunas (campos).
  • A estrutura do esquema (campo) dos relatórios de jornada do usuário é idêntica entre si e depende dos campos selecionados por você. Cada um dos outros relatórios tem seus próprios campos explícitos, também conhecidos como relatórios sem esquema. Consulte os relatórios de marketing do Data Locker para ver relatórios disponíveis e links para as especificações do relatório.  

Estrutura de pastas

Pasta Descrição 
Subscription ID

DataLockerFolders.png

  • A pasta de nível superior no bucket depende do proprietário e do provedor do armazenamento. No geral, a pasta de nível superior é seu Subscription ID, mas em alguns casos, por exemplo, se você usar Cyberduck, o ID é definido no marcador de página e não é exibido na estrutura da pasta. 
  • A pasta data-locker-hourly contém os tópicos do relatório. As pastas acima desse nível dependem da propriedade do bucket e do provedor de serviços cloud.

Exemplos de estrutura de pastas com base no proprietário do bucket e no provedor cloud

  • Bucket da AppsFlyer: <af-ext-reports>/<unique_identifier>/<data-locker-hourly>
  • Seu repositório AWS: <af-datalocker-your bucket prefix>/<generated-home-folder><subscription-id>
  • Seu repositório GCS: <your bucket name>/<generated-home-folder>/<subscription-id>
Tópico (t) O tipo de relatório está relacionado ao assunto do relatório.  
Data (dt) Essa é a data dos dados relacionados. No caso de dados brutos, significa a data em que o evento ocorreu. No caso de dados agregados, a data do próprio relatório.  
Hora (h ou version)

As pastas de data são divididas em pastas por hora (h) ou version, dependendo do tipo de relatório.  

Pastas por hora

As pastas h estão relacionadas ao horário em que os dados foram recebidos pela AppsFlyer. Por exemplo, eventos de instalação recebidos entre 14:00 e 15:00 UTC são gravados no arquivo h=14. Atenção! Há um atraso de cerca de 1 a 3 horas, entre o momento em que os dados chegam à AppsFlyer até que a pasta h seja registrada no Data Locker. Por exemplo, a pasta h=14 é escrita 1 hora depois às 15:00 UTC.  

Características da pasta por hora:

  • Existem 24 pastas h enumeradas de 0 a 23. Por exemplo, h=0, h=1 e assim por diante. 
  • Uma pasta tardia, h=late, contém eventos do dia anterior que chegam depois da meia-noite. Ou seja, eventos que chegam das 00:00 às 02:00 UTC do dia seguinte. Por exemplo, se um usuário instalar um aplicativo na segunda-feira às 08:00 UTC e o evento chegar na terça-feira às 01:00 UTC, o evento será gravado na pasta tardia de segunda-feira. 
  • Os dados que chegam depois das 02:00 UTC são transmitidos para a pasta da data e hora reais de chegada. 
  • Certifique-se de que os dados na pasta h=late sejam consumidos. Eles não estão contidos em nenhuma outra pasta.
  • Pasta _temporary: Em alguns casos, geramos uma pasta temporária (temporary) dentro de uma pasta h. Desconsidere pastas e subpastas temporárias. Exemplo: /t=impressions/dt=2021-04-11/h=18/_temporary.
  • Atenção:
    • Os relatórios de dados brutos com atualização diária de dados são armazenados na pasta h=23. O relatório de desinstalação geralmente está na pasta h=2, mas pode estar em qualquer pasta. 
    • Os relatórios de cohort e incrementalidade são armazenados diretamente na pasta dt. 
    • Os relatórios versionados seguem uma convenção diferente descrita nesta seção. 

Considerações sobre o relatório por hora para aplicativos que não usam o horário UTC.

Para garantir que você obtenha todos os dados de um determinado dia do calendário, você deve consumir as pastas de acordo com o dia definido pelo fuso horário do aplicativo conforme detalhado: 

  • Fuso horário do hemisfério leste: Para obter todos os dados de uma determinada data do calendário, você deve consumir pastas de acordo com o horário e a data UTC. Exemplo: o fuso horário do seu aplicativo é UTC+10 (Sydney, Austrália). Para obter todos os dados horários relacionados à terça-feira (Sydney), você deve consumir as seguintes pastas: Segunda-feira h=14–23 e tarde, Terça-feira h=0–13 e 14-15 Por que você deve consumir Terça-feira h=14-15? Alguns dados podem chegar atrasados. Portanto, as pastas h=14—15 podem conter eventos que chegam atrasados. Você deve filtrar event_time para alinhar com o dia do calendário do aplicativo em relação a UTC.
  • Fuso horário do hemisfério oeste: Para obter todos os dados de uma determinada data do calendário, você deve consumir pastas de acordo com o horário e a data UTC. Exemplo: o fuso horário do seu aplicativo é UTC-7 (Los Angeles). Para obter todos os dados horários relacionados a terça-feira (Los Angeles), você deve acessar as seguintes pastas: Terça-feira h=7–23 e tarde, Quarta-feira h=0–6 e 7-8. Por que você deve consumir quarta-feira h=7-8? Alguns dados podem chegar atrasados. Portanto, as pastas h=7—8 podem conter eventos que chegam atrasados. Você deve filtrar event_time para alinhar com o dia do calendário do aplicativo em relação a UTC.

Pastas versionadas

Alguns relatórios têm uma opção versionada Isso significa que os dados mais atualizados para um determinado dia são fornecidos várias vezes. Como os dados podem continuar a ser atualizados devido a dados que chegam atrasados ou dados mais precisos, o mesmo relatório tem várias versões em que a versão mais recente é a mais precisa.  

Os relatórios de um determinado dia estão contidos na pasta de versões daquele dia. Cada versão está contida em uma pasta separada cujo nome é definido usando um carimbo de data/hora Epoch que identifica exclusivamente o relatório.  

Seus processos de importação de dados devem considerar que os dados podem ser gravados retroativamente. Por exemplo, em 14 de janeiro, os dados podem ser gravados na pasta 1º de janeiro. Se o bucket for de sua propriedade, considere usar a notificação de serviço de nuvem para acionar o processo de importação (AWS  | GCS)

Segregação de aplicativos

Para armazenamento em bucket na nuvem, os dados são fornecidos em arquivos de dados unificados contendo os dados de todos os aplicativos selecionados ou segregados em pastas por aplicativo. A segregação está dentro da pasta h, conforme descrito na tabela a seguir.

Tipo de segregação Descrição 
[Padrão] Unificado

Os dados de todos os aplicativos são fornecidos em arquivos de dados unificados. Ao consumir os dados, use o campo app_id no nível da linha para distinguir entre aplicativos.

Exemplo de arquivos de dados estão na pasta h=2

UnifiedByApp.png

A convenção de nomenclatura de arquivos de dados é unique_id.gz.

  • Seu processo de carregamento de dados deve: 
    • Carregar dados depois que a flag _SUCCESS for definida.
    • Carregar todos os arquivos na pasta que tenham uma extensão .gz Não desenvolva seu processo de importação usando lógica de numeração de part.  
Segregado por aplicativo

A pasta contém subpastas por aplicativo. Os arquivos de dados de um determinado aplicativo estão contidos na pasta do aplicativo. Na figura a seguir, a pasta h=19 contém pastas de aplicativos. Cada pasta do aplicativo contém os arquivos de dados associados. Atenção! Os arquivos de dados não contêm o app_id, você deve determinar o app_id usando a pasta.  

DLSegregateByApp.png

Em cada pasta do aplicativo, a convenção de nomenclatura é unique_id.gz:  

  • Seu processo de carregamento de dados deve: 
    • Carregar dados depois que a flag _SUCCESS for definida.
    • Carregar todos os arquivos na pasta que tenham uma extensão .gz Não desenvolva seu processo de importação usando lógica de numeração de part.  

Limitação: essa opção não está disponível para relatórios de People-Based Attribution.

Arquivos de dados

Os arquivos de dados dependem do tipo de segregação.

Conteúdo Detalhes
Flag de conclusão

A última flag de arquivo (conclusão) é definida quando todos os dados de uma determinada pasta h tiverem sido gravados.  

  • Não leia dados em uma pasta antes de verificar se a flag _SUCCESS existe.
  • A flag _SUCCESS é definida mesmo nos casos em que não há dados para gravar em uma determinada pasta e a pasta está vazia. 
  • Atenção! Na opção segregação por aplicativo, a flag é definida na pasta h e não nas pastas individuais do aplicativo. Consulte as figuras na seção anterior.  
Tipos de arquivo
  • Os dados são fornecidos em arquivos compactados Snappy ou GZIP, ou arquivos não compactados, com formato Parquet ou CSV.
  • Depois de descompactar, os arquivos de dados estarão no formato Parquet ou CSV de acordo com suas configurações.
Sequência de colunas (arquivos CSV)  

No caso de arquivos CSV, a sequência de campos nos relatórios é sempre a mesma. Quando adicionamos novos campos, eles são adicionados à direita dos campos existentes. 

Sobre isso:  

  • A estrutura de colunas dos relatórios de jornada do usuário é idêntica. Isso significa que você pode ter procedimentos de carregamento de dados semelhantes para diferentes tipos de relatório. Você seleciona os campos contidos nos relatórios. O significado do campo está detalhado no dicionário de dados brutos
  • Os relatórios que têm uma indicação de FF na seção de disponibilidade do relatório não aderem à estrutura de coluna comum.  
Considerações sobre o preenchimento de campos

Campos em branco ou vazios: Alguns campos são preenchidos com null ou estão vazios. Isso significa que, no contexto de um certo relatório, não há dados a reportar. Em geral, null significa que esse campo não é preenchido no contexto de um determinado relatório e tipo de aplicativo. "Em branco" significa que o campo é relevante em seu contexto, mas nenhum dado foi encontrado para preenchê-lo.  

No caso da fonte de mídia restrita, o conteúdo dos campos restritos é definido como nulo.  

No geral, considere null e em branco como a mesma coisa. Não há dados disponíveis.  

Fuso horário e moeda

As configurações de fuso horário e moeda específicas do aplicativo não afetam os dados gravados no Data Locker. O seguinte se aplica:  

  • Fuso horário: As datas e horas estão em UTC.
  • Moeda: o campo event_revenue_usd está em USD. 

Valores com vírgulas: As vírgulas estão contidas entre aspas duplas ", por exemplo,`"iPhone6,1"`.

Opções de armazenamento

Cuidado!

Se você estiver usando a opção de armazenamento própria do profissional de marketing:  

  • Verifique se você está em conformidade com os regulamentos de privacidade de dados, como a GDPR e políticas de retenção de dados de ad network/SRN.
  • Não use a solução de armazenamento própria para enviar dados a terceiros.  
  • Os dados são registrados em um proprietário de armazenamento de sua escolha da seguinte forma:
    • Armazenamento da AppsFlyer
    • Armazenamento do cliente — AWS, GCS, Azure, Yandex, BigQuery e Snowflake
  • Você pode alterar a seleção de armazenamento a qualquer momento.
  • Se você alterar o armazenamento, acontecerá o seguinte:
    • Começamos a registrar no armazenamento recém-selecionado dentro de uma hora.
    • Continuamos registrando no armazenamento existente durante um período de transição de 7 dias. O tempo de expiração do período de transição é exibido na interface do usuário. Use o período de transição para atualizar seus processos de carregamento de dados. Você pode reiniciar o período de transição ou reverter para o bucket da AppsFlyer, se necessário. 
    • Mudança de armazenamento: você pode migrar de uma opção de armazenamento para outra usando a opção de multi-armazenamento e enviando dados para múltiplos destinos simultaneamente. Uma vez concluídos a migração e os testes, exclua a opção de armazenamento de que você não precisa mais.  
  Armazenamento de propriedade da AppsFlyer (AWS)   Armazenamento de propriedade do profissional de marketing (GCS, AWS, Azure, Yandex, BigQuery, Snowflake)
Nome do bucket Definido pela AppsFlyer
  • GCS: Sem restrição
  • AWS: Configurado por você. Deve ter o prefixo af-.

Exemplo: af-datalocker-your-bucket-name

Propriedade de armazenamento AppsFlyer Profissional de marketing
Plataforma de armazenamento AWS AWS, GCS, Azure, Yandex, BigQuery, Snowflake
Credenciais para acessar os dados Disponível na interface de usuário do Data Locker para os administradores da sua conta da AppsFlyer Não conhecido pela AppsFlyer. Use as credenciais fornecidas pelo provedor da nuvem.
Retenção de dados Os dados são excluídos após 14 dias Responsabilidade do profissional de marketing
Solicitações de exclusão de dados Responsabilidade da AppsFlyer Responsabilidade do profissional de marketing
Segurança A AppsFlyer controla o armazenamento. O cliente tem acesso de leitura.

O profissional de marketing controla o armazenamento

  • AWS: A AppsFlyer requer a permissão getObject, ListBucket, DeleteObject, PutObject para o bucket. O bucket deve ser dedicado ao uso da AppsFlyer. Não o use para outros fins.
  • GCS: Consulte o artigo de configuração do GCS.
Capacidade de armazenamento Gerenciado pela AppsFlyer Gerenciado pelo profissional de marketing
Controle de acesso usando endpoints VPC com políticas de bucket Não aplicável [Opcional] No AWS, se você implementar a segurança de endpoint VPC no nível do bucket, será necessário dar permissão aos servidores da AppsFlyer.  

Aviso aos agentes de segurança no caso de armazenamento controlado pelo cliente

Considere:

  • O bucket ou destino é de uso exclusivo da AppsFlyer. Não deve haver outra entidade envolvida em um determinando destino.
  • Você pode excluir dados no destino 25 horas após gravarmos os dados.
  • Os dados que gravamos no destino são uma cópia dos dados que já estão em nossos servidores. Os dados continuam em nossos servidores de acordo com nossa política de retenção. 
  • Por razões técnicas, às vezes deletamos e reescrevemos os dados. Por isso, precisamos de permissões de exclusão e listagem. Nenhuma permissão é um risco de segurança para você. No caso da lista, somos a única entidade escrevendo no bucket. No caso de exclusão, podemos regenerar os dados.
  • Para informações adicionais, você pode entrar em contato com nossa equipe de segurança através do e-mail hello@appsflyer.com ou do seu CSM.    

Princípios de conexões múltiplas (mais de um destino)

No Data Locker você pode enviar alguns ou todos os seus dados para dois destinos (definidos nas configurações de conexão). Por exemplo, você pode enviar dados do App A para AWS, e dados do App B para GCS.

Cada conexão consiste em um conjunto completo de configurações do Data Locker, incluindo um destino. As configurações de conexão são independentes umas das outras.

Ao administrar suas conexões, considere:

  • Nas configurações do Data Locker, as conexões são mostradas em abas. Cada conexão tem sua própria aba de configuração a partir da qual você pode gerenciar a conexão. O ícone de cada aba representa o tipo de armazenamento.
  • Para ver os detalhes da conexão, duplicar uma conexão, ou excluir uma conexão, clique em ⋮ (opções).

Informações adicionais

Acompanhe alterações de conexão no log de auditoria

Você pode visualizar as alterações de conexão do Data Locker no log de auditoria, disponível no centro de segurança no dashboard da AppsFlyer. Use o log de auditoria para confirmar se uma alteração foi feita, quando ela ocorreu e quem a fez. Isso pode ajudar a resolver problemas como dados ausentes ou mudanças inesperadas de conexão, sem que você precise entrar em contato com o suporte.

Você pode acompanhar os seguintes eventos:

  • Nova conexão criada
  • Conexão atualizada
  • Conexão desativada
  • Conexão excluída

Para acessar o log de auditoria:

  1. Na barra de navegação superior, abra o menu da conta em HQ1 2025-05-05 10.48.04.png.
  2. Selecione Centro de segurança.
  3. Na seção do log de auditoria, clique em Ver log de auditoria.
  4. Filtrar por serviço: Datalocker para ver entradas relacionadas.

Para mais informações, consulte: Log de auditoria

Características e Limitações

Características Observações 
Ad networks Não deve ser usado por ad networks
Agências Não deve ser usado por agências
Fuso horário específico do aplicativo Não aplicável. As pastas do Data Locker são divididas em horas usando UTC. Os eventos reais contêm horários em UTC. Você pode converter os horários para qualquer outro fuso horário conforme necessário. Independentemente do fuso horário do aplicativo, o atraso da ocorrência do evento até que seja registrado no Data Locker permanece o mesmo.
Moeda específica do aplicativo  Indisponível
Limitações de tamanho Não aplicável
Atualização dos dados Os dados são atualizados de acordo com a atualização específica dos dados do relatório, detalhada neste artigo.  
Histórico de dados Indisponível. Se você precisar do histórico de dados, alguns relatórios, mas não todos, oferecem essa opção por meio da Pull API.
Dados restritos Os campos em alguns relatórios são restritos devido a limitações de privacidade. Saiba mais
Acesso do usuário Somente usuários da conta com as permissões necessárias podem configurar o Data Locker.  
Aplicativo único/múltiplos aplicativos Suporte para múltiplos aplicativos. O Data Locker funciona no nível da conta
Máximo de conexões Por padrão, cada conta pode ter até 2 conexões do Data Locker. Para solicitar conexões adicionais, entre em contato com seu CSM.

Resolução de problemas

  • Sintoma: não é possível recuperar dados usando o AWS CLI
  • Mensagem de erro: ocorreu um erro (AccessDenied) ao chamar a operação ListObjectsV2: Acesso negado.
  • Causa: as credenciais AWS que estão sendo usadas não são as credenciais corretas para o bucket da AppsFlyer. Isso pode ser causado por ter credenciais múltiplas ou inválidas no seu dispositivo. 
  • Solução:
    1. Use um método diferente, como Cyberduck para acessar o bucket, ou seja, não a CLI. Faça isso para verificar se as credenciais que você está usando estão funcionando. Se você conseguir se conectar usando o Cyberduck, isso indica um problema no cache das credenciais. 
    2. Atualize o cache de credenciais do AWS.
      Captura de tela do AWSmceclip0.png

Recuperação de dados do AWS

Use sua ferramenta de recuperação de dados de AWS preferida, a AWS CLI ou uma das ferramentas descritas nas seções a seguir. Atenção! As instruções exatas são adequadas para buckets de propriedade da AppsFlyer. Ajuste as instruções conforme necessário se você estiver se conectando ao seu bucket.  

CLI da AWS

Antes de começar:

  • Instale o CLI da AWS no seu computador.
  • Na AppsFlyer, acesse o Data Locker e recupere as informações contidas no painel de credenciais.

Para usar o AWS CLI:

  1. Abra o terminal. Para fazer isso no Windows, <Windows> + <R>, clique em OK.
    A janela da linha de comando é aberta.
  2. Digite aws configure.
  3. Digite a Chave de acesso da AWS como aparece no painel de credenciais.
  4. Digite sua chave secreta da AWS conforme aparece no painel de credenciais.
  5. Digite eu-west-1.
  6. Clique em Enter (None).

Use os comandos da CLI a seguir, conforme necessário.

Nos comandos a seguir, o valor de {home-folder} pode ser encontrado

Para listar pastas em seu bucket:

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/

Para listar arquivos e pastas

Há três tipos de pastas no seu repositório do Data Locker:

  • Tipo de relatório t=
  • Data dt=
  • Hora h=

Para listar todos os relatórios de um tipo de relatório específico:

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/

Para listar todos os relatórios de um tipo de relatório específico para um dia específico:

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17

Para listar todos os relatórios de um relatório específico, em uma hora específica de um dia específico:

aws s3 ls s3://af-ext-reports/{home-folder}/data-locker-hourly/t=installs/dt=2019-01-17/h=23

Para fazer o download de arquivos de uma data específica:


aws s3 cp s3://af-ext-reports/<home-folder>/data-locker-hourly/t=installs/dt=2020-08-01/h=9/part-00000.gz ~/Downloads/

Cyberduck

Antes de começar:

  • Instale o cliente Cyberduck.
  • Na AppsFlyer, acesse o Data Locker e recupere as informações contidas no painel de credenciais.

Para configurar o Cyberduck:

  1. No Cyberduck, clique em Action.
  2. Selecione New Bookmark. A janela será aberta.
  3. No primeiro campo (marcado como [1] na captura de tela abaixo) selecione Amazon S3. DataDuckSmall2.png
  4. Preencha os campos da seguinte maneira:
    • Nickname: texto livre
    • Server: s3.amazonaws.com
    • Access Key ID: copie a chave de acesso da AWS como ela aparece no painel de credenciais na AppsFlyer
    • Secret Access Key: copie a chave secreta do bucket conforme ela aparece no painel de credenciais da AppsFlyer.
    • Path: {Nome do bucket}/{pasta Home} Por exemplo: af-ext-reports/1234-abc-ffffffff
  5. Feche a janela. Para fazer isso, clique no X no canto superior direito da janela.
  6. Selecione a conexão.
    Os diretórios de dados são exibidos.

Navegador Amazon S3

Antes de começar:

  • Instale o navegador Amazon S3.
  • Na AppsFlyer, acesse o Data Locker e recupere as informações contidas no painel de credenciais.

Para configurar o navegador Amazon S3:

  1. No navegador S3, clique em Accounts > Add New Account.
    A janela Add New Account é aberta. mceclip0.png
  2. Preencha os campos da seguinte maneira:
    • Account Name: texto livre.
    • Access Key ID: copie a chave de acesso da AWS conforme exibida no painel de credenciais. 
    • Secret Access Key: copie a Chave Secreta do bucket conforme ela aparece no painel de credenciais.
    • Selecione Encrypt Access Keys com uma senha e insira uma senha. Anote essa senha.
    • Selecione Use secure transfer. 
  3. Clique em Save changes.
  4. Clique em Buckets > Add External Bucket.
    A janela Add External Bucket é aberta.
    mceclip2.png
  5. Digite o nome do bucket. O nome do bucket tem o seguinte formato: {Nome do Bucket}/{Pasta Home}. Os valores necessários para o nome do bucket e a pasta Home aparecem na janela de credenciais. 
  6. Clique em adicionar bucket externo. O bucket é criado e é exibido no painel esquerdo da janela.
    Agora você pode acessar os arquivos do Data Locker.