Data Locker para partners

De un vistazo: Data Locker para partners (redes de publicidad y agencias) entrega los datos de la aplicación al almacenamiento del partner en AWS, GCS o BigQuery.

6133DataLockerForPartners.png

Data Locker para partners

Data Locker para partners entrega los datos de la aplicación al almacenamiento en la nube. Los anunciantes establecen los permisos que permiten que AppsFlyer comparta los datos seleccionados con un partner determinado. 

Características de Data Locker

Característica Descripción
Opciones de almacenamiento (nube)

Almacenamiento (bucket) de tu propiedad en:

  • AWS 
  • GCS
  • Yandex
  • BigQuery

Acerca de las opciones de almacenamiento

Soporte de múltiples aplicaciones

Soporta los datos de las aplicaciones que tengas integradas. El anunciante debe dar permiso por cada reporte para que puedas obtener los datos. 

Opciones de formato de datos
  • Para el almacenamiento en un bucket en la nube:
    • CSV
    • PARQUET
    • Adobe
  • Almacén de datos
Actualización de los datos

La actualización depende del tipo de reporte:

  • Cada hora: datos generados continuamente
  • Diaria: algunos reportes se preparan diariamente y están listos al día siguiente

Reportes disponibles para partners

Los reportes disponibles y los permisos necesarios para obtener los reportes varían según el tipo de partner. Sin embargo, el mecanismo de Data Locker, las opciones de almacenamiento y los ajustes necesarios son los mismos independientemente del tipo de partner. Consulta los artículos por tipo de partner que se indican a continuación: 

Arquitectura de almacenamiento de datos

Información general

Los datos se escriben en la opción de almacenamiento seleccionada. Puedes alternar entre las opciones en cualquier momento. El cambio entrará en vigor en el transcurso de unas horas. 

Los datos del almacenamiento en el bucket en la nube están organizados en una estructura jerárquica de carpetas, según el tipo de reporte, la fecha y la hora. La siguiente figura contiene un ejemplo de esta estructura:

DLFolderOVerview.png

Los datos de un reporte determinado están incluidos en las carpetas de horas (h) asociadas con ese reporte.

  • La cantidad de carpetas de horas depende de si el reporte se transmite por hora o por día.
  • Los datos se proporcionan en archivos comprimidos Snappy o GZIP, o en archivos sin comprimir, que tienen formato Parquet o CSV.
  • Los archivos de datos constan de columnas (campos).
  • La estructura de columnas se define por tipo de reporte. 

Estructura de carpetas

Carpeta Descripción 
data-locker-hourly

DLHourly.png

  • La carpeta de nivel superior del bucket depende del proveedor del almacenamiento.
  • La carpeta data-locker-hourly contiene los temas de los reportes. 

Ejemplos de estructura de carpetas en función del propietario del bucket y el proveedor de la nube:

  • Tu bucket de AWS: <af-datalocker-your bucket prefix>/<generated-home-folder><subscription-id>
  • Tu bucket de GCS: <your bucket name>/<generated-home-folder>/<subscription-id>
t (topic) El tipo de reporte se relaciona con el asunto del reporte. 
dt (date)

Esta es la fecha de los datos. En la mayoría de los casos, esto significa la fecha en que ocurrió el evento. 

h (hour)

Las carpetas h se refieren al momento en que AppsFlyer recibió los datos. Por ejemplo, los eventos de instalación recibidos entre las 14:00 y 15:00 UTC se transmiten al archivo h=14. Nota: Hay una demora, de aproximadamente 6 horas, entre el momento en que los datos llegan a AppsFlyer hasta que la carpeta h se transmite a Data Locker. Por ejemplo, la carpeta h=14 se transmite seis horas más tarde a las 23:00 UTC. 

Características de la carpeta:

  • Hay carpetas de 24 h numeradas del 0 al 23. Por ejemplo, h=0, h=1, etc. 
  • Además, la carpeta late (tarde) contiene eventos del día anterior que llegaron después de la medianoche (es decir que llegaron entre las 00:00–02:00 UTC del día siguiente). Por ejemplo, un usuario instala una aplicación el lunes a las 08:00 y el evento llega el martes a la 01:00, el evento se registra en la carpeta late del lunes. 
  • Los datos que llegan después de las 02:00 se registran en la carpeta de la fecha y hora de llegada real. 
  • Debes utilizar los datos de la carpeta late. Estos datos no se encuentran en ninguna otra carpeta. 
  • _temporary folder: En algunos casos, generamos una carpeta temporary (temporal) dentro de una carpeta h. Ignora la carpeta temporary y sus subcarpetas. Ejemplo: /t=impressions/dt=2021-04-11/h=18/_temporary.
Datos unificados

Los datos de todas las aplicaciones se proporcionan en archivos de datos unificados. Al cargar los datos, utiliza el campo app_id a nivel de fila para distinguir entre aplicaciones.

Ejemplos de archivos de datos que están en la carpeta h=2

UnifiedByApp.png

  • En tu proceso de carga de datos, asegúrate de que:
    • Los datos se procesan solo después de que se configura el indicador _SUCCESS.
    • Cargas todos los archivos que tienen una extensión .gz.
Indicador de finalización

El indicador de último archivo (finalización) se establece cuando se han escrito todos los datos de una carpeta h determinada. 

  • No leas datos en una carpeta antes de verificar que tiene el indicador _SUCCESS.

  • El indicador _SUCCESS se establece incluso en los casos en los que no se escriben datos en la carpeta. Significa que la carpeta está vacía.

Compresión

Los archivos se comprimen con gz. Después de descomprimirlos:

  • Los archivos no tienen extensión.
  • Cada archivo tiene una fila de encabezado que contiene los nombres de las columnas (campo). 
Secuencia de columnas

La secuencia de campos en los reportes es siempre la misma. Los nuevos campos se agregan a la derecha de los campos existentes. 

Las definiciones de las columnas (campos) se definen por reporte. Consulta el artículo del reporte correspondiente para obtener la descripción. 

Consideraciones del relleno de campos

Campos en blanco o vacíos: algunos campos se rellenan con null o están vacíos. Esto significa que en el contexto de un reporte determinado no hay datos para reportar. Normalmente, null (nulo) significa que este campo no se completa en el contexto de un reporte y tipo de aplicación determinados. Un campo en blanco "" significa que el campo es relevante en su contexto, pero no se encontraron datos para completarlo. 

Zona horaria y divisa:

Los ajustes de zona horaria y divisa específicos de la aplicación no se tienen en cuenta para los datos proporcionados por Data Locker. Así pues: 

  • Zona horaria: los datos de fecha y hora están en UTC.
  • Divisa: el campo event_revenue_usd está en USD.

Valores con coma: estas comas se encuentran entre comillas dobles `"`, por ejemplo, `"iPhone6,1"`.

Archivos de datos

Los archivos de datos dependen del tipo de segregación.

Contenido Detalles
Indicador de finalización

El indicador de último archivo (finalización) se establece cuando se han escrito todos los datos de una carpeta h determinada. 

  • No leas datos en una carpeta antes de verificar que tiene el indicador _SUCCESS.

  • El indicador _SUCCESS se configura incluso en los casos en que no hay datos para escribir en una carpeta determinada y la carpeta está vacía. 

  • Nota: En la opción de segregación por aplicación, el indicador se configura en la carpeta h y no en las carpetas individuales de las aplicaciones. Consulta las figuras de la sección anterior. 
Tipos de archivo
  • Los datos se proporcionan en archivos comprimidos Snappy o GZIP, o en archivos sin comprimir, que tienen formato Parquet o CSV.
  • Después de descomprimir, los archivos de datos están en formato Parquet o CSV de acuerdo con tu configuración.
Secuencia de columnas (archivos CSV) 

En el caso de los archivos CSV, la secuencia de campos en los reportes es siempre la misma. Cuando agregamos campos nuevos, estos se agregan a la derecha de los campos existentes. 

En este sentido: 

  • La estructura de columnas de los reportes de trayectoria del usuario es idéntica. Esto significa que puedes tener procedimientos de carga de datos similares para diferentes tipos de reportes. Selecciona los campos contenidos en los reportes. El significado del campo se detalla en el diccionario de raw data
  • Los reportes que tienen una notación FF en la sección de disponibilidad del reporte no se adhieren a la estructura de columnas común. 
Consideraciones del relleno de campos

Campos en blanco o vacíos: algunos campos se rellenan con null o están vacíos. Esto significa que en el contexto de un reporte determinado no hay datos para reportar. Normalmente, null (nulo) significa que este campo no se completa en el contexto de un reporte y tipo de aplicación determinados. Blank "" (en blanco) significa que el campo es relevante en su contexto, pero no se encontraron datos para completarlo. 

Si la fuente de medios está restringida, el contenido de los campos restringidos se establece en nulo. 

En general, se considera nulo y en blanco como un único producto; no hay datos disponibles. 

Zona horaria y moneda

La configuración de la zona horaria y divisa específicas de la aplicación no afecta los datos en Data Locker. Aplican las siguientes condiciones: 

  • Zona horaria: los datos de fecha y hora están en UTC.
  • Divisa: el campo event_revenue_usd está en USD.

Valores con coma: estas comas se encuentran entre comillas dobles `"`, por ejemplo, `"iPhone6,1"`.

Opciones de almacenamiento

  • Los datos se escriben en un propietario de almacenamiento de tu elección de: AWS, GCS y BigQuery.
  • Puedes cambiar la selección del almacenamiento en cualquier momento.
  • Si cambias el almacenamiento, ocurre lo siguiente:
    • Comenzamos a escribir en el almacenamiento recién seleccionado en una hora.
    • Seguimos escribiendo en el almacenamiento existente durante un período de transición de 7 días. El tiempo de vencimiento del período de transición se muestra en la interfaz de usuario. Usa el período de transición para actualizar tus procesos de carga de datos. 
    • Cambio de buckets: si cambias el almacenamiento, los datos se envían a ambos durante un período de transición de 7 días, lo que te permite alinear tu proceso de consumo de datos. 
  Almacenamiento propio del partner (GCS, AWS, BigQuery)
Nombre del bucket
  • GCS: Sin restricción
  • AWS: Configurado por ti. Debe tener el prefijo af-.

Ejemplo: af-datalocker-tu-nombre-de-bucket

Propietario de almacenamiento Partner 
Plataforma del almacenamiento AWS, GCS, Yandex, BigQuery
Credenciales para que accedas a los datos AppsFlyer no las conoce. Usa las credenciales proporcionadas por el proveedor de almacenamiento.
Retención de datos Controlada por ti
de la nube

Tú controlas el almacenamiento. 

  • AWS: AppsFlyer requiere permiso de GetObject, ListBucket, DeleteObject, PutObject para el bucket. El uso del bucket debe ser exclusivo de AppsFlyer. No lo uses para otros fines.
  • GCS

Aviso a los responsables de seguridad

Ten en cuenta lo siguiente: 

  • El bucket o destino es para uso exclusivo de AppsFlyer. No debe haber ninguna otra entidad que escriba en el bucket.
  • Puedes eliminar datos del bucket 25 horas después de que escribamos los datos.
  • Los datos escritos en el destino son una copia de los datos que ya están en nuestros servidores. Los datos continúan estando en nuestros servidores de acuerdo con nuestra política de retención. 
  • Por motivos técnicos, a veces necesitamos eliminar y reescribir los datos. Por esta razón, requerimos permisos de lista y eliminación. Ni la lista ni la eliminación son riesgos de seguridad para ti. En el caso de la lista, somos la única entidad que escribe en el bucket. En el caso de la eliminación, podemos volver a generar los datos. 

Principios de conexión múltiple (más de un destino)

En Data Locker puedes enviar algunos o todos tus datos a más de un destino (definido en la configuración de la conexión). Por ejemplo, puedes enviar los datos de la aplicación A a AWS y los de la aplicación B a GCS.

Cada conexión consiste en un conjunto completo de configuraciones de Data Locker, incluido un destino. Las configuraciones de las conexiones son independientes entre sí.

Al administrar tus conexiones, ten en cuenta lo siguiente:

  • En la configuración de Data Locker, las conexiones se muestran en pestañas. Cada conexión tiene su propia pestaña de configuración desde la que puedes administrar la conexión. La pestaña predeterminada es "Data Locker".
  • Para agregar una conexión nueva:
    1. Haz clic en Agregar conexión.
    2. Proporciona un nombre para la conexión y elige el tipo de almacenamiento.
    3. Haz clic en Guardar.Una vez guardada, la conexión se muestra junto a la pestaña predeterminada "Data Locker". El icono de cada pestaña representa el tipo de almacenamiento.
  • Para ver los detalles de la conexión, duplicar una conexión o eliminar una conexión, haz clic en : (opciones).

Procedimientos

Configurar el Data Locker

Usa este procedimiento para configurar Data Locker. Los cambios en la configuración surten efecto en 3 horas. 

Requisito previo:

Completa uno o más de los siguientes procedimientos de almacenamiento:

AppsFlyerAdmin_us-en.png Para configurar el Data Locker:

  1. Inicia sesión en tu panel de control de partners de AppsFlyer.
  2. Ve a:
    • Anunciantes: Reporte > Data Locker.
    • Partners de marketing: haz clic en el menú de la cuenta > Data Locker.
  3. Sigue los pasos 3-16 de las instrucciones de configuración de Data Locker.

Información adicional

Rasgos y limitaciones

Característica Observaciones 
Zona horaria específica de la aplicación No corresponde
Moneda específica de la aplicación  No se admite
Limitaciones de tamaño No correponde
Actualización de los datos Los datos se actualizan de acuerdo con la actualización específica de los datos del reporte que se detalla en este artículo.
Historial de datos

No se admite

Acceso de miembros del equipo Los miembros del equipo no pueden configurar Data Locker. 

Resolución de Problemas