Data Locker para partners

En resumen: Data Locker para partners (ad networks y agencias) entrega los datos de la aplicación al almacenamiento del partner en AWS, GCS o BigQuery.

6133DataLockerForPartners.png

Data Locker para partners

Data Locker para partners entrega los datos de la aplicación al almacenamiento en la nube. Los anunciantes establecen los permisos que permiten que AppsFlyer comparta los datos seleccionados con un partner determinado.  

Características de Data Locker

Característica Descripción
Opciones de almacenamiento (nube)

Almacenamiento (bucket) de tu propiedad en:

  • AWS 
  • GCS
  • Yandex
  • BigQuery

Sobre las opciones de almacenamiento

Soporte de múltiples aplicaciones

Soporta los datos de las aplicaciones que tengas integradas. El anunciante debe dar permiso por cada reporte para que puedas obtener los datos.  

Opciones de formato de datos
  • Para el almacenamiento en un bucket en la nube:
    • CSV
    • Parquet
    • Adobe
  • Almacén de datos
Actualización de los datos

La actualización depende del tipo de reporte:

  • Por hora: Datos generados continuamente
  • A diario: Algunos reportes se preparan diariamente y están listos al día siguiente

Reportes disponibles para partners

Los reportes disponibles y los permisos necesarios para obtener los reportes varían según el tipo de partner. Sin embargo, el mecanismo de Data Locker, las opciones de almacenamiento y los ajustes necesarios son los mismos independientemente del tipo de partner. Consulta los artículos por tipo de partner que se indican a continuación:  

Arquitectura de almacenamiento de datos

Descripción general

Los datos se escriben en la opción de almacenamiento seleccionada. Puedes alternar entre las opciones en cualquier momento. El cambio entrará en vigor en el transcurso de unas horas.  

Los datos del almacenamiento en el bucket en la nube están organizados en una estructura jerárquica de carpetas, según el tipo de reporte, la fecha y la hora. La siguiente figura contiene un ejemplo de esta estructura:

DLFolderOVerview.png

Los datos de un reporte determinado están incluidos en las carpetas de horas (h) asociadas con ese reporte.

  • La cantidad de carpetas de horas depende de si el reporte se transmite por hora o por día.
  • Los datos se proporcionan en archivos comprimidos Snappy o GZIP, o en archivos sin comprimir, que tienen formato Parquet o CSV.
  • Los archivos de datos constan de columnas (fields).
  • La estructura de columnas se define por tipo de reporte.  

Estructura de carpetas

Carpeta Descripción 
data-locker-hourly

DLHourly.png

  • La carpeta de nivel superior del bucket depende del proveedor del almacenamiento.
  • La carpeta data-locker-hourly contiene los temas de los reportes. 

Ejemplos de estructura de carpetas en función del propietario del bucket y el proveedor de la nube:

  • Tu bucket de AWS: <af-datalocker-your bucket prefix>/<generated-home-folder><subscription-id>
  • Tu bucket de GCS: <your bucket name>/<generated-home-folder>/<subscription-id>
t (topic) El tipo de reporte se relaciona con el asunto del reporte.  
dt (date)

Esta es la fecha de los datos. En la mayoría de los casos, esto significa la fecha en que ocurrió el evento.  

h (hour)

Las carpetas h se refieren al momento en que AppsFlyer recibió los datos. Por ejemplo, los eventos de instalación recibidos entre las 14:00 y 15:00 UTC se transmiten al archivo h=14. ¡Nota! Hay una demora, de aproximadamente 6 horas, entre el momento en que los datos llegan a AppsFlyer hasta que la carpeta h se transmite a Data Locker. Por ejemplo, la carpeta h=14 se transmite seis horas más tarde a las 23:00 UTC.  

Características de la carpeta:

  • Hay carpetas de 24 h numeradas del 0 al 23. Por ejemplo, h=0, h=1, etc.  
  • Además, la carpeta “late” (tarde) contiene eventos del día anterior que llegaron después de la medianoche (es decir que llegaron entre las 00:00–02:00 UTC del día siguiente). Por ejemplo, un usuario instala una aplicación el lunes a las 08:00 y el evento llega el martes a la 01:00, el evento se registra en la carpeta “late” del lunes.  
  • Los datos que llegan después de las 02:00 se registran en la carpeta de la fecha y hora de llegada real.  
  • Debes utilizar los datos de la carpeta “late”. Estos datos no se encuentran en ninguna otra carpeta.
  • _temporary folder: En algunos casos, generamos una carpeta temporal dentro de una carpeta h. Desestimar carpetas y subcarpetas temporales. Ejemplo: /t=impressions/dt=2021-04-11/h=18/_temporary.
Datos unificados

Los datos de todas las aplicaciones se proporcionan en archivos de datos unificados. Al cargar los datos, utiliza el campo app_id a nivel de fila para distinguir entre aplicaciones.

Ejemplos de archivos de datos que están en la carpeta h=2

UnifiedByApp.png

  • En tu proceso de carga de datos, asegúrate de que:
    • Los datos se procesan solo después de que se configura el indicador _SUCCESS.
    • Cargas todos los archivos que tienen una extensión .gz.
Indicador de finalización

El indicador de último archivo (finalización) se establece cuando se han escrito todos los datos de una carpeta h determinada.  

  • No leas datos en una carpeta antes de verificar que tiene el indicador _SUCCESS.

  • El indicador _SUCCESS se establece incluso en los casos en los que no se escriben datos en la carpeta. Significa que la carpeta está vacía.

Compresión

Los archivos se comprimen con gz. Después de descomprimirlos:

  • Los archivos no tienen extensión.
  • Cada archivo tiene una fila de encabezado que contiene los nombres de las columnas (campo). 
Secuencia de columnas

La secuencia de campos en los reportes es siempre la misma. Los nuevos campos se agregan a la derecha de los campos existentes.  

Las definiciones de las columnas (campos) se definen por reporte. Consulta el artículo del reporte correspondiente para obtener la descripción.  

Consideraciones del relleno de campos

Campos en blanco o vacíos: Algunos campos se completan con null o están vacíos. Esto significa que en el contexto de un reporte determinado no hay datos para reportar. Normalmente, null (nulo) significa que este campo no se completa en el contexto de un reporte y tipo de aplicación determinados. Blank "" (en blanco) significa que el campo es relevante en su contexto, pero no se encontraron datos para completarlo.  

Zona horaria y divisa:

Los ajustes de zona horaria y divisa específicos de la aplicación no se tienen en cuenta para los datos proporcionados por Data Locker. Así pues: 

  • Zona horaria: La fecha y la hora están en UTC.
  • Moneda: El campo event_revenue_usd está en USD. 

Valores con comas: Estas comas están contenidas entre comillas dobles "", por ejemplo, `"iPhone6,1"`.

Archivos de datos

Los archivos de datos dependen del tipo de segregación.

Contenido Detalles
Indicador de finalización

El indicador de último archivo (finalización) se establece cuando se han escrito todos los datos de una carpeta h determinada.  

  • No leas datos en una carpeta antes de verificar que tiene el indicador _SUCCESS.

  • El indicador _SUCCESS se configura incluso en los casos en que no hay datos para escribir en una carpeta determinada y la carpeta está vacía.  

  • ¡Nota! En la opción de segregación por aplicación, el indicador se configura en la carpeta h y no en las carpetas individuales de las aplicaciones. Consulta las figuras de la sección anterior.  
Tipos de archivo
  • Los datos se proporcionan en archivos comprimidos Snappy o GZIP, o en archivos sin comprimir, que tienen formato Parquet o CSV.
  • Después de descomprimir, los archivos de datos están en formato Parquet o CSV de acuerdo con tu configuración.
Secuencia de columnas (archivos CSV)  

En el caso de los archivos CSV, la secuencia de campos en los reportes es siempre la misma. Cuando agregamos campos nuevos, estos se agregan a la derecha de los campos existentes. 

En este sentido:  

  • La estructura de columnas de los reportes del viaje del usuario es idéntica. Esto significa que puedes tener procedimientos de carga de datos similares para diferentes tipos de reportes. Selecciona los campos contenidos en los reportes. El significado del campo se detalla en el diccionario de raw data.  
  • Los reportes que tienen una notación FF en la sección de disponibilidad del reporte no se adhieren a la estructura de columnas común. 
Consideraciones del relleno de campos

Campos en blanco o vacíos: Algunos campos se completan con null o están vacíos. Esto significa que en el contexto de un reporte determinado no hay datos para reportar. Normalmente, null (nulo) significa que este campo no se completa en el contexto de un reporte y tipo de aplicación determinados. Blank "" (en blanco) significa que el campo es relevante en su contexto, pero no se encontraron datos para completarlo.  

Si la fuente de medios está restringida, el contenido de los campos restringidos se establece en null.  

En general, se considera null y blank como un único producto; no hay datos disponibles.  

Zona horaria y moneda

La configuración de la zona horaria y divisa específicas de la aplicación no afecta los datos en Data Locker. Aplican las siguientes condiciones:  

  • Zona horaria: La fecha y la hora están en UTC.
  • Moneda: El campo event_revenue_usd está en USD. 

Valores con comas: Estas comas están contenidas entre comillas dobles "", por ejemplo, `"iPhone6,1"`.

Opciones de almacenamiento

  • Los datos se escriben en un propietario de almacenamiento de tu elección de la siguiente manera: AWS, GCS y BigQuery.
  • Puedes cambiar la selección del almacenamiento en cualquier momento.
  • Si cambias el almacenamiento, ocurre lo siguiente:
    • Comenzamos a escribir en el almacenamiento recién seleccionado en una hora.
    • Seguimos escribiendo en el almacenamiento existente durante un período de transición de 7 días. El tiempo de vencimiento del período de transición se muestra en la interfaz de usuario. Usa el período de transición para actualizar tus procesos de carga de datos. 
    • Cambiando buckets: Si cambias el almacenamiento, los datos se envían a ambos durante un período de transición de 7 días, lo que te permite alinear tu proceso de consumo de datos.  
  Almacenamiento propio del partner (GCS, AWS, BigQuery)
Nombre del bucket
  • GCS: Sin restricción
  • AWS: Configurado por ti. Debe tener el prefijo af-.

Ejemplo: af-datalocker-your-bucket-name

Propietario de almacenamiento Partner 
Plataforma del almacenamiento AWS, GCS, Yandex, BigQuery
Credenciales para que accedas a los datos AppsFlyer no las conoce. Usa las credenciales proporcionadas por el proveedor de almacenamiento.
Retención de datos Controlada por ti
Seguridad

Tú controlas el almacenamiento.  

  • AWS: AppsFlyer requiere permiso de GetObject, ListBucket, DeleteObject, PutObject para el bucket. El uso del bucket debe ser exclusivo de AppsFlyer. No lo uses para otros fines.
  • GCS

Aviso a los responsables de seguridad

Consideración: 

  • El bucket o destino es para uso exclusivo de AppsFlyer. No debe haber ninguna otra entidad que escriba en el bucket.
  • Puedes eliminar datos del bucket 25 horas después de que escribamos los datos.
  • Los datos escritos en el destino son una copia de los datos que ya están en nuestros servidores. Los datos continúan estando en nuestros servidores de acuerdo con nuestra política de retención. 
  • Por razones técnicas, a veces eliminamos y reescribimos los datos. Por esta razón, requerimos permisos de eliminación y listado. Ni listar ni eliminar son un riesgo de seguridad para ti. En el caso de la lista, somos la única entidad que escribe en el bucket. En el caso de eliminar, podemos regenerar los datos.

Principios de conexión múltiple (más de un destino)

En Data Locker puedes enviar algunos o todos tus datos a más de un destino (definido en la configuración de la conexión). Por ejemplo, puedes enviar los datos de la aplicación A a AWS y los de la aplicación B a GCS.

Cada conexión consiste en un conjunto completo de configuraciones de Data Locker, incluido un destino. Las configuraciones de las conexiones son independientes entre sí.

Al administrar tus conexiones, ten en cuenta lo siguiente:

  • En la configuración de Data Locker, las conexiones se muestran en pestañas. Cada conexión tiene su propia pestaña de configuración desde la que puedes administrar la conexión. La pestaña predeterminada es "Data Locker".
  • Para agregar una conexión nueva:
    1. Haz clic en Agregar conexión.
    2. Proporciona un nombre para la conexión y elige el tipo de almacenamiento.
    3. Haz clic en Guardar.
      Una vez guardada, la conexión se muestra junto a la pestaña predeterminada "Data Locker". El icono de cada pestaña representa el tipo de almacenamiento.
  • Para ver los detalles de la conexión, duplicar una conexión o eliminar una conexión, haz clic en : (opciones).

Procedimientos

Configurar Data Locker

Usa este procedimiento para configurar Data Locker. Los cambios en la configuración tienen efecto en 3 horas. 

Requisito previo:

Completa uno o más de los siguientes procedimientos de almacenamiento:

AppsFlyerAdmin_us-en.png Para configurar Data Locker:

  1. Inicia sesión en tu dashboard de partner de AppsFlyer.
  2. Ve a:
    • Anunciantes: En AppsFlyer, desde la barra lateral, abre Exportar > Data Locker.
    • Partners de marketing: Haz clic en el menú de la cuenta > Data Locker.
  3. Sigue los pasos 3-16 de las Instrucciones de configuración de Data Locker.

Información adicional

Características y limitaciones

Característica Observaciones 
Zona horaria específica de la aplicación No corresponde
Moneda específica de la aplicación  No compatible
Limitaciones de tamaño No aplicable
Actualización de los datos Los datos se actualizan de acuerdo con la actualización específica de los datos del reporte que se detalla en este artículo.
Datos históricos

No compatible

Acceso de miembros del equipo Los miembros del equipo no pueden configurar Data Locker.  

Resolución de problemas