Data Clean Room: trabajar con fuentes

Premium

De un vistazo: Configura las fuentes de datos que subas a Data Clean Room (DCR) para el enriquecimiento con datos de atribución/eventos in-app y la creación de reportes de DCR.

Introducción

Muchos reportes de DCR están diseñados para hacer coincidir los datos de atribución/datos de eventos in-app con los datos de tus fuentes personalizadas. Este artículo contiene todo lo que necesitas saber sobre la configuración de fuentes personalizadas para su uso con DCR, incluido cómo:

Formato de la fuente

Formato de archivo

Los archivos de fuentes de datos cargados deben cumplir estos requisitos de denominación, formato de archivo y ubicación:

  • Deben cumplir con los requisitos de denominación de DCR
  • Formato CSV o GZIP. El archivo que se encuentra bajo la compresión GZIP debe ser un archivo CSV.
  • Número de archivos de fuentes de datos por carpeta de datos:
    • CSV: máximo 1
    • GZIP: máximo 1 archivo de una sola parte. Los archivos GZIP de varias partes son compatibles cuando se denominan de la siguiente manera: filename_part01.gzip, filename_part02.gzip, etc.

Formato de datos

Los datos de los archivos de origen deben cumplir estos requisitos:

  • Fecha y hora:
    • Formato: aaaa-MM-dd hh:mm:ss
    • Zona horaria: UTC
  • Números: máximo 2 dígitos después del punto decimal
  • Longitud de la cadena: máximo 256 caracteres
  • Limitaciones de caracteres:
    • Para los nombres de campo (encabezado de columna): sin espacios ni caracteres especiales
    • Todos los demás datos: sin limitaciones (todos los caracteres son válidos)

Crear una fuente

El proceso de creación de una fuente consiste en todos los pasos descritos a continuación. Se separan en pestañas simplemente para facilitar la lectura.

Sigue estos pasos para crear una fuente:

#1: Asignar un nombre a la fuente

  1. Ve a la pestaña Fuentes de Data Clean Room.
  2. Haz clic en el botón + Nueva fuente.
    Se abre la página Nueva fuente.
  3. Introduce el nombre de la fuente en la esquina superior izquierda.
    • Este puede ser cualquier nombre único que te ayude a identificar la fuente en la plataforma DCR. No es necesario que coincida con el nombre del archivo.
    • ¡Importante! Asegúrate de que el nombre de la fuente sea diferente en todas las demás fuentes de tu cuenta o no podrás guardar la fuente.
    • Requisitos del nombre de la fuente:
      • Longitud: 2-80 caracteres
      • Caracteres válidos:
        • letras (A-Z, a-z)
        • números (0-9), no pueden ser el primer carácter de un nombre; 
      • Caracteres inválidos:
        • espacios
        • todos los demás símbolos o caracteres especiales

#2: Especificar la ubicación de la fuente

La ubicación de la fuente consiste en un bucket de almacenamiento en la nube (conocido como conector) y la ruta de archivo subyacente desde la cual DCR leerá el archivo fuente cada vez que se actualice. 

Una vez especificado el conector, AppsFlyer puede generar automáticamente las carpetas requeridas como parte del proceso de creación de la fuente.

  • Permitir que AppsFlyer genere las carpetas facilita el proceso. Sin embargo, puedes optar por crearlas manualmente en su lugar, de acuerdo con las instrucciones detalladas aquí.

Si AppsFlyer genera las carpetas, la única información adicional requerida es el nombre que deseas dar a la carpeta fuente. (Esta es la carpeta de nivel superior en la que se actualiza la fuente cada vez que desees utilizarla para ejecutar una nueva versión del reporte). También puedes indicar si deseas que la carpeta fuente se cree debajo de una carpeta principal, a menudo denominada input.

Para especificar la ubicación de la fuente:

  1. Selecciona el conector en el que se creará (o se ha creado) la carpeta fuente.
    • Si no hay conectores definidos en tu cuenta, se abrirá el cuadro de diálogo Nuevo conector, pidiéndote crear uno.
    • Si tienes conectores existentes pero deseas utilizar uno nuevo, haz clic en el enlace + Nuevo conector.
  2. Introduce el nombre de la carpeta fuente.
    • Por defecto, el nombre de la carpeta fuente mostrada:
      • Se basa en el nombre que le diste a la fuente. Puedes cambiar el nombre de la carpeta para adaptarlo a tus necesidades, siempre que cumpla los requisitos de nomenclatura de DCR.
      • Indica que se generará dentro de una carpeta principal denominada input. Esta carpeta sirve como carpeta principal para todas las fuentes que cargues en DCR.
        • La carpeta input no es obligatoria y puedes eliminarla o asignarle un nombre diferente, siempre y cuando cumpla con los requisitos de nomenclatura de DCR.
        • Aunque esta carpeta no es obligatoria, se considera una buena práctica disponer de una carpeta input (o una carpeta equivalente con un nombre diferente). Se recomienda aún más cuando se utiliza el mismo conector, tanto para cargar archivos de datos (entrada) como para recibir reportes (salida).

 ¡Importante!

Si creaste manualmente la ruta de la carpeta, asegúrate de que el conector y la ruta que introduzcas en la sección Ubicación de la fuente coincidan con la ruta que creaste manualmente.

#3: Definir la estructura de la fuente

Para todas las fuentes que subas a DCR para su procesamiento, AppsFlyer necesita saber cómo se debe usar cada campo de datos con el fin de crear reportes. La definición de la estructura de la fuente consiste en cargar un archivo fuente como prototipo y categorizar cada campo (columna) como uno de los siguientes tipos:

  • Identificador: Campo que identifica a un usuario único de la aplicación (ejemplos: CUID, ID de AppsFlyer, etc.)
    • El objetivo principal de los identificadores en el contexto de DCR es unir las fuentes de datos para poder cotejar los datos de nivel de usuario correspondientes.
  • Dimensión: Un atributo por el que se categoriza a los usuarios de la aplicación (algunos ejemplos pueden ser la geolocalización, la fecha de instalación, la campaña, etc.)
  • Métrica: Datos numéricos que has recopilado con respecto a un usuario de la aplicación (algunos ejemplos podrían ser los ingresos, el número de aperturas de la aplicación, el valor de vida útil (LTV), etc.)
    • Un campo de datos identificado como métrica puede contener solo valores numéricos.

Cargar un archivo fuente de prototipo

Para definir la estructura de la fuente: 

  • Puedes cargar una versión prototipo de la fuente desde un archivo local.
    • Si seleccionas esta opción, AppsFlyer siempre crea la ruta de la carpeta fuente automáticamente.

                                                                - o -

  • Puedes cargar una versión de prototipo del archivo fuente directamente desde su conector.
    • Si seleccionas esta opción, tendrás que hacer una elección adicional:
      • Permitir que AppsFlyer cree automáticamente la estructura de carpetas fuente; o
      • Crear la estructura de carpetas de fuente manualmente

Para cargar el archivo fuente de prototipo, sigue las instrucciones de la pestaña correspondiente a continuación:

Archivo local Conector (creación automática) Conector (creación manual)
  1. En la sección Estructura de la fuente, haz clic en el botón DCR_load_fields_from_file.png.
  2. En la ventana que se abre, selecciona Cargar un archivo local.
  3. Especifica el archivo CSV o GZIP que deseas cargar y, a continuación, haz clic en Aceptar.

Clasificar los campos

Después de cargar el archivo, AppsFlyer analiza el archivo y se muestra una lista de todos los campos de datos (columnas) en la lista Campos disponibles.

Para clasificar los campos:

  1. Selecciona uno o varios campos en la lista Campos disponibles de la izquierda y utiliza los botones del centro de la pantalla para clasificarlos como identificadores, dimensiones o métricas.
    • Una vez categorizado un campo, se muestra en la lista de categorías relevantes en el lado derecho de la pantalla.
    • Puedes utilizar la barra de búsqueda para buscar campos en las listas.
    • Para eliminar un campo de una categoría a la que ha sido asignado, selecciónalo en la lista de categorías correspondiente y utiliza el botón Eliminar para devolverlo a la lista Campos disponibles.
  2. Repite este proceso hasta que hayas categorizado cada campo que desees incluir en los reportes de DCR.
    • No es necesario categorizar cada campo en la lista Campos disponibles. Sin embargo, un campo debe ser categorizado para poder utilizarlo posteriormente en un reporte.
  3. Si editas el archivo fuente antes de guardar la fuente y deseas utilizar campos del archivo editado, haz clic en el enlace Volver a cargar campos en la parte inferior de la lista Campos disponibles.
    • Ten en cuenta que al volver a cargar la fuente se sobrescribirán los nombres de los campos en la lista Campos disponibles. Los campos que hayas categorizado previamente permanecerán en las listas Identificadores, Dimensiones, o Métricas.
    • Si un campo previamente categorizado no se encuentra en el archivo de fuente recargado, seguirá apareciendo en la lista de categorías correspondiente, pero se marcará con un icono de error.

 Nota

Si decides utilizar campos adicionales de esta fuente después de guardarla, puedes hacerlo editando la estructura de la fuente.

#4: Guardar la fuente

Para guardar la fuente:
  1. [Opcional] Haz clic en DCR_test_source.png para comprobar si hay errores en el formato o la validez de los campos de la fuente.
  2. Haz clic en Guardar para guardar la fuente.

    Se crea la fuente y aparece un mensaje de confirmación.

    • Si has cargado la fuente desde un archivo local, al guardar la fuente se activa la creación automática de la estructura de carpetas, y el mensaje de confirmación que aparece incluye un enlace a la carpeta de la fuente.

    La nueva fuente se muestra en la lista de todas las fuentes existentes en la pestaña Fuentes de Data Clean Room.

Carga de archivos fuente para activar el procesamiento de reportes

Cada vez que deseas que AppsFlyer procese un archivo de fuente de datos y ejecute un reporte basado en él, subes una nueva versión del archivo a la carpeta fuente, dentro de una serie de subcarpetas anidadas que indican la fecha y el número de versión (más una subcarpeta adicional para que AppsFlyer sepa dónde están los datos).

AppsFlyer busca continuamente nuevas versiones de archivos fuente para la fecha actual y 3 días antes. Se activa una nueva versión de un reporte cada vez que se encuentra una nueva versión de los archivos fuente (incluidos los archivos _SUCCESS, como se detalla a continuación).

Subcarpetas anidadas para cada fecha y versión

La estructura de las subcarpetas anidadas es la siguiente:

  • Dentro de la carpeta fuente --> 1 subcarpeta para cada fecha ("carpeta de fecha")
    • Formato: dt=yyyy-mm-dd/
    • Ejemplo: dt=2022-12-15/
  • Dentro de cada carpeta de fecha --> 1 subcarpeta para cada versión en esa fecha ("carpeta de versión")
    • Formato: v=n/
    • Ejemplo:v=1/
    • Nota: La carpeta de versión es necesaria aunque solo se cargue el archivo una vez al día.
  • Dentro de cada carpeta de versión --> 1 subcarpeta para indicar la ubicación de los datos ("carpeta de datos")
    • Formato: data/
    • La carpeta de datos es la ubicación a la que se carga el archivo fuente.

En la mayoría de los casos, usarías llamadas a la API u otros medios programáticos disponibles para crear las carpetas de fecha/versión/datos automáticamente cada vez que se cargue el archivo fuente de datos. Para obtener más información, consulta la referencia de la API para tu servicio en la nube: AWS, GCS.

Archivos _SUCCESS

Una vez completada la carga de un archivo de fuente de datos en la carpeta de datos, se debe cargar un archivo vacío denominado _SUCCESS en la carpeta de versiones. Esto alerta a AppsFlyer de que hay un nuevo archivo disponible para procesar. En la mayoría de los casos, usarías un script de API para generar y cargar automáticamente este archivo.

¡Importante! El archivo _SUCCESS se carga en la carpeta de versión, fuera de la carpeta de datos.

El nombre del archivo _SUCCESS:

  • Debe estar todo en MAYÚSCULAS
  • Debe ir precedido de un guión bajo (_)
  • No debe tener una extensión de archivo

Para archivos GZIP de varias partes:

  • Solo debe cargarse un archivo _SUCCESS para todas las partes del archivo.
  • El archivo _SUCCESS debe cargarse solo después de que se haya completado la carga de todas las partes del archivo.

Ejemplo (después de cargar los archivos)

Después de cargar los archivos fuente en 2 días (y de crear programáticamente carpetas de fecha/versión/datos y archivos _SUCCESS), tu estructura de bucket/carpetas podría tener este aspecto:

dcr_file_structure_after_uploads.png

Trabajar con fuentes existentes

Hay varias formas de trabajar con las fuentes existentes. Estos procesos se inician desde la pestaña Sources de Data Clean Room:

Editar el nombre de la fuente

Para editar el nombre de la fuente:

  1. Ve a la pestaña Fuentes de Data Clean Room.
  2. En la lista de fuentes, pasa el cursor por encima de la fila de la fuente que desees editar.
  3. Haz clic en el botón de edición edit_button.png que aparece a la derecha de la fila.
  4. En la página Editar fuente, edita el nombre de la fuente.
  5. Haz clic en el botón Guardar para guardar la fuente con el nuevo nombre o en Cancelar para deshacer los cambios.

Edición de la ubicación de la fuente

Para editar la ubicación de la fuente:

  1. Ve a la pestaña Fuentes de Data Clean Room.
  2. En la lista de fuentes, pasa el cursor por encima de la fila de la fuente que desees editar.
  3. Haz clic en el botón de edición edit_button.png que aparece a la derecha de la fila.
  4. En la página Editar fuente, desplázate hacia abajo hasta la sección Ubicación de la fuente.
  5. Haz clic en el botón de edición edit_button.png junto a la ubicación de la fuente actual.
  6. Realiza los cambios necesarios en el cuadro de diálogo Ubicación de la fuente.
  7. Haz clic en Aplicar para implementar los cambios.
  8. Haz clic en el botón Guardar para guardar la fuente con el nuevo formato de ubicación/archivo o en Cancelar para deshacer los cambios.

Cuando se edita una ubicación de fuente, AppsFlyer crea una carpeta con el nuevo nombre en el conector.

  • AppsFlyer busca versiones posteriores del archivo fuente y archivos _SUCCESS adjuntos en la nueva carpeta.
  • Todas las versiones del archivo fuente que se cargaron antes del cambio de nombre permanecerán en la carpeta fuente anterior.

Editar la estructura de la fuente

Para editar la estructura de la fuente:

  1. Ve a la pestaña Fuentes de Data Clean Room.
  2. En la lista de fuentes, pasa el cursor por encima de la fila de la fuente que desees editar.
  3. Haz clic en el botón de edición edit_button.png que aparece a la derecha de la fila.
  4. En la página Editar fuente, los campos que antes estaban categorizados como identificadores, dimensiones o métricas se mostrarán en las listas de categorías correspondientes en la parte derecha de la pantalla.
  5. Puedes mover un campo categorizado anteriormente a una categoría diferente sin volver a cargar los campos del archivo de fuente. Para ello:
    1. En primer lugar, selecciónalo en la lista de categorías correspondiente y utiliza el botón Eliminar para devolverlo a la lista Campos disponibles.
    2. A continuación, selecciónalo en la lista Campos disponibles y utiliza los botones del centro de la pantalla para clasificarlo como identificador, dimensión o métrica.
  6. Para trabajar con campos en el archivo de fuente que aún no se han categorizado, se deben volver a cargar desde la ubicación de la fuente o desde un archivo local. Realiza esta selección haciendo clic en el enlace Volver a cargar campos en la parte inferior de la lista Campos disponibles.
  7. AppsFlyer analiza el archivo y se muestra una lista de todos los campos de datos no categorizados anteriormente (columnas) en la lista Campos disponibles.
    • Los campos que se categorizaron previamente como identificadores, dimensiones o métricas seguirán apareciendo en las listas de categorías correspondientes en la parte derecha de la pantalla.
    • Si un campo previamente categorizado no se encuentra en el archivo de fuente recargado, seguirá apareciendo en la lista de categorías correspondiente, pero se marcará con un icono de error.
  8. Selecciona uno o varios de los campos en la lista Campos disponibles de la izquierda y utiliza los botones del centro de la pantalla para clasificarlos como identificadores, dimensiones o métricas.
  9. Una vez que hayas realizado todos los cambios necesarios, haz clic en el botón Guardar para guardar la fuente con la estructura actualizada o en Cancelar para deshacer los cambios.

 ¡Importante!

No olvides realizar los cambios correspondientes que reflejen la nueva estructura de la fuente en cualquier reporte para el que se utilice esta fuente:

  • Los campos que hayan sido eliminados, descategorizados o cambiados de tus categorías anteriores serán eliminados automáticamente de cualquier reporte en el que se utilicen.
  • Los campos recién agregados o categorizados no se incluirán automáticamente en los reportes existentes hasta que edites las definiciones de los reportes para incluirlos.

Eliminar una fuente

  1. Ve a la pestaña Fuentes de Data Clean Room.
  2. En la lista de fuentes, pasa el cursor por encima de la fila de la fuente que desees eliminar.
  3. Haz clic en el botón de eliminación delete_button.png que aparece a la derecha de la fila.
  4. En el cuadro de diálogo, confirma que deseas eliminar la fuente.
    • No puedes eliminar una fuente que esté siendo utilizada por un reporte. Si este es el caso, un mensaje enumerará los reportes en los que se está utilizando la fuente. Para eliminar la fuente, puedes:
      • Eliminar los reportes en los que se está utilizando; o
      • Eliminar los campos de fuente de las definiciones de los reportes en los que se utilizan.